Article

信息论-CH1-离散信源

信息论-CH1-离散信源，待补充摘要。

April 29, 2026 修考 8 min read

信息论笔记：离散信源与马尔可夫模型

信源的传输过程本质上是从符号集中抽取符号并发送。

自信息 (Self-information)：表示某一具体符号的不确定性。
- 原理：符号发生的概率越低，其携带的信息量越大（不确定性越高）。
- 公式： $I(x_i) = -\log_2 P(x_i)$
- 单位：bit (比特)
信源熵 (Source Entropy)：信源的平均不确定性，即自信息的统计平均值。
- 公式： $H(X) = E[I(x_i)] = \sum_{i} P(x_i) I(x_i) = -\sum_{i} P(x_i) \log_2 P(x_i)$
- 性质：
  - 极大性：当信源中各符号等概率分布时，熵达到最大值 $H_{max} = \log_2 N$ （ $N$ 为符号个数）。
  - 示例：对于二元信源 $X = \{0, 1\}$ ，若 $P = [2/3, 1/3]$ ，则 $H(2/3, 1/3) < H(1/2, 1/2)$ 。任何使概率趋于均等化的变动都会增加信源熵。

定义：每次发送消息都互相独立，不受之前符号的影响。
- 概率表示： $P(X_1, X_2, \dots, X_N) = \prod_{i=1}^N P(X_i)$
N次扩展信源 ( $X^N$ $X^{N}$ )：
- 符号数：若原信源有 $n$ 个符号，则扩展信源有 $n^N$ 个复合符号。
- 扩展信源熵： $H(X^N) = N \cdot H(X)$
- 单位：bit / $N$ 个信源符号

在有记忆信源中，符号之间存在关联。

条件概率： $P(x|y) = \frac{P(x,y)}{P(y)}$ （已知 $y$ 情况下 $x$ 发生的概率）。
条件熵 (Conditional Entropy)： $H(X|Y)$ 表示在已知 $Y$ 的情况下， $X$ 的不确定性。
联合熵 (Joint Entropy)： $H(X, Y) = H(Y) + H(X|Y) = H(X) + H(Y|X)$
- 注：联合概率分布与时间起点无关（平稳性）。

马尔可夫信源是一种特殊的有记忆信源，当前状态只与前一个（或前 $m$ 个）状态有关。

Hidden Markov Models ...