信息论笔记:信道、平均互信息与信道容量
一、 信道的基本概念
1.1 系统模型
在通信系统中,信道是传输信息的媒介。其逻辑位置如下: 信源 -> 信源编码 -> 信道编码 -> [信道] -> 信道译码 -> ...

- 信道的输入:是符号(Symbols),而非原始消息。
- 数学模型:
- 输入变量 X={x1,x2,…,xr}
- 输出变量 Y={y1,y2,…,ys}
- 信道特性由转移概率 P(yj∣xi) 唯一描述。
互信息表示通过观察 Y 的某个输出,对消除关于 X 的不确定性的贡献量。

-
单符号互信息:
I(xi;yj)=I(xi)−I(xi∣yj)=log2P(xi)1−log2P(xi∣yj)1=log2P(xi)P(xi∣yj)
其本质是:先验不确定性 - 后验不确定性(即“获知原理”)。
-
平均互信息 I(X;Y): 对所有可能的输入和输出取统计平均:
I(X;Y)=H(X)−H(X∣Y)
其中:
- H(X):信源熵(先验不确定性)。
- H(X∣Y):信道疑义度(Equivocation),观测到 Y 后对 X 仍然存在的不确定性。
1.3 维恩图 (Venn Diagram) 关系
平均互信息可以看作是两个随机变量集合的交集部分:

- I(X;Y)=H(X)−H(X∣Y)
- I(X;Y)=H(Y)−H(Y∣X)
- I(X;Y)=H(X)+H(Y)−H(X,Y)
条件互信息示例: 对于三个变量 X1,X2,X3:
I(X1;X2∣X3)=I(X1;X2,X3)−I(X1;X3)
二、 信道矩阵与转移概率
2.1 信道转移矩阵 P(Y∣X)
信道由矩阵 P 表示,每一行对应一个输入 xi,每一列对应一个输出 yj:
P=P(y1∣x1)P(y1∣x2)⋮P(y2∣x1)P(y2∣x2)⋮……⋱
2.2 输入与输出的关系
已知输入分布 PX=[P(x1),P(x2),…,P(xr)],输出分布 PY 为:
PY=PX⋅P
(注:这与马尔可夫链的状态转移矩阵乘法非常相似)
2.3 二元对称信道 (BSC)
最典型的信道模型,输入输出均为 {0,1},错误传输概率为 p,正确传输概率为 pˉ=1−p:
PBSC=[pˉpppˉ]
.svg.DNRatNCa_Z1fufF8.webp)
三、 特殊信道类型
| 信道类型 | 特点 | 熵关系 | 矩阵特征 |
|---|
| 无噪无损 | 输入输出一一对应 | H(X∥Y)=0,H(Y∥X) | 单位矩阵或其置换矩阵 |
| 有损无噪 | 一个输入对应多个输出 | H(Y∥X)>0,H(X∥Y) | 每列只有一个非零元素 |
| 有噪无损 | 多个输入对应一个输出 | H(X∥Y)>0,H(Y∥X) | 每行只有一个非零元素 |
- 噪声熵 H(Y∣X):信道噪声引起的不确定性。
- H(Y∣X)=∑i=1rP(xi)H(Y∣xi)
- 疑义度 H(X∣Y):由于信道损伤导致从输出端无法完全推回输入端的不确定性。
- H(X∣Y)=∑j=1sP(yj)H(X∣yj) 错误公式,参考例题1就知道为什么了

四、 信道容量 (Channel Capacity)
4.1 定义
信道容量 C 是在所有可能的输入分布 P(X) 中,平均互信息的最大值:
C=maxP(X)I(X;Y)(单位: bit/symbol)
4.2 对称信道及其容量计算
- 行对称:矩阵每一行都是第一行的置换。
- 列对称:矩阵每一列都是第一列的置换。
- 对称信道(强对称):既是行对称又是列对称。
计算公式: 对于 r 进制输入、s 进制输出的对称信道,若矩阵任一行为 (p1,p2,…,ps):
C=log2s−H(p1,p2,…,ps)
注:对于 BSC,C=log22−H(p,1−p)=1−H(p)。
4.3 信道冗余度
C=1−效率=1−CR
其中 R 是实际传输速率(实际互信息)。
五、 典型例题整理
例1:计算疑义度与互信息

已知:PX=[0.6,0.4],信道矩阵 P=[5/63/41/61/4]。
- 计算噪声熵 H(Y∣X): H(Y∣X)=0.6⋅H(5/6,1/6)+0.4⋅H(3/4,1/4)≈0.71 bit/symbol
- 计算输出分布 PY: PY=[0.6,0.4]⋅[5/63/41/61/4]=[0.8,0.2]
- 计算互信息 I(X;Y): I(X;Y)=H(Y)−H(Y∣X)=H(0.8,0.2)−0.71≈0.7219−0.71=0.0119 bit/symbol

例2:BSC 传输能力判断

已知:BSC 错误率 p=0.02,符号速率 1500 symbol/s,消息长度 14000 bit,时限 10 s。
- 计算信道容量 C: C=1−H(0.02,0.98)≈1−0.1414=0.8586 bit/symbol
- 计算 10 秒内最大传输量: MaxBits=1500 symbol/s×0.8586 bit/symbol×10 s≈12879 bit
- 结论: 因 12879<14000,故在 10 秒内不能无失真地传完该消息序列。
