Information and Entropy (7) Processes
Abstract. 在上一节的基础上继续讨论一些通信过程的性质。
我们讨论的处理过程具有如下特点:
- Discrete. 输入是一组互斥事件集,每时每刻只会有一个发生,输出是另一个互斥事件集。
- Finite. 上述两个事件集均为有限集。
- Memoryless. 当前输出只取决于当前输入,和之前的输入没有关系。
- Nondeterministic. 对于相同的输入可能输出不同的结果(“噪声”)。
- Lossy. 从输出中无法反推输入。
大概是总结了之前的 Communication System 的特点。
下面几节感觉很平凡,均为常识内容,我们直接跳到第三节。
Information, Loss and Noise
和上一节相同,我们定义输入的信息量为
输出的信息量为
然后上一节还记述了对输入的不确定度的期望
这个值称为 loss,相应的,对输出的不确定度
称为 noise。
假设
称为这个过程的 capacity。
上一节我们已经推导过了
因此有
或者简明地用下面的这个图来表示这个 discrete memoryless process 中的信息流动
原论文中的记号 在 Shannon 的原论文中记号和这里不太一样,简单记录一下:
- 输入的概率分布称为
,输出的概率分布称为 。 。
Example. 回忆我们在第 4 节中提到的 Hamming Code,在推导纠错码长度下界的过程中我们利用码距得到了
接下来我们从信息熵的角度推导这个下界。
要求总是能够检查错误,也就是
这里的输入信息量只能是原来的
于是有
即上述不等式取对数的形式。
可能这个项目就到这里为止了。后面全是统计力学,量子力学之类的东西,不想看了。