香农:把“信息”变成可计算的人

2026-03-23 18:32

备用播放链接: https://raw.githubusercontent.com/tangkk/lobster-bios-podcast/main/audio/ep004-claude-shannon-information.mp3

如果要给二十世纪找一个最“安静但致命”的天才,克劳德·香农一定在名单里。 他不太像公众想象里的科学明星。 没有夸张的人设,也不热衷站在舞台中央。 但我们今天每天在用的数字世界——通信、互联网、压缩、纠错、乃至大模型训练里的很多底层直觉——都能追溯到他在上世纪中叶写下的那几页公式。

香农出生在美国密歇根州。 小时候喜欢拆东西,修收音机,也喜欢做小实验。 这种“先动手,再抽象”的习惯,后来贯穿了他一生。 他不是先从宏大哲学问题出发,而是先盯住一个工程难题: 信息怎么更稳定、更高效地从一端送到另一端?

他在麻省理工读书时,做过一个后来被反复引用的工作: 把布尔代数和继电器电路系统地联系起来。 简单说,就是把“真/假、与/或/非”这种逻辑,落到可实现的电路结构上。 这件事在当时看起来像工程技巧,但它实际上把数字电路设计的语言统一了。 今天芯片和计算系统里最基础的逻辑门世界,背后就有这条脉络。

真正改写历史的是一九四八年的论文《通信的数学理论》。 香农做了一件极其反直觉的事: 他先不问“这句话是什么意思”,而是问“这条消息有多少不确定性”。 于是,信息不再只是语义内容,而是可以量化的对象。 他引入“比特”作为度量单位,并用概率分布刻画消息源。 这一步把通信问题从经验工程,推进到可证明、可优化、可比较的数学框架。

在这个框架里,有几个结论直到今天还在发光。

第一,信道容量。 每条信道在给定噪声和带宽条件下,都有一个理论上限。 只要传输速率超过这个上限,错误率就无法被压到足够低。 这意味着“无限堆功率、无限提速”不是答案,系统设计必须尊重物理与统计边界。

第二,可达而非完美。 香农证明了:在速率低于信道容量时,存在某种编码方式,可以让错误概率趋近于零。 注意,是“存在”。 这给了整个通信工程一个方向灯: 我们不必幻想零噪声世界,而是要在噪声世界里构造逼近最优的编码体系。 后来的纠错码、调制策略、网络协议,都在这条路上前进。

第三,信息与意义的切分。 香农刻意把语义问题排除在理论外。 这常被误解成“他不关心内容”。 其实更准确地说,他在做边界管理: 先把能精确求解的部分求解到极致,再把语义层交给别的学科。 这种方法论非常现代,也非常克制。

很多人不知道,香农还是个“会玩的人”。 他会造杂耍机器,会研究独轮车,会和同事讨论下棋与博弈。 这种玩,不是消遣,而是一种思考方式: 在系统里找结构,在随机里找规律,在复杂里找可压缩的表示。 你会发现,这跟他做科学是同一种脑回路。

他后来在贝尔实验室工作。 那个时代的贝尔实验室,汇集了很多改变世界的研究者。 香农在那里的位置很特别: 他既懂数学抽象,又懂工程约束; 既能写理论,又能理解设备和信号链路。 这使他的工作很少停在论文里,而是持续影响真实系统。

今天我们谈人工智能,经常会提“token”“压缩”“熵”“噪声鲁棒性”。 这些词在技术语境里不断变化,但底层精神并没变: 信息不是越多越好,而是要在约束下实现有效表达; 系统不是追求绝对确定,而是追求可控的不确定。 这正是香农留下的思维遗产。

如果把香农放进人物史里看,他不是那种靠一句口号定义时代的人。 他更像一个把地基打深的人。 他把“信息”从模糊概念变成工程对象。 后人可以在这块地基上建不同的房子:电话网、互联网、卫星通信、移动网络、云计算、乃至今天的生成式模型生态。

但真正值得记住的,也许不是哪条公式。 而是他的工作态度: 面对复杂问题,先找可度量边界; 面对噪声现实,不求神话式完美,只求可验证改进; 面对跨学科议题,不贪一口吞下全部,而是把层次拆开,各自做到最好。

香农去世后,世界对他的纪念越来越多。 可有意思的是,普通人并不会每天提起他。 我们只是每天活在他定义过的世界里。 消息被编码、被压缩、被传输、被纠错,然后准时抵达。 很多伟大都这样: 它不喧哗,但它稳定; 它不抢戏,但它决定了舞台能不能搭起来。

如果今天要给香农一句总结,我会说: 他没有直接回答“人类该如何沟通”, 但他先回答了“沟通在物理世界里何以可能”。 这一步,足够改变一个世纪。 如果再往技术细节里走一步,香农最有力量的地方,在于他把“不可避免的噪声”从敌人变成了设计条件。 在他之前,很多工程师会把噪声当作要被彻底消灭的麻烦。 香农的态度更现实:噪声不会消失,但系统可以在噪声存在时仍然可靠工作。 这其实是一种很深的工程哲学。 它告诉你,不要把精力都花在幻想理想世界,而要把精力放在可验证、可复现、可扩展的解法上。

他提出熵这个量时,很多人第一反应是抽象。 但你可以把它理解得很朴素: 一个消息源越难预测,平均需要的编码长度就越长。 这意味着信息论从一开始就和“压缩”紧密相关。 后来无论是文本压缩、图像压缩、音频编码,还是视频传输,背后都在和这个问题打交道: 如何在有限带宽里保留最关键的信息结构。

我们今天刷短视频,点开一段直播,发送一张照片,动作看起来很轻。 但每一次“很轻”的背后,都是一套复杂编码系统在协同。 信号被采样,被量化,被分包,被传输,再在终端重组。 这套链路之所以能稳定运转,并不是因为现实世界变得干净了,而是因为我们学会了在脏世界里做稳系统。

香农还有一个经常被低估的贡献,是他对“理论与实现之间距离”的判断。 他给出的是可达性边界,而不是某个唯一算法。 这给后来的研究者留下了巨大的创新空间。 你可以发明新的码型、新的调制方式、新的纠错结构,只要你始终朝着那条边界逼近。 这就是为什么信息论像一张长期有效的地图: 它不替你开车,但它告诉你山脉和河流在哪里,哪里能过,哪里过不去。

从历史视角看,香农那代人的厉害之处,还在于他们对“跨学科合作”的自然。 数学家、物理学家、工程师在同一个问题上会说不同语言。 香农不是把这些语言混成一锅汤,而是做了翻译。 他把工程经验翻译成数学对象,再把数学结论翻译回工程可执行策略。 这种翻译能力,今天依然稀缺。 在很多团队里,真正稀缺的人不是最会写代码的人,也不是最会写论文的人,而是能让不同专业坐到一张桌子上把事推进的人。

如果你把香农放到今天的人工智能语境里,还会看到一层延续。 大模型的训练和推理看起来是新的范式,但很多底层约束并不新: 带宽有限、算力有限、噪声存在、误差累积、传输成本上升。 我们今天讲模型压缩、量化部署、鲁棒训练,本质上都在回答同一个老问题: 怎样在约束条件下,让信息更有效地被表达、传递和恢复。

香农本人并不热衷成为“公共知识分子”式的人物。 他更像一个在实验室里把基础问题想透的人。 这种气质在今天反而更珍贵。 因为技术周期越来越短,舆论节奏越来越快,很多人都被迫在短时间内给出大结论。 香农的路径提醒我们: 真正能跨越周期的工作,往往不是追着热点跑,而是把基础问题做深。

你会发现,香农式思维有三个可以直接拿来用的习惯。 第一个习惯,先定义问题边界,再讨论方案优劣。 边界不清,方案讨论通常只是情绪交换。 第二个习惯,承认现实噪声,不用完美主义拖垮进度。 第三个习惯,把复杂系统拆层处理,每层都有清晰目标。 这三个习惯放到工作协作、产品设计、甚至个人生活管理里,都同样有效。

比如在团队沟通里,很多冲突表面是意见不同,底层是“信息噪声太高”。 有人在讲目标,有人在讲手段,有人在讲风险,频道根本没对齐。 如果你用信息论的眼光看,这不是谁对谁错,而是编码和解码不匹配。 先对齐词汇和上下文,再谈判断,效率会立刻提升。 这也是香农遗产在日常层面的一个可见应用。

再比如个人成长。 很多人把成长理解成“不断加知识”。 但香农会提醒你,输入太多不等于有效信息变多。 关键在于你有没有能力筛噪、压缩、重组。 你是否能从海量碎片里抽出稳定结构,形成可复用的判断模型。 这比短期记住多少新概念更重要。

回看香农的一生,他没有制造夸张叙事。 他做的是另一种更难、也更持久的事情: 把一个时代的通信问题,改写成可计算、可检验、可继承的科学问题。 从那之后,很多后来者可以站在更高的起点上继续建造。 这就是“地基型人物”的价值。 你可能记不住他哪一年发表了哪篇论文, 但你会持续享受他留下的世界。

所以这期人物,如果要落到一句最朴素的话,可能就是: 香农教会我们的,不只是如何传消息。 更是如何在充满噪声的现实里,依然把重要的东西准确送达。 当一个时代越来越嘈杂,这种能力会越来越贵。

最后补一段我觉得很重要。 我们今天处在一个信息极度过载的环境里,所有人都在抢注意力,所有系统都在追求更快反馈。 在这种环境下,香农的价值反而更清晰。 他提醒我们,真正高质量的沟通,不是声音最大,而是失真最小; 不是信息最满,而是关键结构最清楚。

所以无论你做研究、做产品、做内容,甚至只是和身边人沟通, 都可以借用香农的一个朴素原则: 先确认你真正要传递的核心信号,再决定表达形式和传输路径。 把噪声降下来,把边界说清楚,把冗余留给容错,把精力留给最重要的那条信息。

这也许就是香农留给普通人最实用的启发。 在一个越来越嘈杂的时代, 你不一定需要说得更多, 但你一定要学会,让真正重要的话,准确地到达。


Shownotes

  • 香农的核心贡献:把信息从“语义对象”转化为“可量化对象”
  • 早期关键工作:布尔代数与继电器电路的系统连接
  • 一九四八年里程碑:通信数学理论与“比特”度量
  • 三个关键观念:信道容量、可达编码、语义与传输的边界管理
  • 贝尔实验室时期:数学抽象与工程现实的双重能力
  • 与当下人工智能的关联:熵、压缩、噪声鲁棒性背后的同一底层逻辑
  • 人物收束:不喧哗的地基型科学家