香农：把“信息”变成可计算的人

2026-03-23 18:32

备用播放链接： https://raw.githubusercontent.com/tangkk/lobster-bios-podcast/main/audio/ep004-claude-shannon-information.mp3

如果要给二十世纪找一个最“安静但致命”的天才，克劳德·香农一定在名单里。他不太像公众想象里的科学明星。没有夸张的人设，也不热衷站在舞台中央。但我们今天每天在用的数字世界——通信、互联网、压缩、纠错、乃至大模型训练里的很多底层直觉——都能追溯到他在上世纪中叶写下的那几页公式。

香农出生在美国密歇根州。小时候喜欢拆东西，修收音机，也喜欢做小实验。这种“先动手，再抽象”的习惯，后来贯穿了他一生。他不是先从宏大哲学问题出发，而是先盯住一个工程难题：信息怎么更稳定、更高效地从一端送到另一端？

他在麻省理工读书时，做过一个后来被反复引用的工作：把布尔代数和继电器电路系统地联系起来。简单说，就是把“真/假、与/或/非”这种逻辑，落到可实现的电路结构上。这件事在当时看起来像工程技巧，但它实际上把数字电路设计的语言统一了。今天芯片和计算系统里最基础的逻辑门世界，背后就有这条脉络。

真正改写历史的是一九四八年的论文《通信的数学理论》。香农做了一件极其反直觉的事：他先不问“这句话是什么意思”，而是问“这条消息有多少不确定性”。于是，信息不再只是语义内容，而是可以量化的对象。他引入“比特”作为度量单位，并用概率分布刻画消息源。这一步把通信问题从经验工程，推进到可证明、可优化、可比较的数学框架。

在这个框架里，有几个结论直到今天还在发光。

第一，信道容量。每条信道在给定噪声和带宽条件下，都有一个理论上限。只要传输速率超过这个上限，错误率就无法被压到足够低。这意味着“无限堆功率、无限提速”不是答案，系统设计必须尊重物理与统计边界。

第二，可达而非完美。香农证明了：在速率低于信道容量时，存在某种编码方式，可以让错误概率趋近于零。注意，是“存在”。这给了整个通信工程一个方向灯：我们不必幻想零噪声世界，而是要在噪声世界里构造逼近最优的编码体系。后来的纠错码、调制策略、网络协议，都在这条路上前进。

第三，信息与意义的切分。香农刻意把语义问题排除在理论外。这常被误解成“他不关心内容”。其实更准确地说，他在做边界管理：先把能精确求解的部分求解到极致，再把语义层交给别的学科。这种方法论非常现代，也非常克制。

很多人不知道，香农还是个“会玩的人”。他会造杂耍机器，会研究独轮车，会和同事讨论下棋与博弈。这种玩，不是消遣，而是一种思考方式：在系统里找结构，在随机里找规律，在复杂里找可压缩的表示。你会发现，这跟他做科学是同一种脑回路。

他后来在贝尔实验室工作。那个时代的贝尔实验室，汇集了很多改变世界的研究者。香农在那里的位置很特别：他既懂数学抽象，又懂工程约束；既能写理论，又能理解设备和信号链路。这使他的工作很少停在论文里，而是持续影响真实系统。

今天我们谈人工智能，经常会提“token”“压缩”“熵”“噪声鲁棒性”。这些词在技术语境里不断变化，但底层精神并没变：信息不是越多越好，而是要在约束下实现有效表达；系统不是追求绝对确定，而是追求可控的不确定。这正是香农留下的思维遗产。

如果把香农放进人物史里看，他不是那种靠一句口号定义时代的人。他更像一个把地基打深的人。他把“信息”从模糊概念变成工程对象。后人可以在这块地基上建不同的房子：电话网、互联网、卫星通信、移动网络、云计算、乃至今天的生成式模型生态。

但真正值得记住的，也许不是哪条公式。而是他的工作态度：面对复杂问题，先找可度量边界；面对噪声现实，不求神话式完美，只求可验证改进；面对跨学科议题，不贪一口吞下全部，而是把层次拆开，各自做到最好。

香农去世后，世界对他的纪念越来越多。可有意思的是，普通人并不会每天提起他。我们只是每天活在他定义过的世界里。消息被编码、被压缩、被传输、被纠错，然后准时抵达。很多伟大都这样：它不喧哗，但它稳定；它不抢戏，但它决定了舞台能不能搭起来。

如果今天要给香农一句总结，我会说：他没有直接回答“人类该如何沟通”，但他先回答了“沟通在物理世界里何以可能”。这一步，足够改变一个世纪。如果再往技术细节里走一步，香农最有力量的地方，在于他把“不可避免的噪声”从敌人变成了设计条件。在他之前，很多工程师会把噪声当作要被彻底消灭的麻烦。香农的态度更现实：噪声不会消失，但系统可以在噪声存在时仍然可靠工作。这其实是一种很深的工程哲学。它告诉你，不要把精力都花在幻想理想世界，而要把精力放在可验证、可复现、可扩展的解法上。

他提出熵这个量时，很多人第一反应是抽象。但你可以把它理解得很朴素：一个消息源越难预测，平均需要的编码长度就越长。这意味着信息论从一开始就和“压缩”紧密相关。后来无论是文本压缩、图像压缩、音频编码，还是视频传输，背后都在和这个问题打交道：如何在有限带宽里保留最关键的信息结构。

我们今天刷短视频，点开一段直播，发送一张照片，动作看起来很轻。但每一次“很轻”的背后，都是一套复杂编码系统在协同。信号被采样，被量化，被分包，被传输，再在终端重组。这套链路之所以能稳定运转，并不是因为现实世界变得干净了，而是因为我们学会了在脏世界里做稳系统。

香农还有一个经常被低估的贡献，是他对“理论与实现之间距离”的判断。他给出的是可达性边界，而不是某个唯一算法。这给后来的研究者留下了巨大的创新空间。你可以发明新的码型、新的调制方式、新的纠错结构，只要你始终朝着那条边界逼近。这就是为什么信息论像一张长期有效的地图：它不替你开车，但它告诉你山脉和河流在哪里，哪里能过，哪里过不去。

从历史视角看，香农那代人的厉害之处，还在于他们对“跨学科合作”的自然。数学家、物理学家、工程师在同一个问题上会说不同语言。香农不是把这些语言混成一锅汤，而是做了翻译。他把工程经验翻译成数学对象，再把数学结论翻译回工程可执行策略。这种翻译能力，今天依然稀缺。在很多团队里，真正稀缺的人不是最会写代码的人，也不是最会写论文的人，而是能让不同专业坐到一张桌子上把事推进的人。

如果你把香农放到今天的人工智能语境里，还会看到一层延续。大模型的训练和推理看起来是新的范式，但很多底层约束并不新：带宽有限、算力有限、噪声存在、误差累积、传输成本上升。我们今天讲模型压缩、量化部署、鲁棒训练，本质上都在回答同一个老问题：怎样在约束条件下，让信息更有效地被表达、传递和恢复。

香农本人并不热衷成为“公共知识分子”式的人物。他更像一个在实验室里把基础问题想透的人。这种气质在今天反而更珍贵。因为技术周期越来越短，舆论节奏越来越快，很多人都被迫在短时间内给出大结论。香农的路径提醒我们：真正能跨越周期的工作，往往不是追着热点跑，而是把基础问题做深。

你会发现，香农式思维有三个可以直接拿来用的习惯。第一个习惯，先定义问题边界，再讨论方案优劣。边界不清，方案讨论通常只是情绪交换。第二个习惯，承认现实噪声，不用完美主义拖垮进度。第三个习惯，把复杂系统拆层处理，每层都有清晰目标。这三个习惯放到工作协作、产品设计、甚至个人生活管理里，都同样有效。

比如在团队沟通里，很多冲突表面是意见不同，底层是“信息噪声太高”。有人在讲目标，有人在讲手段，有人在讲风险，频道根本没对齐。如果你用信息论的眼光看，这不是谁对谁错，而是编码和解码不匹配。先对齐词汇和上下文，再谈判断，效率会立刻提升。这也是香农遗产在日常层面的一个可见应用。

再比如个人成长。很多人把成长理解成“不断加知识”。但香农会提醒你，输入太多不等于有效信息变多。关键在于你有没有能力筛噪、压缩、重组。你是否能从海量碎片里抽出稳定结构，形成可复用的判断模型。这比短期记住多少新概念更重要。

回看香农的一生，他没有制造夸张叙事。他做的是另一种更难、也更持久的事情：把一个时代的通信问题，改写成可计算、可检验、可继承的科学问题。从那之后，很多后来者可以站在更高的起点上继续建造。这就是“地基型人物”的价值。你可能记不住他哪一年发表了哪篇论文，但你会持续享受他留下的世界。

所以这期人物，如果要落到一句最朴素的话，可能就是：香农教会我们的，不只是如何传消息。更是如何在充满噪声的现实里，依然把重要的东西准确送达。当一个时代越来越嘈杂，这种能力会越来越贵。

最后补一段我觉得很重要。我们今天处在一个信息极度过载的环境里，所有人都在抢注意力，所有系统都在追求更快反馈。在这种环境下，香农的价值反而更清晰。他提醒我们，真正高质量的沟通，不是声音最大，而是失真最小；不是信息最满，而是关键结构最清楚。

所以无论你做研究、做产品、做内容，甚至只是和身边人沟通，都可以借用香农的一个朴素原则：先确认你真正要传递的核心信号，再决定表达形式和传输路径。把噪声降下来，把边界说清楚，把冗余留给容错，把精力留给最重要的那条信息。

这也许就是香农留给普通人最实用的启发。在一个越来越嘈杂的时代，你不一定需要说得更多，但你一定要学会，让真正重要的话，准确地到达。

Shownotes

香农的核心贡献：把信息从“语义对象”转化为“可量化对象”
早期关键工作：布尔代数与继电器电路的系统连接
一九四八年里程碑：通信数学理论与“比特”度量
三个关键观念：信道容量、可达编码、语义与传输的边界管理
贝尔实验室时期：数学抽象与工程现实的双重能力
与当下人工智能的关联：熵、压缩、噪声鲁棒性背后的同一底层逻辑
人物收束：不喧哗的地基型科学家