Posts

跨越计算的边界：为什么在AI时代，我们依然要仰望图灵？

ChatGPT刚出来的时候，全世界的目光都被一个词吸住了，图灵测试。人们兴奋地讨论，AI是不是终于「通过」了图灵测试？这个70多年前由一个英国数学家提出的思想实验，是不是终于被实现了？但很少有人追问一个更本质的问题，仅仅凭一个关于「机器能否模仿人类」的思想实验，再加上一台抽象到让人头疼的「假想打字机」（图灵机），这两个概念就足以撑起「计算机科学之父」的头衔吗？远远不够。图灵测试只是他思想冰山中最容易被大众看到的那一角。在这篇文章里，我想带你拨开迷雾，看看这个人在短短41年的生命里，到底为今天的人工智能大厦打下了怎样的地基。你会发现，他之所以伟大，不只是因为他预言了机器会思考，而是因为他在没有任何人想到「计算机」这三个字的年代，就已经亲手写下了整座大厦的蓝图。从地基到方法论，从「能不能」到「怎么做」，全是他一个人完成的。第一章：24岁的年轻人定义了「计算」本身 1935年，剑桥大学。一个23岁的年轻人听完一场讲座之后，被一个问题击中了。这个问题来自大数学家大卫·希尔伯特（David Hilbert），叫做「判定问题」（Entscheidungsproblem）。简单说就是，能不能找到一种纯粹的机械步骤，自动判断任何数学命题的真假？不用灵感，不用直觉，就像一台机器一样，输入命题，输出「对」或「错」。这个问题看起来是纯数学的，跟普通人毫无关系。但图灵为了回答它，做了一件所有人都没预料到的事。他没有去推导公式，而是闭上眼睛，想象了一台机器。图灵机（Turing Machine）：一台只懂最基本操作的机器，在一条无限长的纸带上读写0和1，根据极简的规则一步步移动。你可以把它想象成一个只懂加减法、但拥有无限时间、无限耐心和无限长草稿纸的记账员。然后，图灵证明了，这台简陋到荒谬的机器，可以计算任何「可计算」的东西。但真正的天才是下一步。他说，既然这台机器能执行任何计算规则，那我是不是可以设计一台「万能」的图灵机，它不需要为每个任务重新造一台新机器，而是把别的机器的规则「写进」纸带里，就能模拟任何一台图灵机？这就是「通用图灵机」（Universal Turing Machine）。今天你用的手机、笔记本、云服务器，底层原理全部通用图灵机。你不需要为微信造一台手机、为抖音再造一台、为导航又造一台。同一台设备，换个软件（纸带上的规则）就能干完全不同的事。这个「软件和硬件分离」的概念，在1936年是颠覆性的。在图灵之前，人们认为计算机器都是为特定任务定制的硬件齿轮。图灵第一次从数学上证明，计算可以脱离具体的物理形态，变成纯粹的信息处理过程。而图灵写下这篇论文的时候，他24岁。图1：图灵把「计算」还原成纸带、读写头和规则，一台足够简单的机器，却能刻画所有可计算过程。今天动辄千亿参数的大语言模型，无论它在和你对话时表现得多么像有灵魂的人类，底层依然在那个24岁年轻人画出的框架里运行。图灵没有发明某一种计算机，他定义了「计算」本身。第二章：预言机，以及机器做不到的事定义了「计算」之后，图灵做了一件更有意思的事。他问，那计算做不到的呢？在1936年的论文里，他已经证明了一件事，存在某些问题，图灵机永远无法回答。最著名的就是「停机问题」，给你一段程序，你能不能判断它最终会停下来还是永远跑下去？图灵用数学证明了，这件事不可能通过任何机械步骤来完成。到了普林斯顿读博期间（1936-1938），图灵把这个思路推得更远。他在博士论文里提出了一个概念，「预言机」（Oracle Machine）。预言机（Oracle Machine）：给图灵机外挂一个「黑箱」，遇到解不出的问题时，可以直接问这个黑箱要答案，而不需要知道过程。想象你在考场上做一张极难的卷子，遇到死活解不出的题，突然有一个全知全能的老师在你耳边说出答案。图2：预言机像一个不能被拆开的黑箱，它不解释过程，只在机械推理走到边界时给出答案。图灵用预言机做了什么？他在论文里区分了人类思维中的两种能力，「技巧」（Ingenuity）和「直觉」（Intuition）。技巧是那些可以被明确规则化、可以一步步按程序执行的部分。这部分，机器完全可以胜任，甚至比人做得更好。直觉是那种突然的跳跃，你不知道为什么想到了这个方向，但它就是出现了。那种「灵光一闪」的瞬间，形式化的逻辑规则无法涵盖它。在图灵的理论框架里，每当机械的技巧走到尽头，就需要一次直觉的跳跃来打开新的局面，然后再继续用技巧去铺路。这不是说图灵断言了机器永远不可能拥有直觉。他比谁都相信机器的潜力。但他用严谨的数学，标记出了当前的计算框架中存在边界。这个边界不是技术上的限制，而是逻辑结构上的。今天回头看，这个洞察准得吓人。当下的深度学习极其擅长在已有的模式空间里生成、推理、优化（技巧），但当需要从零到一提出全新的科学范式时，仍然举步维艰。图灵在80多年前就用数学语言，把这个边界画出来了。第三章：一个1950年的预言，精确命中了今天让我们回到1950年。那一年，全世界最强大的计算机占了整整一个大房间，耗电量够供一条街，运算能力还不如今天一个10块钱的计算器。没有任何AI，没有任何互联网，连「程序员」这个职业都还不存在。就在这一年，图灵写下了《计算机器与智能》这篇论文。大多数人只知道这篇文章提出了图灵测试。但真正让人拍案叫绝的，是他在论文末尾提出的「儿童机器」（Child-Machine）构想。图灵说，试图直接编写一个具备成人智能的程序，是极其困难甚至徒劳的。正确的方法是什么？开发一个像儿童大脑一样的初始程序，给它基础的逻辑和极强的学习能力，然后让它在环境中通过教育来成长。那最有效的教育方式是什么？奖励与惩罚。图3：图灵认为我们不该制造一个成年的机器，而是通过奖励与惩罚像教育孩童一样训练它，这正是现代强化学习的精髓。强化学习（Reinforcement Learning）：让智能体在环境中不断试错，做对了给奖励，做错了给惩罚。就像训练小狗握手，做对了就给一块肉干。仔细想想这件事。在1950年，在计算机还是一个房间大小的铁柜子的年代，图灵不仅预言了人工智能终将到来，他甚至连「怎么培养AI」的正确路线图都画好了。 2016年，AlphaGo横扫围棋界，底层正是强化学习。 2023年，ChatGPT之所以能学会顺从人类的偏好、不说胡话，用的是RLHF（基于人类反馈的强化学习）。 70多年过去了。图灵当年画的那张路线图，不仅没过时，我们恰恰是在上面狂奔。他不是只预言了「AI会出现」，他是把「地基」和「方法论」一并写好了。尾声：数字时代的普罗米修斯 1952年，图灵因为同性恋行为被英国政府定罪。他被迫在坐牢和化学阉割之间做出选择。他选择了后者。两年后，1954年6月7日，图灵被发现死在自己的卧室里，床头有一个咬过一口的苹果。他41岁。这个人，二战期间在布莱切利园破解了德国海军的Enigma密码，历史学家估计他的工作将战争缩短了至少两年，拯救了上千万人的生命。他定义了「计算」本身，预见了机器智能的可能性，设计了训练智能的方法论。图4：在布莱切利园，图灵把抽象的计算思想变成了破解密码的现实工具，也改变了二战的进程。然后他被自己拯救的社会迫害至死。 2013年，英国女王伊丽莎白二世签署了对图灵的皇家赦免。距离他去世，已经过去了59年。今天，我们每次在屏幕前敲下回车，每次大模型吐出流畅的文字，背后都在回荡着图灵半个多世纪前的思考。他没有活到看见哪怕第一台个人电脑诞生的那一天，但他画下的蓝图，至今没有一条被证明走错了。他真的是数字时代的普罗米修斯，为人间盗来了火种，自己却在黑暗中燃尽。

AI 第一性原理（四）：Ilya Sutskever 与「预测即理解」的终极实践

前三篇我们走过了理论计算机科学的三座高峰。所罗门诺夫归纳给出了最优雅的预测框架，柯尔莫哥洛夫复杂性定义了信息的绝对尺度，计算理论揭示了宇宙底层的运行逻辑。但这三座高峰都有一个共同特点：它们是纯粹的理论。黑板上的公式，思想实验里的纸带。纯粹的理论如果不能变成工程，就永远是符号。今天这篇，是整个系列的终篇。我们来看看，这些深邃的第一性原理，是如何被一个人浓缩成了一句极其简单的话，然后彻底改变了世界的。那个人叫 Ilya Sutskever。第一章：最笨的方法图1：无数张写满晦涩公式的图纸，最终熔铸成了一枚发光的、能够回答任何问题的晶体。很长一段时间里，AI 学界对「如何实现 AGI」争论不休。有人主张建立庞大的符号逻辑知识库，有人主张模拟大脑的生物学细节，有人觉得需要全新的范式。但最终取得突破的，是一种看起来「最笨」的方法：给神经网络输入海量文本，让它玩一个无穷无尽的游戏——预测下一个词。当 GPT-3、GPT-4 展现出令人瞠目的推理和创造力时，很多传统 AI 学者感到困惑。「它明明只是在做统计上的词汇接龙，怎么可能拥有智能？」 Ilya Sutskever 不困惑。他从未困惑过。第二章：Ilya 的核心信念图2：一位戴着眼镜的工程师，正凝视着由无数纷乱字母汇聚成的一条笔直的光束。 Ilya 有一个坚定不移的信念：如果一个模型能够完美地预测一段文本的后续内容，它就必须深刻理解这段文本背后的物理世界和人类逻辑。听起来有点夸张。预测下一个词，不就是根据概率分布猜吗？设想这个句子：「因为外面下着暴雨，所以当小明不打伞走回家后，他的衣服一定会……」任何人都会脱口而出：「湿透」。但为了让模型准确预测出「湿透」这个词，模型必须在内部建立起一套隐式的世界模型：它得懂得什么是「雨」，什么是「伞」，什么是「衣服的物理性质」，以及「走在雨中不打伞」的因果关系。如果语料库涵盖了人类所有的知识——从量子力学的论文到莎士比亚的十四行诗，从 Python 代码到菜谱——那为了完美预测这些文本，模型就被迫使在内部建立起整个世界的计算模拟。这不是比喻。这是数学。第三章：预测即压缩，压缩即理解图3：一台巨大的液压机，将海量的乱码和文字挤压成一颗闪烁着智慧光芒的微小钻石。回到我们前两篇讨论过的理论工具。在所罗门诺夫归纳中，完美的预测来自找到生成数据的最短程序。在柯尔莫哥洛夫复杂性中，「理解」一段数据就是将它最大限度地压缩。预测和压缩在数学上是等价的。如果你能准确预测数据，就能用更少的比特编码它（算术编码）。如果你能高度压缩数据，就意味着你有一个好的预测模型。这是香农信息论和算法信息论的交叉点。大语言模型的训练过程——反向传播优化交叉熵损失——本质上就是一个极致的数据压缩过程。模型有几百亿甚至数千亿个参数，但相对于它吞噬的万亿级训练数据，这仍然是一个极小的瓶颈。为了把极其庞大的数据塞进相对较小的权重矩阵中，模型不能死记硬背（容量不够），它必须寻找数据中最底层、最普适的规律。牛顿定律是压缩，麦克斯韦方程组是压缩，GPT 的权重矩阵同样是人类文明数据的压缩。压缩到极致，就是理解。第四章：涌现与世界的统计模型图4：在由文字排列成的矩阵屏幕后，隐藏着一个微缩而生动的真实三维世界。很多人批评 LLM 只是「随机鹦鹉」（Stochastic Parrots），在统计层面模仿人类的语言模式，并不真正理解任何东西。这种批评忽略了计算理论的威力。根据泛计算主义的视角，世界的本质是计算。人类用语言描述这个世界，语言就是这个计算世界的投影，或者说，是通用图灵机输出的纸带。当大语言模型在数百个 GPU 上日以继夜地阅读这根长达万亿比特的「纸带」，试图预测下一个符号时，它其实在进行一项宏大的反向工程——寻找能够生成这根纸带的那个通用图灵机的内部状态。当模型规模跨过某个临界点时，涌现发生了。模型不再只是记录词与词之间的表面共现频率，而是构建出了抽象的概念层级、逻辑推理能力，甚至某种程度的自我认知。 Ilya 多次在公开场合表达过类似的想法：文本是世界的投影，通过预测文本来逆向还原世界的心智模型，这条路径在理论上是站得住的。第五章：通往 AGI 的阶梯图5：由数据方块、算力齿轮和算法图纸铺就的一条阶梯，直通向充满无限可能的云端。 AI 的第一性原理不仅解释了为什么 LLM 会成功，更指明了通往 AGI 的方向。 ...

AI 第一性原理（三）：计算理论作为宇宙的本体论

前两篇我们走了两条路。所罗门诺夫归纳说，最优预测就是找到生成数据的最短程序。柯尔莫哥洛夫复杂性说，「理解」的本质就是「压缩」，压缩的极限取决于程序的长度。这两条路都指向同一个根基：算法和计算。那如果信息和规律都可以被还原为算法，承载这些算法的物理世界本身，其本质是什么？今天这篇，我们攀到整个系列最高的地方。不谈具体的算法了，我们来问一个更大的问题：宇宙是不是一台计算机？第一章：It from Bit 图1：物理学家的显微镜下，不再是原子与夸克，而是正在执行代码的微小齿轮。物理学家约翰·惠勒（John Wheeler）提出过一个著名的猜想，「It from bit」，万物源于比特。他的意思是，任何物理实体（It），归根结底都来源于对一个是/否（Bit）问题的回答。而在计算科学的视角下，这个观点被推得更远：如果万物源于比特，那宇宙的演化，本质上就是对这些比特的计算过程。这不是科幻小说。这是20世纪最顶尖的物理学家之一在认真思考的事情。第二章：通用图灵机的幽灵图2：一个无形的机械幽灵，正悄悄附身于世界上所有的机器，赋予它们计算的灵魂。要理解「宇宙作为计算」这个想法，得先回到图灵1936年那个著名的思想实验。一条无限长的纸带，一个读写头，一套状态转换规则。如此简陋的抽象，却确立了「可计算性」的边界。更关键的是通用图灵机——图灵证明了，存在一种特殊的图灵机，只要把别的图灵机的规则写在纸带上喂给它，它就能完美模拟那台机器。这就是「软件」概念的起源，也是邱奇-图灵论题（Church-Turing Thesis）的核心：任何可以被直观认为「可计算」的函数，都可以被通用图灵机计算。这意味着什么？只要底层逻辑门是完备的（比如 NAND 门），不论是你的手机芯片、超级计算机，还是由水管和阀门构成的流体计算机，甚至是某种生物分子系统，在「理论计算能力」上是完全等价的。区别只是常数倍的速度差异。这也正是柯尔莫哥洛夫不变性定理的物理基础——换个「硬件」，常数 $c$ 变一下，但信息量的度量不变。第三章：泛计算主义——宇宙是一台计算机？图3：苍穹之上不是繁星，而是由无尽的元胞自动机网格交织而成的璀璨夜空。斯蒂芬·沃尔夫勒姆（Stephen Wolfram）在《一种新科学》中，把这个思路推到了极致。他花了几十年研究一维元胞自动机（Cellular Automata）。想象一条由黑白方块组成的纸带，每个方块根据邻居的颜色和几条极简的规则更新自己的颜色。看起来简陋得像个玩具。但沃尔夫勒姆发现了惊人的事情。著名的「规则30」，初始条件只有一个黑色方块，几步之后就能产生极其复杂、看起来完全随机的图案。而「规则110」被证明具有图灵完备性——就是说，这个由黑白方块和几条更新规则组成的系统，理论上能执行任何计算，甚至模拟宇宙。泛计算主义由此诞生。我们的宇宙可能不是由连续的微分方程主导，而是由底层的离散计算规则主导的。物理法则就是宇宙这台超级计算机的操作系统，量子状态就是内存中的比特，时间的流逝不过是时钟周期的跳动。如果我们周遭的一切——恒星的燃烧、细胞的分裂、人类的大脑——都只是一种计算过程，那「人工智能」就不是一种刻意的工程模拟，而是宇宙这种底层计算本质在另一个介质上的自然重现。第四章：不可判定性与现实的迷雾图4：在逻辑迷宫的尽头，探险者面对着一扇既不是开着也不是关着的薛定谔之门。如果宇宙是计算的，那是不是理论上能预测一切？图灵早就泼了冷水。停机问题不可判定——你永远无法写出一个通用程序来判断另一个程序最终会停止还是陷入死循环。与之呼应的是哥德尔不完备定理：任何包含基本算术的逻辑体系中，必然存在既不能被证明也不能被证伪的命题。沃尔夫勒姆把这种现象称为「计算不可约性」（Computational Irreducibility）：有些计算过程，没有任何捷径可以跳过中间步骤直达结果，你必须一步一步跑到底。这种计算的「不完备」和「不可判定」，就像量子力学中的测不准原理，为宇宙的确定性蒙上了一层面纱。它也暗示了一件事：人类的意识和创造力，或许正来源于这种复杂系统的不可预测性。如果一切都可以被公式推演，那「创造」就失去了意义。第五章：人类智能的本质图5：大脑的沟壑与集成电路的走线在画面中心完美融合，难分彼此。如果接受了泛计算主义的视角，人类智能和人工智能之间就不存在本质的「灵肉之别」。大脑的神经元放电是计算，硅基的矩阵乘法也是计算。根据邱奇-图灵论题，只要规模和架构足够复杂，它们在计算能力上是等效的。这也解释了为什么大语言模型仅仅通过预测下一个词——一种看似简单的计算任务——就能涌现出令人惊叹的逻辑推理和情感理解。语言本身就是人类大脑输出的高维压缩代码。而 LLM 正在逆向工程出生成这些代码的那个「通用图灵机」。结语：不可计算的深渊图6：深不见底的悬崖边，一架精确的计算仪器正在试图测量深渊的深度，但测线却永远无法触底。计算理论作为 AI 的第一性原理，不仅给了我们构造智能的工具，更给了我们一个理解自身在宇宙中位置的全新视角。从图灵的纸带到今天的神经网络，计算的幽灵无处不在。然而，正是计算的极限——那些不可判定、不可压缩、必须亲历才能知晓的过程——构成了生命演化的意义所在。如果智能是宇宙中最复杂的计算游戏，那我们目前看到的 AI 突破，只是这场游戏的前奏。下一篇，我们将从抽象的数学和哲学落回到工程前沿，看看 Ilya Sutskever 是如何将这些第一性原理浓缩为一句改变世界的工程信条。本文是《AI 第一性原理》系列的第三篇。前一篇：柯尔莫哥洛夫复杂性与绝对的信息

AI 第一性原理（二）：柯尔莫哥洛夫复杂性与绝对的信息

上一篇我们说到，所罗门诺夫归纳将奥卡姆剃刀和贝叶斯法则结合，用「生成数据的程序长度」来衡量规律的强弱。程序越短，规律越美。但这里藏着一个追问：对于一个确定的对象，它到底包含了多少无法被压缩的、绝对的「信息量」？今天这篇，我们走进算法信息论的基石——柯尔莫哥洛夫复杂性。它不仅回答了「什么是绝对信息」，更从根本上划清了「规律」和「随机」的数学边界。第一章：三个人，同一个发现图1：信息的海洋中，数学家们正在寻找那根衡量绝对真理的标尺。 1960年代，三位数学家几乎同时、彼此独立地撞上了同一个洞见。美国的雷·所罗门诺夫关心的是如何预测未来，苏联的安德烈·柯尔莫哥洛夫关心的是概率论的基础，美国的格里高利·蔡廷在思考哥德尔不完备定理的推广。三条完全不同的路，通向了同一个终点。他们都意识到：既然一切可计算的规律都能用代码表示，那衡量一个事物复杂程度的最佳方式，就是看生成它需要多长的代码。第二章：什么是绝对的信息？图2：无论外观多么庞大，事物的本质往往被压缩在一粒微小的种子里。我们日常会说某个问题「很复杂」、某个规律「很简单」。但数学不能容忍模糊。柯尔莫哥洛夫复杂性：一个对象的复杂性，是在通用图灵机上能够生成该对象的最短程序的长度。可以想象成用最精简的代码将一个文件完美无损压缩后，那个压缩包的体积。设 $x$ 是一个二进制字符串，$U$ 是一个通用图灵机，那么 $x$ 的柯尔莫哥洛夫复杂性 $K(x)$ 定义为： $$ K(x) = \min_{p} { L(p) \mid U(p) = x } $$ $L(p)$ 是程序 $p$ 的二进制比特长度。这个定义抛弃了所有主观解释，直接用理论计算机科学最底层的机制给出了信息的绝对度量。第三章：规律、结构与纯粹的随机图3：在一面是整齐齿轮、另一面是混沌风暴的镜子前，程序长度映照出了它们的本质。柯尔莫哥洛夫复杂性最精彩的贡献，是精确区分了「规律性」和「随机性」。试想两个长度都是100万位的二进制字符串。第一个是 0101010101... 重复50万次。第二个是你掷硬币100万次记录的真实结果。从物理长度上看，完全一样，都是100万比特。但从算法信息的角度看，天差地别。第一个字符串，哪怕它长达一亿位，柯尔莫哥洛夫复杂性也非常小。一行程序就够了，print("01" * 500000)。高度的规律性意味着极强的可压缩性。第二个呢？由于不存在任何结构或模式，你找不到比它本身更短的程序来生成它。只能硬编码，print("011000101...")，把所有随机结果原封不动写进去。绝对的随机意味着不可压缩。 $$ K(x) \approx L(x) $$ 这是一个极其深刻的洞察。随机性不是一种玄学状态，随机性就是「缺乏更短的算法描述」。当你无法压缩一段信息的时候，它就是随机的。第四章：不变性定理——客观的尺度图4：不论使用哪种语言的尺子，丈量出的信息本质之差永远不会超过一个固定的常数。你可能已经发现了一个尖锐的问题：既然复杂性取决于「程序长度」，但不同编程语言的代码长度肯定不一样啊。同样是打印一句话，Python 可能一行搞定，C++ 可能要十行。这难道不说明复杂性是相对的吗？柯尔莫哥洛夫想到了这一点，并给出了算法信息论中最重要的定理——不变性定理。定理证明：尽管 $K(x)$ 的具体数值取决于你选择的通用图灵机（编程语言），但对于任意两个通用图灵机 $U_1$ 和 $U_2$，它们计算出的复杂性之差永远受一个常数 $c$ 约束，而且这个常数与输入字符串 $x$ 完全无关。 ...

AI 第一性原理（一）：所罗门诺夫归纳与预测的终极数学

“对我触动最大的是所罗门诺夫的归纳理论，我在前两版中都介绍过所罗门诺夫和他在 20 世纪 60 年代提出的归纳理论以及柯尔莫哥洛夫复杂性。大语言模型刚出来，我就和师友讨论这个理论作为大语言模型第一性原理的可能性。2023 年 8 月 14 日，OpenAI 的伊利亚（Ilya Sutskever）在伯克利的演讲透露了所罗门诺夫归纳和柯尔莫哥洛夫复杂性正是他们坚持做 next token prediction (下一词元预测) 的理论基础。这让我对历史与当下、理论与实践有了新的认识。……我一直认为计算理论是最具第一性原理（在牛顿和罗素的拉丁文 Principia 的意义上，而不是马斯克的口头禅意义上）的理论，甚至比理论物理学更为基本。” —— 尼克，《人工智能简史》第 3 版前言 2023年8月14日，伯克利。Ilya Sutskever 在一场演讲中透露了一件事，在场很多 AI 研究者都愣住了。他说，OpenAI 坚持做 next token prediction 的理论基础，不是什么新发明，而是1960年代的理论——所罗门诺夫归纳和柯尔莫哥洛夫复杂性。我第一次读到这段话的时候，头皮发麻。这等于说，今天大模型在做的事情，早在60年前就已经被数学公式精确描述了。那个年代连个人电脑都没有，所罗门诺夫却写下了预测的终极理论。而今天，万亿参数的 GPT 不过是在用暴力计算去逼近那个理论的极限。这个系列要讲的就是这件事。作为开篇，我们先走进所罗门诺夫归纳——一个能回答「如何对未知做出最优预测」的数学框架。第一章：贝叶斯与奥卡姆的联姻图1：数学的秤盘上，衡量着概率的更新与简单性的偏好。要理解所罗门诺夫做了什么，得先看他的两个基石。第一个是贝叶斯法则。核心思想很简单：根据新的证据更新你对世界的信念。 $$ P(H|D) = \frac{P(D|H) P(H)}{P(D)} $$ $P(H)$ 是先验概率，看到数据之前你认为假设 $H$ 有多可信。$P(D|H)$ 是似然度，如果 $H$ 为真，它产生当前数据的概率有多大。贝叶斯法则逻辑严密，但它留下了一个致命的漏洞：初始的先验概率 $P(H)$ 怎么定？如果你对所有可能的假设一视同仁，而假设的数量是无限的，那每个假设的先验概率都趋近于零——等于什么都没说。第二个基石是奥卡姆剃刀。14世纪的哲学原则，如无必要，勿增实体。解释同一件事，越简单的理论越可能是对的。如果奥卡姆剃刀能和贝叶斯法则缝合起来——简单的假设获得更高的先验概率——问题就解决了。但「简单」怎么定义？用中文说「简单」，换成英文可能就变复杂了。我们需要一个不受语言影响的、绝对客观的度量。第二章：从图灵机到通用先验图2：图灵机的纸带在无限延伸，所有的规律都可以被编码为计算。所罗门诺夫的回答极其优雅：用图灵机。任何可计算的规律，都能写成一段在通用图灵机上运行的程序。规律越简单，程序越短。规律越复杂（或者数据纯粹是随机的），程序就越长——最极端的情况下，你只能把数据原封不动地硬编码进去。基于这个洞察，所罗门诺夫提出了通用先验（Universal Prior）：对于任何一个假设（程序 $p$），它的先验概率与代码长度成指数反比。 ...

被取代与不可取代：一个前数据科学从业者和 AI 产品经理的十年职业回望

站在 2026 年的当下，如果你在科技互联网行业工作，大概率会有这种切身的体感：AI 的能力边界扩张得太快了。我们经常在各种讨论群、咖啡馆里听到这样的焦虑：“我的工作会被 AI 取代吗？” 要回答这个问题，我不打算搬出冰冷的宏观报告，而是想“解剖”一下我自己的职业生涯。从 2011 年毕业至今，我干过数据清理和数据开发、写过无数的脚本规则、搭建过数仓和指标体系、做过很长时间的数据分析挖掘以及机器学习开发工作，也做过一线车企和头部 AI 公司的 AI 产品经理。而到了 2024 年底，我转身进入了一家国际顶尖的第三方检测认证机构，开始围绕欧盟 AI 法案（EU AI Act）以及汽车相关 AI 标准和法规，开展 AI 系统的合规评测、评估与指导业务。如果把我的这段履历切分成两半，你会发现一个非常残酷但也极其清晰的真相：我前半段职业生涯积累的绝大部分硬技能，现在都已经可以被 AI 完美取代；而我现在正在做的事情，AI 却几乎无从下手。这中间的逻辑分界线到底在哪里？为什么我过去的很多工作，现在可以直接交给 AI？让我们先把时间拨回到 2011 年到 2024 年这十几年间。在早期的外企网络安全数据运营中，我的日常工作是处理海量的垃圾邮件。我需要写大量的 Perl、Python、Shell、PHP 等脚本，精雕细琢复杂的正则表达式（Regular Expressions）去构建规则。后来进入几家头部的智能可穿戴和智能手机厂商，我成为了业务数据 BP（Business Partner）和高级数据分析工程师。我的日常变成了：不仅要写复杂的 SQL 语句提数、做 ETL 数据清洗、构建底层数据仓库、梳理用户埋点，用 Tableau 或 Superset 搭建起漂亮的数据看板；我还会频繁使用 Python 的 PySpark，以及基于 Java 或 Scala 的 Spark，去开展更加复杂的大规模数据分析与挖掘。同时，我也负责开发基于传统机器学习方法，以及更为先进的神经网络等机器学习服务。甚至在 2023 年到 2024 年期间，我在一线车企和头部 AI 企业做智能座舱产品经理和智能问答服务的产品负责人时，我的核心工作是：梳理需求、协调各方（运营、研发、测试）的动作，撰写和优化需求文档（PRD），推动产品功能落地。站在今天回看，这些工作本质上可以归结为两个词：翻译与搬砖。翻译属性工作：将一种人类语言转化为另一种机器或其他部门能理解的指令。可以想象成一个“人肉编译器”，把业务方说的“我要看昨天活跃用户下降的原因”翻译成底层的多表关联 SQL 代码。 ...

Human-to-Human，AI-to-AI，贾扬清的内部沟通规则或许太简单理想化了

Human-to-Human，AI-to-AI，贾扬清的内部沟通规则或许太简单理想化了贾扬清发了一条帖子，17K+ Views，说他在公司内部设了一条沟通规则： Just set an internal comms rule: no AI-generated content for collaboration. If you used AI, don’t send the output. Send your prompt, or better, your raw thinking. Assume your reader will paste it into ChatGPT. Write so they won’t need to. Separate channels: human-to-human = your thoughts; AI-to-AI = attach outputs like audit working papers. Human to human, AI to AI. Works well so far. 图1：贾扬清发帖提出内部沟通规则，主张将人与AI的沟通通道分离。 ...

当造车二十年的人被要求"学AI写代码"

看了甲子光年的文章《胡峥楠就任小米汽车CTO后首次受访：我的第一要务是重新学习》整篇采访里最让我愣住的一段是这个：就像今天雷总对我的要求是，你可不可以开始 AI coding？说这话的人叫胡峥楠。吉利前研究院院长，路特斯汽车智能化平台创始人，现在是小米汽车的 CTO。一个在传统车企体系里成长了二十多年的人，被老板当面问：你能不能开始用 AI 写代码？这个场景本身就是2026年汽车行业最精准的缩影。不是一个刚毕业的程序员在尝试 Copilot，是一个造了二十年车的 CTO，被要求重新审视自己的工作方式。胡峥楠自己的反应也很坦诚：如果说我们在很短的时间之内不能够适应这种新的思维模式的话，可能我很快会被淘汰。一个 CTO 说"我可能会被淘汰"，这不是谦虚，这是一个看清了形势的人在说实话。 “我首先需要做的事情是：更新我的知识体系” 胡峥楠在这次采访中说了一句让我印象很深的话：你学的东西五年后可能有50%是错的，但你不知道是哪50%。这句话之所以有分量，是因为说这话的人不是一个焦虑的中层，而是一个亲手建立过完整汽车开发方法论的人。他在吉利十五年，从底盘调校到整车架构，一砖一瓦堆起来的知识体系，现在他自己说：这套体系需要重建。不是推倒重来，而是持续重建。转型有终点，你到达另一个状态就结束了。但"更新知识体系"没有终点，它是一种持续的生存状态。胡峥楠选的词很准：不是"转型"，是"学习"。第四次融合：三条曲线同时叠加雷军讲过一个框架，胡峥楠在采访中展开了：未来的智能电动汽车是汽车行业的第四次融合。前三次分别是机械与电气、电气与电子、互联网与移动通信。每一次都消灭了一批旧行业，催生了一批新职业，但每一次基本上是一条曲线替代另一条曲线。从机械、电气、电子到新能源、移动通信与 AI，第四次融合的复杂性在于多条曲线同时叠加。第四次融合不一样。新能源技术、消费电子能力、信息通信技术，三条曲线都还没有消退，就已经在同一台车里汇合了。这意味着你不能像以前那样，等一条曲线彻底成熟再整合。三套方法论必须在同一时间、以某种还没有人完全弄清楚的方式共存。用胡峥楠自己的话说，这本质上是"降维打击"。过去在传统车企体系里积累的经验，在这个融合时代未必还是经验。所以"五年后有50%是错的"，指的正是这种状态：不是某一项知识被推翻，而是整个知识体系的权重在快速变化。你不知道重心该往哪里放。关于 AI coding 那段，我多说两句回到雷军让胡峥楠 AI coding 的事。雷军不是在说"你去了解一下 AI"，他是在说"你自己动手用 AI 来工作"。从了解到使用，从使用到重构工作流，这中间的距离比大多数人以为的要大得多。胡峥楠说"传统’撸铁’的同学"需要学习新的知识体系，用的词也挺妙。“撸铁"在这里是个隐喻，指的是那些扎扎实实做硬件工程、底盘调校、NVH（Noise, Vibration and Harshness）优化的同事。这些能力不会消失，但如果你不学会用 AI 工具来辅助你的工作，你会越来越慢，直到被那些学会了的人拉开距离。端到端大模型：安全范式正在被重新定义胡峥楠提到一个他正在思考的核心问题：端到端大模型的安全，行业目前没有答案。这不是技术不成熟的问题。这是方法论的根本性挑战。传统汽车功能安全建立在"可穷举系统状态"这个假设上。ISO 26262、HARA（Hazard Analysis and Risk Assessment）、FMEA（Failure Mode and Effects Analysis）、FTA（Fault Tree Analysis）这套工具链，本质上是在说：只要你穷举了所有故障模式，就能定义安全边界。端到端自动驾驶不遵循这个逻辑。它的决策来自大规模数据驱动的神经网络，不是手工编码的规则。它的"安全边界"不是一条工程师画出来的曲线，而是一个由数据分布定义的隐空间。系统的失效模式不再是"某个传感器故障”，而是"训练数据分布之外的场景导致模型产生了在分布内看似合理但实际危险的输出"。传统安全工程的故障树，正在被迫翻译成 AI 模型的数据分布与隐空间语言。 ...

非Cook眼中的淮南牛肉汤

那家店要搬走的那天早上，我照常去吃牛肉汤。图1：清晨六点的牛肉汤店门口，永远是一座城市最诚实的地方。老板正在跟接手的下家交代怎么做汤。我坐在旁边吃，有一搭没一搭地听着。骨头要泡多久，什么时候下锅，冷水还是热水，火开多大，沫子怎么撇，什么时候放姜，什么时候下香料包，香料包里几颗八角、几片桂皮、草果要不要拍开，牛肉煮到什么程度捞出来，捞出来怎么放凉，放凉多久才能切，切多薄…… 那一长串步骤、火候和时间节点，说了足足二十分钟。我端着碗愣住了。眼前这碗汤，粉丝透亮，千张薄如纸，牛肉贴着碗壁铺开，汤面上一层薄薄的牛油和辣椒红油，香菜碎和葱花安静地浮着。我以前一直觉得，牛肉汤嘛，不就是汤水加料？能有多复杂？那天我才知道，这碗看起来朴素到极致的汤，背后是一整套精密的时间表。淮河边的早餐工程图2：一碗标准的淮南牛肉汤：汤清而鲜，千张薄而窄，牛肉片若纸，辣椒油在汤面画出一道红弧。旁边是刚出炉的芝麻烧饼。淮南在安徽北部，淮河从城市中间穿过。这座城市不大，但坐落在肥沃的农业区中心，牛肉、大豆和小麦都不缺。淮南牛肉汤的起源没有确切的文献记载。有把它追溯到宋元时期游牧饮食影响的说法，也有拿刘安、赵匡胤来讲故事的地方传说。但更稳妥的判断是：它形成于淮河流域的牛肉、豆制品、小麦和早市文化的交汇之中，经过一代代街头摊铺的打磨，慢慢沉淀成了今天的样子。它的本质不是一道精致宴席菜。它更接近一种高频消费的城市早餐系统：要快，要热，要鲜，要便宜，要能批量稳定供应，还要在几十秒内完成一碗的最终组装。这些约束条件叠在一起，就把它逼成了一门手艺。一锅汤的秘密图3：凌晨三点，大锅已经在火上了。牛棒骨、脊骨、肋骨在琥珀色的汤里轻轻翻滚，浮沫被一勺一勺撇去。好牛肉汤的根基是骨汤。这一步没有捷径。牛骨要在头天晚上泡水，换几次，把血水泡出来。第二天凌晨冷水下锅，慢慢升温。水开之前会浮起一层灰白色的沫，那是受热凝结的蛋白质和杂质。必须耐心撇干净。如果图省事让汤翻滚，这些东西会被卷回汤里，整锅汤就脏了，入口会有一股闷闷的腥味。焯水、冲洗之后才是正式吊汤。牛骨、部分牛肉、姜块、葱段、香料包，小火慢熬四到六个小时。火不能大。大火会让脂肪乳化，汤变得浑浊油腻。小火熬出来的汤是清亮的琥珀色，轻轻晃一下，能看到汤面微微荡开的油花，喝一口，有骨髓的厚度、牛肉的鲜甜和胶质黏唇的绵密感。骨料的搭配也有讲究。棒骨带骨髓，提供脂香和厚度；脊骨和肋骨带肉，补充肉味。只用棒骨，汤油而不鲜；只用瘦肉，汤鲜而不厚。两者搭配，互相补足。香料的角色很微妙。八角、桂皮、草果、花椒、白胡椒、小茴香、香叶，这些都可能出现在香料包里，但用量必须极克制。香料的作用是托住牛肉和骨头的底味，压一下腥膻，留一点温暖的回甘。如果香料味盖过了牛味，那这碗汤喝完你只记得八角和桂皮，记不住牛肉。那就错了。好汤喝完，嘴里应该记得的是牛肉的鲜。碗里的每一样都不简单图4：一碗牛肉汤的全部主角：薄切牛肉、红薯粉丝、窄条千张、香菜、葱花、蒜末、辣椒油。每一样都有自己的临界点。牛肉要薄。这一点怎么强调都不为过。牛腱或牛腩煮到刚好熟透，捞出来，放凉到能下刀的温度，逆着纹理切。薄到什么程度呢？理想状态是铺在碗壁上能微微透光。薄牛肉入口即化，汤汁能渗进每一丝肌肉纤维里。厚牛肉就不一样了，再嫩也会显得跟汤分离，像是汤里放了几片卤肉，各吃各的。千张要薄、要窄。千张是大豆蛋白和脂质在豆浆加热时形成的薄膜，天然就该是轻盈的。切宽了、买厚了，入口像在嚼橡皮片，会把汤的鲜味割裂。切成窄条，它就像面条一样融入整碗汤的节奏，吸汤快，入口轻，带着一丝干净的豆香。粉丝要滑。红薯粉丝比绿豆粉丝更有韧性，在淮南牛肉汤里更常见。关键是不能煮过头。粉丝泡软后短烫即可，不能在锅里久待。它一泡长了就糊、就断、就吃掉汤。好的粉丝应该有弹性，用筷子夹起来能看到汤水顺着它滑落。这三样东西，牛肉、千张、粉丝，食客每一口吃到最多的就是它们。汤底再好，如果这三样处理得粗糙，整碗汤的口感就会打折扣。很多店只盯着汤，忽视了碗里的配角。其实，配角演不好，主角再出色也撑不起一场戏。最后一厘米留给你图5：辣椒油是整碗汤的点睛之笔。好的辣椒油不是单纯的辣，而是辣椒的焦香、芝麻的油香和几味香料的暗劲合在一起。淮南牛肉汤有一个特别好的传统：佐料自取。葱花、蒜泥、香菜、醋、辣椒油，排成一排摆在台面上，你自己拿小勺加。这不是偷懒，这是智慧。好汤底应该是干净的、有骨肉底味但不过分调味的。最后那一点个人化的刺激感，交给食客自己完成。有人爱蒜泥的冲劲，有人受不了蒜味；有人要香菜的清香，有人觉得那是肥皂味；有人无辣不欢，有人只要一碗清汤。所有这些偏好，都在最后一厘米里被照顾到了。辣椒油值得单独说。很多店的差距，就差在这一小勺上。好辣椒油是用热油激过辣椒碎和几味香料做成的，油温要够高但不能烧焦，辣椒要有焦香而不是生辣或苦味。香料在油里会释放脂溶性的风味物质，这就是为什么一勺辣椒油能一下子「点亮」整碗汤的香气。如果辣椒油有陈油味、焦糊味、或者只剩干辣，那第一口就毁了。饼要现炕图6：芝麻烧饼从炉膛里铲出来的那一刻，焦香、麦香和芝麻香混在一起。这个温度，只有现炕才有。牛肉汤配饼。这个「饼」不是随便什么饼，是贴着炉壁或铁板现炕出来的芝麻烧饼。外皮焦脆，一咬会碎，芝麻在牙齿间迸开香气。内里是一层一层的面皮，带着麦香和微微的油润。掰一块泡进汤里，饼吸了汤，外面那层脆还没完全化开，内里已经柔软了。这口咬下去，同时吃到了脆、软、鲜、香四种质感。凉饼没有这种魔法。凉了以后芝麻香散了，面皮回硬，泡进汤里只剩面坨的口感。所以真正讲究的店，饼是一批一批现炕的。你坐下来的时候饼还在炉子里，等你的汤端上来，饼也正好出炉。一家店愿不愿意把饼做好，能看出它经营的态度。只想卖一锅汤的店，饼是凑合的。把饼也当回事的店，通常汤也不会差。三十秒的组装图7：一碗牛肉汤的最后三十秒。滚烫的骨汤从大勺里倾泻而下，瞬间激活碗里所有的香气。这个动作要快、要准、要烫。一碗牛肉汤的前期准备可能花了五六个小时，但最终呈现给你的那一碗，从组装到上桌只有三十秒。烫碗。放入粉丝和千张，快速过一下热水或直接在碗里用滚汤烫熟。铺上牛肉片。撒一把香菜和葱花。然后，一大勺滚烫的骨汤从锅里舀起来，高高地冲进碗里。这个「冲」的动作不是随意的。汤要足够烫，冲下去的时候能激起蒸气，把香菜的清香、葱花的辛香、牛油的脂香同时蒸腾起来。端到你面前的那一瞬间，你闻到的那股复合香气，就是这三十秒里组装出来的。汤如果不够烫，所有的香气都打不开。粉丝会显得黏腻，千张会有豆腥味，辣椒油浮在表面动都不动。很多店的问题不是汤不好，是出餐时汤温不够。一碗温吞的牛肉汤，哪怕底汤是用真骨头熬出来的，端上桌也会让人觉得差点意思。牛大骨：一根骨头的信号图8：牛大骨不只是加分项，它是一种信号。骨髓化在舌尖上的那一刻，你知道这家店的汤底是认真熬出来的。有些店会提供整根牛大骨，和汤一起端上来。大骨不是必选项，但它是一个非常好的判断指标。骨头煮得够烂，说明火候到了、时间到了。骨髓能用勺子轻轻一刮就出来，入口即化，带着浓郁的骨脂香。如果骨头硬邦邦的，骨髓还是固态的，说明这家店熬汤的时间不够，或者骨头是后来加进去做样子的。大骨的存在还意味着另一件事：这家店真的在用大量骨头熬汤。汤里的胶质感、厚度和骨香不是调味料能伪造的，它们只能来自长时间、大用量的真实熬煮。十年几百碗之后吃了十几年，走过很多城市的牛肉汤馆子，我慢慢攒出了一套判断标准。汤入口第一秒要热，第二秒要鲜，第三秒要有骨和肉的厚度。喝完一口之后，嘴里有回甘和微微的脂香，没有腥味、没有香料苦味、没有粉末感、没有口干感。粉丝要滑而不烂，千张要薄而不碎，牛肉要薄、软、有肉味。香菜、蒜、葱和辣椒油是「点亮」而不是「遮盖」。饼要热，要有焦香。如果一碗汤只有重辣、重盐、重味精，那只是刺激，不是好喝。如果一碗汤清淡到像热水泡粉丝，那说明汤底没有骨肉支撑。真正好喝的淮南牛肉汤，应该在「清爽」和「厚重」之间找到一条细细的线，稳稳地走在上面。你问我为什么那么多店做得不行？因为牛肉汤的难不在某一步，而在每一步。骨肉比例、预处理、熬煮时间、火候控制、香料用量、出餐节奏、粉丝千张的处理、牛肉的切工、辣椒油的品质、碗要不要预热……这些变量任意两三个凑合了，整碗汤就会从「好喝」滑向「也就那样」。那天那位老板交代下家的二十分钟，本质上是在传递一张看不见的参数表。每个参数的容错空间都很窄。这也是为什么同一条街上，两家牛肉汤店用的食材可能差不多，端出来的汤却是两个世界。牛肉汤不是「把东西煮熟」。它是一套被早市、成本、火候、刀工和口味共同打磨出来的地方工程。看上去越简单的东西，背后越可能藏着一张密密麻麻的时间表。下次你走进一家牛肉汤店，看到老板凌晨三点就在熬汤，饼是现炕的，千张是手切的，辣椒油是自己炝的，那就坐下来，好好喝这碗汤吧。这种朴素的、不声不响的用心，在这个什么都求快的时代，越来越稀缺了。

我的飞书，正在被 AI 接管：Task 一下，文档自己长出来

我的飞书，正在被 AI 接管：Task 一下，文档自己长出来最近我重读了一篇文章，题目很直接，《我的飞书被AI“接管”了》。文章里讲的事很有代表性：查资料、建多维表格、看妙记、做群聊总结、创建日程和任务，这些动作一旦被封装成命令，AI 就能直接调度。我读完后的真正感受，是另一层判断。飞书里最先被 AI 改写的，可能不是聊天窗口，也不是单篇文档初稿。更值得重视的，是 Task 到文档之间那段原本很碎、很脏、很耗时间的执行链路。今天我正好做了一次很典型的实操。我把一份脱敏后的高风险 AI 合规手册拆成了一组可执行 Task，让 AI 在飞书表格里完成结构化整理、字段补写和结果回填。做完以后，我越来越确定，飞书一旦变成可调用的命令系统，它就会从“协作软件”往“执行界面”再走一步。 CLI（Command Line Interface）：用文本命令直接调用系统能力的接口。可以把它理解成“跳过按钮，直接告诉软件做什么”。 Feishu CLI：把文档、表格、Task、妙记、日程等能力封装成命令之后，AI 就能在飞书内部跨对象执行动作。一、我为什么开始重新看飞书 CLI 过去很多人聊 AI 办公，关注点常常停在“能不能写一段话”“能不能总结一页内容”。这当然有价值，但这还只是外围。飞书 CLI 真正让我兴奋的地方，在于它把飞书的协作对象都变成了可编排资源。原来需要人手点来点去的动作，现在可以被 AI 串起来：先查资料再建表格或文档然后补字段、改结构、做汇总最后把结果写回系统里这时 AI 干的，就不再只是“生成一段文本”。它开始接住一小段工作流。《我的飞书被AI“接管”了》那篇文章，其实已经把这个方向点出来了。里面提到的场景非常典型：用命令查资料让 AI 创建多维表格让 AI 调取飞书妙记并整理内容总结群聊里的高价值信息直接创建日程和任务再和其他 CLI 串联，接外部信息源这些场景放在一起看，会得出一个很重要的结论：飞书正在从“人点按钮的地方”，变成“AI 可以执行动作的地方”。二、一次真实 Task，足够说明问题我今天做的事情，经过脱敏后，可以概括成这样：我先把一份面向高风险 AI 系统的合规手册，拆成了 16 个 Task。每个 Task 都对应一个明确问题和一个交付方向，覆盖数据质量、风险管理、透明度、人工监督、网络安全、质量管理体系等章节。 ...