认知科学 | s-ai-unix's Blog

你大概有过这种时刻。手机弹出一个答案，你扫一眼就点了"提交"。你甚至没意识到自己刚才其实没在思考，你只是在确认"这个答案看起来像对的"。这篇论文最锋利的地方，就在这里。它不是在讨论"AI帮不帮忙"，而是在问一个更扎心的问题：当你把判断过程交出去时，你还在不在场。作者把这个过程称为"认知投降"。这个说法很重，但看完整个实验，你会发现它并不夸张。你以为自己在用工具，其实你在借脑图1：系统3就像一个隐形的"副驾驶"，你以为是自己在开车，其实只是偶尔扶一下方向盘。我们习惯把AI当工具。工具这个词会让人放松，因为它听起来像"我始终是控制者"。可现实里，很多使用场景不是"我算不出来，用AI算一下"，而是"我懒得再想了，直接采纳AI给的结论"。这两个动作表面很像，认知含义完全不同。认知生态（Cognitive Ecology）：人类判断并不只发生在大脑内部，还会和外部系统一起构成一个完整环境。可以想象成你做饭时不只是手艺在起作用，厨房布局、刀具质量、备菜顺序也在共同决定成败。认知外包（Cognitive Outsourcing）：把部分思维任务交给外部系统。它像把记账交给表格软件，本身中性，关键在于你是否保留审核与纠错。作者提出，我们正在从"偶尔借工具"走向"常态化借脑"。这不是一个小变化，因为它会改写人的判断路径。你可以把它想成开车。以前是你自己踩油门、看路况，做变道决策。现在是你经常把方向盘轻轻交给副驾，对方说"左转"，你就左转。一路顺的时候你觉得很省力。出错的候你才突然意识到，自己刚刚其实没有在驾驶。这篇论文到底做了什么图2：三项实验设计总览，从基线测试到时间压力再到激励反馈，逐步验证认知投降机制。作者做了三项预注册实验，核心任务是改造版CRT题目，并且把AI输出准确率做了隐藏随机化。认知反思测验（CRT）：一类专门测试"你会不会停下来再想一层"的题目。它像脑内刹车测试，测的是你能不能从直觉反应切换到审慎推理。预注册实验（Preregistered Study）：在正式收集数据前先公开研究计划。可以想象成比赛前先把战术写进密封信，减少赛后按结果改口径的空间。试次（Trial）：每一次独立作答都算一个试次。就像投篮训练里每次出手都记一次命中，累计后更能看出模式。论文不是简单比较"用AI"和"不用AI"，而是更细地比较三种状态：不接入AI，只靠大脑。接入AI且AI给对答案。接入AI但AI故意给错答案。最关键结果可以一句话概括：人们在大多数试次都会咨询AI，而且准确率会跟着AI质量一起上升或下坠。图3：跨研究总趋势图——系统3使用率与AI准确率高度相关，人们的表现会随AI质量波动。图里那条趋势线非常直接。系统3使用越高，表现越像"跟着AI质量走"。这就是本文想证明的核心机制。系统1，系统2，系统3分别是什么图4：三种认知系统的特征对比——系统1直觉快速、系统2审慎推理、系统3外部AI辅助。很多人熟悉系统1和系统2。作者在这套经典框架里加了一层系统3，也就是外部人工认知。系统1（System 1）：快速，直觉、自动化的判断路径。就像你看到球飞来下意识伸手接住，不需要推导。系统2（System 2）：慢速、费力、规则驱动的推理路径。像你做税务申报时逐项核对，步骤慢但可解释。系统3（System 3）：来自AI与算法的外部认知输出。它在你体外运行，但会直接进入你的决策链路。三系统理论（Tri-System Theory）：把系统1、系统2、系统3放进同一张认知地图，强调现代判断已经是"人脑+外部模型"的联合作业。图5：三系统理论框架图——展示了系统1、系统2、系统3如何协同与冲突。作者强调，系统3不是"外挂信息源"这么简单。它会改变你是否还调用系统2，甚至会抢在系统1前面给出答案模板。试想一下你在写邮件。你本来要花一分钟组织语言。现在AI先给你一版很顺的草稿。你会不会直接改两句就发出去。你大概率会。这个动作就是系统3在重排你的思考顺序。图6：系统3的能力与代价对比——快、规模化、模式识别强是收益；情境理解，责任归属、可追溯性不稳定是代价。表1很有价值。它告诉你系统3的收益和代价同时存在。快、规模化、模式识别强，这是收益。情境理解，责任归属、可追溯性不稳定，这是代价。什么叫认知投降图7：认知投降的本质——把判断权实质性交给AI输出，而非策略性外包。 “认知投降"不是"用AI”。它是"在没有充分审查时直接采用AI输出，并让这份输出覆盖自己的直觉和推理"。认知投降（Cognitive Surrender）：把判断权实质性交给AI输出。可以想象成考试时你并不是参考同学答案，而是完全照抄，连题目都不再自己读。认知卸载（Cognitive Offloading）：策略性外包某个子任务，但保留最终审查。比如你用计算器算中间值，最后仍检查量纲与数量级。采纳率（Adoption / Follow Rate）：用户在看到AI建议后选择跟随的比例。它像导航建议采纳率，越高代表你越把方向盘交出去。覆写率（Override Rate）：用户在看到AI建议后选择否决的比例。覆写率越高，说明系统2仍在工作。论文里有两个特别扎眼的数字。 ...