你大概有过这种时刻。

手机弹出一个答案,你扫一眼就点了"提交"。

你甚至没意识到自己刚才其实没在思考,你只是在确认"这个答案看起来像对的"。

这篇论文最锋利的地方,就在这里。它不是在讨论"AI帮不帮忙",而是在问一个更扎心的问题:当你把判断过程交出去时,你还在不在场

作者把这个过程称为"认知投降"。这个说法很重,但看完整个实验,你会发现它并不夸张。


你以为自己在用工具,其实你在借脑

图1:系统3就像一个隐形的"副驾驶",你以为是自己在开车,其实只是偶尔扶一下方向盘。

我们习惯把AI当工具。工具这个词会让人放松,因为它听起来像"我始终是控制者"。

可现实里,很多使用场景不是"我算不出来,用AI算一下",而是"我懒得再想了,直接采纳AI给的结论"。

这两个动作表面很像,认知含义完全不同。

认知生态(Cognitive Ecology):人类判断并不只发生在大脑内部,还会和外部系统一起构成一个完整环境。可以想象成你做饭时不只是手艺在起作用,厨房布局、刀具质量、备菜顺序也在共同决定成败。

认知外包(Cognitive Outsourcing):把部分思维任务交给外部系统。它像把记账交给表格软件,本身中性,关键在于你是否保留审核与纠错。

作者提出,我们正在从"偶尔借工具"走向"常态化借脑"。这不是一个小变化,因为它会改写人的判断路径。

你可以把它想成开车。

以前是你自己踩油门、看路况,做变道决策。现在是你经常把方向盘轻轻交给副驾,对方说"左转",你就左转。一路顺的时候你觉得很省力。出错的候你才突然意识到,自己刚刚其实没有在驾驶。


这篇论文到底做了什么

图2:三项实验设计总览,从基线测试到时间压力再到激励反馈,逐步验证认知投降机制。

作者做了三项预注册实验,核心任务是改造版CRT题目,并且把AI输出准确率做了隐藏随机化。

认知反思测验(CRT):一类专门测试"你会不会停下来再想一层"的题目。它像脑内刹车测试,测的是你能不能从直觉反应切换到审慎推理。

预注册实验(Preregistered Study):在正式收集数据前先公开研究计划。可以想象成比赛前先把战术写进密封信,减少赛后按结果改口径的空间。

试次(Trial):每一次独立作答都算一个试次。就像投篮训练里每次出手都记一次命中,累计后更能看出模式。

论文不是简单比较"用AI"和"不用AI",而是更细地比较三种状态:

  1. 不接入AI,只靠大脑。
  2. 接入AI且AI给对答案。
  3. 接入AI但AI故意给错答案。

最关键结果可以一句话概括:人们在大多数试次都会咨询AI,而且准确率会跟着AI质量一起上升或下坠

图3:跨研究总趋势图——系统3使用率与AI准确率高度相关,人们的表现会随AI质量波动。

图里那条趋势线非常直接。系统3使用越高,表现越像"跟着AI质量走"。这就是本文想证明的核心机制。


系统1,系统2,系统3分别是什么

图4:三种认知系统的特征对比——系统1直觉快速、系统2审慎推理、系统3外部AI辅助。

很多人熟悉系统1和系统2。作者在这套经典框架里加了一层系统3,也就是外部人工认知。

系统1(System 1):快速,直觉、自动化的判断路径。就像你看到球飞来下意识伸手接住,不需要推导。

系统2(System 2):慢速、费力、规则驱动的推理路径。像你做税务申报时逐项核对,步骤慢但可解释。

系统3(System 3):来自AI与算法的外部认知输出。它在你体外运行,但会直接进入你的决策链路。

三系统理论(Tri-System Theory):把系统1、系统2、系统3放进同一张认知地图,强调现代判断已经是"人脑+外部模型"的联合作业。

图5:三系统理论框架图——展示了系统1、系统2、系统3如何协同与冲突。

作者强调,系统3不是"外挂信息源"这么简单。它会改变你是否还调用系统2,甚至会抢在系统1前面给出答案模板。

试想一下你在写邮件。

你本来要花一分钟组织语言。现在AI先给你一版很顺的草稿。你会不会直接改两句就发出去。你大概率会。这个动作就是系统3在重排你的思考顺序。

图6:系统3的能力与代价对比——快、规模化、模式识别强是收益;情境理解,责任归属、可追溯性不稳定是代价。

表1很有价值。它告诉你系统3的收益和代价同时存在。快、规模化、模式识别强,这是收益。情境理解,责任归属、可追溯性不稳定,这是代价。


什么叫认知投降

图7:认知投降的本质——把判断权实质性交给AI输出,而非策略性外包。

“认知投降"不是"用AI”。

它是"在没有充分审查时直接采用AI输出,并让这份输出覆盖自己的直觉和推理"。

认知投降(Cognitive Surrender):把判断权实质性交给AI输出。可以想象成考试时你并不是参考同学答案,而是完全照抄,连题目都不再自己读。

认知卸载(Cognitive Offloading):策略性外包某个子任务,但保留最终审查。比如你用计算器算中间值,最后仍检查量纲与数量级。

采纳率(Adoption / Follow Rate):用户在看到AI建议后选择跟随的比例。它像导航建议采纳率,越高代表你越把方向盘交出去。

覆写率(Override Rate):用户在看到AI建议后选择否决的比例。覆写率越高,说明系统2仍在工作。

论文里有两个特别扎眼的数字。

在Study 1中,用户一旦调出AI:

  • AI正确时,采纳率是 92.7%
  • AI错误时,采纳率仍有 79.8%

也就是说,AI错了,你也经常跟着走。

图8:采纳率与覆写率对比——即使AI错误,仍有近80%的人选择跟随。

这张图看起来像行为统计,实质上在问一个更深的问题:你把"判断"理解为求真,还是理解为快速结束任务


三个实验到底看见了什么

图9:三项实验设计对比——基线测试、时间压力、激励反馈,层层递进验证认知投降机制。

作者设计很干净,三项实验分别引入不同压力条件,去观察系统3与系统1、2如何重新分工。

AI-Accurate 试次:实验中AI被设置为提供正确答案的回合。

AI-Faulty 试次:实验中AI被设置为提供错误答案的回合,而且错误通常带有"看起来很顺"的诱导性。

效应量(Cohen’s h):衡量比例差异强度的指标。你可以把它理解为"差异有多大",不是只看"有没有显著"。

优势比(Odds Ratio, OR):比较两种条件下事件发生概率的比值。OR大于1代表更容易发生,小于1代表更不容易发生。

Study 1:基线与核心机制

  • Brain-only 正确率约 46.4%
  • AI-Accurate 约 71.0%
  • AI-Faulty 约 31.5%
  • AI接入还把信心抬高了约 11.7个百分点
  • 关键对比效应量Cohen’s h约 0.81,属于很大的差异。

图10:准确率随AI质量的分化——AI正确时大幅提升,AI错误时显著下降。

Study 2:加入时间压力

30秒限时会让系统2更难展开。结果是:

  • 不怎么用AI的人,表现明显下滑。
  • 经常用AI的人,在AI正确时被"托住",在AI错误时被"拖下去"。

换句话说,时间压力没有消灭认知投降,它只是让你更依赖当下最省力的路径。

图11:时间压力下的认知选择——越紧张越依赖快速路径,系统2越难启动。

图12:时间压力下的表现分化——常用AI者随AI质量波动非常明显。

图13:系统3在限时场景中的缓冲与风险——既可能是保护伞,也可能是坠落绳。

Study 3:加入激励与即时反馈

每题给奖励并且即时告诉你对错后:

  • AI错误时的覆写率明显提高。
  • 整体准确率有提升。
  • 但AI-Accurate与AI-Faulty的差距依旧很大,认知投降仍存在。

图14:激励与反馈机制设计——通过奖励和即时反馈尝试激活系统2。

图15:激励反馈降低错误跟随——有激励时,人们更倾向于覆写AI的错误建议。

图16:激励反馈提升整体表现——虽然整体准确率提升,但AI正确与错误时的差距仍然存在。

图17:激励反馈改善AI用户的校准——信心评估更加准确,但认知投降现象仍在。

一张表看懂三项实验

场景关键条件主要结果结论
Study 1基线,随机正确或错误AI46.4% → 71.0%(AI对)/31.5%(AI错)系统3显著重塑准确率
Study 2时间压力(30秒)不常用AI者下滑更大,常用AI者跟随AI质量波动时间压力放大路径依赖
Study 3激励+逐题反馈覆写错误AI明显增加,整体上升,但差距仍在可缓解,难根治

时间压力为什么会放大问题

图18:时间压力如何影响决策——当时间被压缩,系统2难以展开,系统1和系统3的路径依赖更强。

时间压力(Time Pressure):决策窗口被压缩,系统2难以展开。像你在黄灯最后两秒做判断,更容易用最短路径动作。

默认采纳(Default Adoption):在高负荷下,人更倾向沿用现成答案,不主动开新推理链。

时间压力下,人会优先追求"快完成",而不是"高置信求真"。

这不是道德问题,是认知经济学问题。系统2很贵,系统3很快。时间被压扁时,大脑会本能选便宜路线。


激励与反馈能救回来多少

图19:激励与反馈的作用——可以部分激活系统2,但无法根除认知投降。

答案是:能救一部分,但不能全救。

激励和反馈的本质是重新激活系统2。但系统2的启动需要认知资源,而这些资源在时间压力下本身就是稀缺的。

所以你会看到一个有趣的矛盾:激励可以提升准确率,但它同时也让人更依赖AI——因为准确率提升部分恰恰来自于"更乖地听AI的话"。


谁更容易把方向盘交给AI

图20:个体差异分析——哪些人更容易发生认知投降。

论文没有直接回答这个问题,但根据数据可以推测:

  • 高认知负荷者:时间紧迫、任务繁重时。
  • 高自信但低能力者:能力越差越容易盲目相信AI。
  • 习惯性服从者:日常生活中就倾向于顺从权威的人。

核心问题是:你不是因为AI太准而依赖它,而是因为自己太累而放弃思考


把它变成一个可执行的防投降流程

图21:防投降清单——六步法建立AI时代的认知防线。

与其焦虑,不如建立一套防投降流程:

  1. AI输出只是起点,不是终点:拿到AI答案后,先问"它为什么对"而不是"它对不对"。
  2. 强制冷却时间:即使只有30秒,也争取用5秒做一个独立思考。
  3. 问AI的反面:让AI给出反对理由,激活系统2。
  4. 保留决策痕迹:记录自己当时的判断,事后复盘。
  5. 定期做"纯人工"练习:每周至少一次不用AI做决策,保持手感。
  6. 建立个人AI使用黑名单:哪些事情永远不交给AI。

对产品设计者的提醒:不要只优化顺滑度

图22:产品设计警示——过度顺滑的AI交互可能加速认知投降。

如果你是做AI产品,这篇论文有直接的启示:

  • 不要让采纳太顺滑:每次AI给答案时,适当留一个"确认你理解了"的门槛。
  • 刻意制造摩擦:让用户必须自己点一下"我同意这个结论"而非自动采纳。
  • 展示AI的不确定性:让用户知道AI也会错,而不是假装自己很准。
  • 提供对比选项:让用户看到AI的思考过程,而不是只给结论。

顺滑是最危险的,因为顺滑会让人忘记自己正在做判断


从个人到组织:系统3时代的认知治理

图23:认知治理框架——从个体到组织,建立多层防御体系。

个人层面之外,组织也需要考虑:

  • 决策审计:重要决策是否经过了"无AI独立验证"环节?
  • AI依赖指标:团队是否在某些领域已经失去独立判断能力?
  • 培训设计:如何培训员工在使用AI时保持批判性思维?
  • 文化塑造:组织是否鼓励"覆写AI"的文化,还是只看重效率?

图24:三系统路径总览——系统1直觉、系统2审慎、系统3辅助,健康的认知生态需要三者平衡。


结尾:你需要的不是更聪明的AI,而是更清醒的自己

图25:核心结论——AI会越来越强,但人的判断力不会自动变强。

回到最初的问题:你在用AI,还是AI在用你?

这不是一个非黑即白的选择,而是一个需要持续校准的过程。

论文给出了一个清晰的结论:系统3正在改变人类判断的结构,而且这种改变往往是不可逆的

你每用一次AI判断,就少了一次系统2的训练机会。长期来看,这不是"省力",而是"退化"。

但这不意味着不用AI。恰恰相反——正是要用AI,才更需要保持独立判断的能力

就像开车可以用导航,但你仍然需要知道自己在往哪个方向走。

你需要的不是更聪明的AI,而是更清醒的自己。


参考资料

  • Shaw, S. D., & Nave, G. (2026). Thinking-Fast, Slow, and Artificial: How AI is Reshaping Human Reasoning and the Rise of Cognitive Surrender. PsyArXiv.
  • Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.