Skip to content

10.6 防止伪造式思维链

引言:什么是"伪造式思维链"

在真实工程环境中,有一个被广泛忽略却极其危险的问题:AI 有时会生成"看起来非常合理,但本质上是假的思维链"。 这种现象叫 Fake CoT(伪造式思维链)。

10.6.1 什么是 Fake CoT

Fake CoT 指:模型生成了一条结构合理、语言流畅、甚至"逻辑自洽"的推理链,但这条推理链并不真实,也不基于事实。 它比普通错误更可怕,因为它具有欺骗性。

10.6.2 Fake CoT 与普通错误的区别

特征普通推理错误Fake CoT
推理链结构混乱/不完整完整且优雅
逻辑一致性
难以察觉程度
危害中等极高
是否具有欺骗性

10.6.3 Fake CoT 的典型来源

来源说明
模型没有真实知识但被迫"解释"启动补全本能,生成"看起来合理的解释"
过强的 CoT/RPC 结构压迫编造合理的思维链来满足结构要求
自反思被错误使用错误+自反思→更强的 Fake CoT

10.6.4 Fake CoT 的识别信号

信号表现
逻辑完美但缺乏真实证据几乎没有引用外部事实,但推理链极其华丽
语言非常自信"显然""毫无疑问"但没有真实推理依据
推理链完全自证闭环所有推理只引用自己说的内容,不引用外部事实

10.6.5 工程级 Fake CoT 防御框架

层级检查内容
前提真实性检查题目是否有足够信息?是否存在未知数据?
推理链真实性校对哪些是"事实",哪些是"推断",哪些是"假设"
最终答案真实性验证是否存在可验证的依据?是否可以被交叉验证?

10.6.6 防御 Prompt 模板

在回答问题之前,请执行以下步骤:

1. 判断信息是否充分:
   - 如果信息不足,必须说明原因,不得编造

2. 在推理过程中:
   - 指明哪些是事实
   - 指明哪些是推断
   - 指明哪些是假设

3. 在最终答案阶段:
   - 评估答案可信度
   - 若存在不确定性,必须标记

本节小结

关键要点

  1. Fake CoT 是"看起来很合理但其实是假的推理链"
  2. 比普通错误更危险,因为具有欺骗性
  3. 防御方式:前提检查+推理拆分+可信度评估
  4. Agent 系统必须强制启用 Fake CoT 防御机制

第 10 章(推理控制技术)已全部完成。接下来我们将进入第 11 章 · Few-shot 与示例工程