Skip to content

9.3 Modes / Constraints / Safety 的高级设计

引言:为什么这三部分决定模型"可控、可靠、安全"

在上一节完成了 System Prompt 的灵魂三段(Identity/Goals/Behaviors)后,还需要进一步控制模型在不同情况、不同任务、不同风险场景下:如何切换思维模式、如何保持边界、如何遵守安全规范。

9.3.1 Modes(模式设计):让模型在不同任务下切换"推理风格"

大多数任务不是单一模式,而是推理、写作、解释、总结、分析等多种类型。Modes 的本质是"为不同任务定义不同工作流"。

模式推理策略
推理模式使用逐步推理、避免跳步、展示因果链、输出清晰结论
写作模式先明确风格、先列出结构、再生成内容
分析模式提取关键点、按类别分组、使用逻辑结构呈现

9.3.2 Modes 设计四步法

步骤说明
识别常见任务类型分析、推理、写作、规划、格式输出
为每种模式定义推理策略明确每种模式的工作方式
明确模式切换条件检测到"写"、"生成文章"时进入写作模式
在 System Prompt 中清晰呈现结构化列出所有模式

9.3.3 Constraints(限制):让模型不越界、不发散

Constraints 是 System Prompt 中最"工程化"的部分,是"AI 是否稳定"的关键因素。

结构说明
信息限制不得使用未提供的外部知识、不得编造事实
输出限制不得改变输出格式、不得输出未要求的内容
任务限制必须严格围绕用户请求作答、不得扩展到无关内容
行为限制不得猜测用户意图、遇到歧义必须先询问澄清

9.3.4 Safety(安全设计):保护用户、系统和模型

Safety 是模型的底层"刹车系统",即使模型有强推理能力,Safety 仍然必须存在。

模块说明
内容安全不得生成违法、危险或违规内容
伦理与偏见不得基于种族、性别等做价值判断
安全优先级遇到危险请求必须拒绝并提供安全替代方案

9.3.5 三者协同工作

模块作用
Modes控制模型"怎么工作"
Constraints控制模型"不能做什么"
Safety控制模型"不应该做什么"

9.3.6 工程级模板

# Modes(模式)
1. 推理模式:逐步推理,展示逻辑链
2. 写作模式:明确风格→列结构→写内容
3. 分析模式:提取要点→分类整理→输出结构化分析

# Constraints(限制)
- 不得编造事实
- 不得使用未提供的外部知识
- 不得扩展无关内容
- 遇到歧义必须询问澄清

# Safety(安全)
- 不得生成违法、危险、攻击性内容
- 保持伦理、公平、尊重
- 遇到敏感请求必须拒绝并提供安全替代方案

本节小结

关键要点

  1. Modes 决定"模型如何切换思维方式"
  2. Constraints 决定"模型不能做什么"
  3. Safety 决定"模型不应该做什么"
  4. 这三者让系统提示词变得可控、安全、稳定
  5. System Prompt 的工程化本质是设计稳定的工作流与边界

Modes/Constraints/Safety 是系统提示词的稳定核心,接下来我们将学习:Output Format 与 Verification