8.5 不同模型之间的行为差异

引言：为什么提示词工程师必须理解"不同模型的行为差异"

不同模型 = 不同推理风格 = 不同提示词策略。就像不同司机会对同一条路线做不同判断，不同模型对同一 Prompt 的理解方式也完全不一样。

8.5.1 模型之间为什么会有行为差异

原因	说明
训练数据不同	Claude偏向高质量长文本，GPT覆盖更广泛，Gemini强调多模态
对齐方式不同	每家公司对模型施加的规则、行为限制、风格偏好都不同
架构差异	Claude用宪法式AI，GPT强调RLHF，Gemini用统一多模态架构

8.5.2 GPT 系列特点

维度	说明
优点	输出稳定、风格一致、擅长结构化任务、System Prompt遵从度高
行为特点	遵守格式严格、喜欢按步骤拆解、保守可靠型推理
最适合	System Prompt、CoT推理、多阶段Pipeline、结构化文档生成

8.5.3 Claude 系列特点

维度	说明
优点	润写能力强、创造性强、多轮对话表现突出、CoT质量高
行为特点	温和礼貌解释性、行文自然像真人、对Example敏感度强
最适合	写作、文案、创意生成、风格模仿、长对话与角色扮演

8.5.4 Gemini 系列特点

维度	说明
优点	强大的多模态整合能力、理解图片视频音频更自然
行为特点	视觉任务表现最强、偏直觉型推理、经常跳步
最适合	图像理解、视频分析、视觉+文字组合任务、多模态内容生成

8.5.5 LLaMA 系列特点

维度	说明
优点	开源可本地部署、可微调可训练、速度快、内存占用低
行为特点	对指令敏感度较低、更依赖结构化提示词和示例
最适合	高结构化prompt、强约束输出、本地任务、行业微调场景

8.5.6 不同模型对提示词技巧的反应

Prompt 技巧	GPT	Claude	Gemini	LLaMA
结构化提示词	★★★★★稳定	★★★★灵活	★★★不稳定	★★★★★依赖
CoT 推理	★★★★★强	★★★★★强	★★★易跳步	★★★
Few-shot	★★★★稳	★★★★★敏感	★★★★	★★★★★必要
风格模仿	★★★稳重	★★★★★强	★★★	★★★
多模态提示	★★★	★★★★	★★★★★最强	★★
System Prompt遵从度	★★★★★	★★★★	★★★	★★★

8.5.7 为不同模型写提示词的最佳策略

模型	策略
GPT	用结构、用规则、用步骤、用明确格式、少废话
Claude	多解释性语言、多语义引导、可加示例稳定风格、少硬约束
Gemini	任务可多模态化、加短句加分块、对逻辑任务加CoT强制
LLaMA	必须结构化、必须Few-shot、必须清晰输出格式、减少模糊表达

本节小结

关键要点

不同模型有不同"推理个性"
GPT：结构化强、稳定性高
Claude：风格自然、创造性强
Gemini：多模态强、逻辑略弱
LLaMA：依赖结构化、开源可控
专业提示词工程师必须为不同模型重写 Prompt

第 8 章（提示词工程的技术原理）已全部完成。接下来我们将进入第 9 章 · System Prompt 工程。