8.4 模型参数（Temperature、Top-p）的作用

引言：为什么工程师必须理解模型采样参数

无论是 ChatGPT、Claude、Gemini 还是企业 API，模型都暴露了两个关键参数：Temperature（温度） 和 Top-p（核采样）。这两个参数控制着模型生成文本时的创造性、稳定性、多样性和一致性。

大模型在每一步生成 token 时，会得到一个概率分布。模型不会永远选概率最高的词，因为那样所有回答都一样。于是模型进行"采样"，而 Temperature、Top-p 就是调控"采样策略"的关键。

Top-p 的含义：从概率从高到低开始累积，当概率和达到 p，则只从这部分 token 中采样。

Top-p	效果
越低	token 候选越少，输出越稳定
越高	token 候选越多，输出越丰富多样

参数	控制方式	效果
Temperature	调整概率分布的"陡峭度"	控制模型是否"敢跳"
Top-p	限定可采样 token 的概率范围	控制候选范围大小

最简单直觉：Temperature = 调性（个性、风格），Top-p = 剪枝（候选空间）

任务类型	Temperature	Top-p	适用场景
严谨任务	0.0 ~ 0.2	0.7 ~ 1.0	编程、推理、法律、医疗
中度创造性	0.5 ~ 0.7	0.8 ~ 1.0	写作、脚本、文案（推荐默认值）
高度创造性	0.8 ~ 1.2	0.9 ~ 1.0	故事、诗歌、创意脑暴
企业生产环境	0.2	0.9	高一致性要求

策略	Temperature	Top-p	适用场景
高稳定策略	0.1	0.8	专业分析、代码
平衡策略	0.7	1.0	通用聊天、写作
创造力极强策略	1.0	1.0	文案、艺术
高一致性策略	0.2	0.9	企业生产环境

关键要点

模型参数是技术原理的重要组成，接下来我们将学习：模型能力边界与局限性。