做 AI Agent 的团队都有一个通病:模型表现不好,第一反应就是改 Prompt。加约束、换话术、写更长的指令……改了十几版还是不行,最后得出结论——“模型不行”。
但真相往往是:你的 Prompt 没问题,问题出在你根本没注意的地方。
北大博士后卢菁博士最近提出了一个很清晰的框架:AI 工程化已经经历了三个阶段,每个阶段的"主战场"完全不同。2026 年还在死磕 Prompt 的团队,本质上是在用 2023 年的方法解决 2026 年的问题。
第一阶段:学会"怎么问"(2020-2023)#
GPT-3 刚出来的时候,所有人都在玩一个游戏:同一个模型,换个问法,结果天差地别。
这个阶段的核心技能就是 Prompt Engineering:
- 角色设定:告诉模型"你是一个资深的 XX 专家"
- 少样本提示:给几个例子,让模型照着做
- 思维链(CoT):让模型"一步一步思考"
- 格式约束:规定输出必须是 JSON / Markdown 等格式
说白了,这个阶段是在学习怎么做一个会提问的人。
但问题来了——当你的任务从"帮我写封邮件"升级到"帮我处理一个完整的开发流程"时,一句精心设计的 Prompt 根本撑不住这种复杂度。你不可能在一句话里塞进所有的状态管理、错误处理和工具调用逻辑。
第二阶段:学会"给什么"(2024-2025)#
大模型的上下文窗口从 4K 飙到 128K 甚至 200K+,很多人觉得"终于可以把所有信息都塞进去了"。
但 Context Engineering 的核心理念恰恰相反:这是一门减法的艺术。
往上下文里塞一堆无关信息,不仅浪费 Token(浪费钱),更致命的是会干扰模型的注意力机制。LLM 本质上是在做注意力加权,信息越多,注意力越分散,输出质量反而下降。
Context Engineering 要解决的问题是:
- 检索什么知识? 从知识库里找到真正相关的片段,而不是一股脑全丢进去
- 保留什么记忆? 多轮对话中哪些历史信息有价值,哪些该丢掉
- 裁剪什么噪声? 用完即删,保持上下文的"干净度"
打个比方:Prompt Engineering 是在研究"怎么跟模型说话",Context Engineering 是在研究"让模型在什么环境里工作"。一个好的工作环境,比一句好的指令重要得多。
第三阶段:学会"搭环境"(2025 至今)#
这是当前正在爆发的阶段,也是最被低估的。
Harness Engineering 里的 Harness 原意是马具——套在马身上控制方向、保持稳定的装备。在 AI 领域,它指的是围绕大模型搭建的整套"脚手架"系统。
现在的 Agent 不只是聊天,它要干活:读写代码、跑测试、查数据库、调 API、在多个子任务之间跳转。这种复杂度下,纯靠指令已经摸到天花板了。
Harness 要管的事情包括:
- 任务编排:把一个大任务拆成多步,按顺序执行,处理分支和依赖
- 状态管理:Agent 执行到哪一步了?中间结果是什么?失败了从哪里恢复?
- 工具调用协议:模型怎么知道什么时候该调哪个工具?参数怎么传?
- 输出验证:模型返回的结果是否合规?格式对不对?有没有幻觉?
- 安全护栏:不能让 Agent 越权操作,不能泄露敏感信息
一句话总结:决定 Agent 表现上限的,不是模型本身,而是你为它搭建的运行环境。
诊断:你的 Agent 到底卡在哪?#
如果你的 AI 应用效果不好,别急着改 Prompt,先按这个框架排查:
| 症状 | 可能原因 | 解法方向 |
|---|---|---|
| 回复不准确、答非所问 | 没检索到正确的知识 | 优化 Context:改进 RAG 检索策略 |
| 执行一步就卡住 | 缺少状态管理和任务编排 | 优化 Harness:加工作流引擎 |
| 胡说八道、编造事实 | 缺少输出验证和安全护栏 | 优化 Harness:加校验层 |
| 格式不对、不稳定 | Prompt 约束不够 | 优化 Prompt:但这是最简单的部分 |
大多数团队的问题其实卡在 Context 和 Harness 层,但他们一直在改 Prompt。就像车开不快,拼命调座椅,却没发现是发动机和变速箱的问题。
写在最后#
从 2023 年的"简单对话"到 2026 年的"全能代理",AI 工程的重心已经从模型本身转移到了模型之外。
早期的思路是:模型不行就换大的。中期的思路是:模型大了就写更好的 Prompt。而现在的现实是:模型已经够强了,真正卡住你的是上下文管理和系统架构。
如果你正在做 AI Agent,建议先停下来审视一下:你的上下文pipeline 够不够精炼?你的 Harness 够不够完善?把这两层搞好了,效果提升会比改 100 版 Prompt 都来得明显。
参考来源:2026 年还玩 Prompt Engineering?架构师都在卷这两个新东西! — Dr.LuAIclass 卢菁(北大博士后、AI 专家)
