Agent 架构前沿理念(2025–2026)
上一篇《Agent 架构双轴框架》提出用「七脉六式」给每个 Agent 模式一个唯一坐标。这篇是它的配套更新:把 2025–2026 年业界冒出来的新设计理念逐一梳理,并对照回那套框架——哪些是旧模式换了新名字、哪些是真正的新维度、哪些填补了原框架的薄弱格子。
一句话结论:七脉六式和当前业界共识高度重合,但近一年有三个方向值得补进去——上下文工程把「感知脉」升格成一门独立学科、长任务的上下文管理战术(压缩/卸载/子代理隔离)填实了「记忆」和「协作」两脉、而「反思回流记忆」则点出了框架原本缺失的脉间耦合。
一、业界已收敛成「7 大模式」
先看共识。2026 年,Agent 设计模式基本固定成 7 个,它们和七脉一一对应:
| 业界模式 | 对应的脉 | 说明 |
|---|---|---|
| ReAct | 推理 + 行动 | 推理与工具调用交替(Reason + Act) |
| Planning(Plan-and-Execute) | 推理 × 编排 | 先规划再执行 |
| Tool Use | 行动 | 工具调用 |
| Reflection | 反思 | 自我批评与修正 |
| Evaluator-Optimizer | 反思 × 循环 | 一个生成、一个打分,迭代优化 |
| Multi-Agent Collaboration | 协作 | 多 Agent 分工 |
| Human-in-the-Loop | 治理 | 关键步骤插入人工确认 |
注意 Evaluator-Optimizer(评估器-优化器) 并不是新维度——它就是双轴框架里「反思 × 循环 = 自愈循环」那一格的别名:一个 Generator 产出结果,一个 Evaluator 按标准打分,不达标就退回重做,直到达标或到迭代上限。
判断:业界是列清单,双轴框架是给坐标。两者不冲突,框架是这套共识的「正交化升级版」。
一个可以拿来做选型论据的量化数据:Plan-and-Execute(推理 × 编排)实测任务完成率可达 92%,比串行 ReAct 快约 3.6 倍——因为规划阶段一次性想清楚步骤,执行阶段就能并行、少走回头路。这正好支撑「ROUTE 选型」里「中等复杂 + 多步骤 → Orchestrate」的判断。
二、新理念一:上下文工程(Context Engineering)
这是 2025 年最大的范式转变,本质是把双轴框架里的「感知脉」从七脉之一,升格成贯穿全局的一级工程学科。
从「提示工程」到「上下文工程」
2025 年 6 月,Andrej Karpathy 提出用「上下文工程」取代「提示工程」,定义是:
「恰到好处地用正确信息填满上下文窗口,为下一步做准备」——这是一门精细的艺术与科学。
2025 年 9 月 Anthropic 跟进,把核心问题重新表述为:
关键不再是「怎么措辞」(prompt engineering),而是「什么样的上下文配置,最可能让模型产生我们期望的行为」(context engineering)。
这和双轴框架的核心判断「Model spends, harness budgets」是同一回事:上下文窗口是稀缺资源,harness 要精打细算地决定「什么信息进入模型」。
为什么是「工程」而不只是「技巧」
「提示」这个词暗示你只在写一段话;但工业级 Agent 要管理的远不止一段话:任务描述、少样本示例、RAG 检索结果、多模态数据、工具定义、运行状态、历史对话——这些都要动态地、按需地拼进上下文。
举个具体例子:一个客服 Agent 处理一个退款请求,上下文里要不要塞进用户三个月前的聊天记录?塞了是噪声、占注意力;不塞可能丢关键背景。这个「塞什么、塞多少、什么时候塞」的决策,就是上下文工程——它显然不是「写好一句 prompt」能覆盖的。
三、新理念二:长任务的上下文管理三件套
当任务变长(几十步、几小时),上下文窗口迟早会被撑爆。Anthropic 把应对手段总结成三招——它们填实了双轴框架里「记忆」和「协作」两脉的具体战术。
1. Compaction(压缩)
做法:当对话接近上下文窗口上限时,把已有内容总结成摘要,用这份摘要重新初始化一个新的上下文窗口,继续往下跑。
类比:你和同事开了三小时长会,中途有人把前两小时的结论写成一页纪要,后面的人只看纪要继续讨论,而不必回放整段录音。
落在双轴框架:记忆 × 循环。原框架这一格写的是「失败日志」,Compaction 是它的自然扩展——不只记失败,而是周期性地把整个历史蒸馏成摘要。
2. 结构化笔记 / 外部记忆(Note-taking)
做法:让 Agent 把关键状态写进外部文件,而不是全堆在上下文里;需要时再读回来。
类比:人脑记不住所有细节,于是用笔记本、待办清单。Agent 把「当前进度、已知事实、待办项」写进一个
progress.md,下一轮只读这个文件,而不是重新扫一遍全部历史。
落在双轴框架:记忆 × 链式,但介质从「向量数据库」换成了「文件系统」——这是一个值得注意的工程趋势:用文件系统当 Agent 的外部记忆,简单、可审计、可人工干预。
3. Subagents:子代理上下文隔离
做法:把探索性的脏活交给子代理(subagent)。子代理可以烧掉几万 token 去翻文档、试方案,但只向主代理回传一份 1–2K token 的蒸馏摘要。主代理的上下文始终保持干净,只负责综合。
类比:CEO 不会去读每份原始调研报告,而是让各部门主管各自调研,每人交一页摘要上来。CEO 的「上下文」(注意力)只装这几页摘要,而非成百上千页原始材料。
落在双轴框架:协作 × 层级。但 Anthropic 强调的重点和原框架不同——原框架强调「任务怎么拆」,这里强调「上下文怎么隔离」。这恰好是协作脉失败信号「大家都拿全量上下文 = 噪声淹没」的正面解法:通过子代理隔离,让每个 Agent 只看到它该看的。
| 技术 | 解决的问题 | 落在双轴框架 |
|---|---|---|
| Compaction 压缩 | 历史太长撑爆窗口 | 记忆 × 循环 |
| 结构化笔记 | 状态需要跨轮持久 | 记忆 × 链式(文件系统当记忆) |
| Subagent 隔离 | 多 Agent 互相污染上下文 | 协作 × 层级(强调隔离) |
四、新理念三:Deep Agents 与新执行循环
LangChain 在 2025 年把一类「能处理复杂多步任务」的 Agent 模式抽象成 Deep Agents,并开源成 SDK。它对双轴框架的「六式」是一个潜在补充。
从 Reason-Act 到 Plan-Delegate-Execute-Synthesize
经典 ReAct 是 Reason → Act 的简单循环。Deep Agents 换成了一个更重的骨架:
Plan(规划)→ Delegate(委派)→ Execute(执行)→ Synthesize(综合)它本质上是「推理 × 编排」+「协作 × 层级」的组合骨架——先规划、把子任务委派给子代理、各自执行、最后综合。
两个值得吸收的新机制
做法:当某个工具返回的结果超过阈值(如 20,000 token)时,自动把完整结果写到磁盘,在上下文里只留下「文件路径 + 前 10 行预览」。需要细节时再按路径读回。
工具返回 35,000 token 的日志
↓ 超过 20K 阈值,触发卸载
上下文里只保留:
/tmp/tool_result_abc.txt
----(前 10 行预览)----
[2026-06-24 10:01:02] INFO starting...
[2026-06-24 10:01:03] WARN retrying...
... (还有 1240 行,需要时读取文件)类比:你不会把整本字典背进脑子,而是记住「字典在书架第三格」,要查时再去翻。
这是「感知 × 行动」的一个新打法——双轴框架的 42 格矩阵里原本没有对应格子,可以视为一个新增模式。
五、新理念四:反思回流记忆(ACE 自进化剧本)
这是双轴框架真正缺失的一个维度:脉与脉之间的耦合。
代表性工作是 Agentic Context Engineering(ACE),结构为三角色:
Generator(生成器)→ 用当前「剧本 playbook」处理任务
↓
Reflector(反思器)→ 评估这次做得好不好、哪里成功哪里失败
↓
Curator(策展器)→ 把经验提炼成结构化条目,更新进剧本
↓
(下一轮 Generator 用更新后的剧本,循环自我改进)两个关键点:
- 上下文表示成「一条条结构化 bullet」,而不是一整块 monolithic prompt——便于增量更新、便于定位哪条经验有用。
- 反思的产物会回流进记忆,形成自改进闭环:这次踩的坑,下次写进剧本就不再踩。
举例:一个写 SQL 的 Agent,第一次因为没加
LIMIT把库查崩了。反思器记下「大表查询要加 LIMIT」,策展器把这条写进剧本。下次它处理同类任务时,剧本里已经有这条经验,直接避坑——而不是每次重新犯错。
六、新理念五:治理的上游——意图与规范工程
学术界提出了一个「工程金字塔」成熟度模型,在「上下文工程」之上再加两层,把双轴框架的「治理脉」往上游延伸:
| 层 | 名称 | 做什么 |
|---|---|---|
| 意图工程 | Intent Engineering | 把组织目标、价值观、权衡优先级,编码进 Agent 基础设施,确保它追求「正确的结果」 |
| 规范工程 | Specification Engineering | 把公司政策、质量标准、组织约定做成机器可读语料,让多 Agent 系统能大规模自洽运行 |
对照双轴框架:治理脉原本管的是「运行时管控」(限制、记录、审计——动作发生时拦一道)。意图/规范工程是「设计时注入」(在 Agent 跑起来之前,就把组织的目标和红线写进它的基础设施)。可以视为 Governance 脉的 v2 方向:从「事中拦截」走向「事前对齐」。
举个例子:一个能动用预算的采购 Agent,运行时治理是「单笔超过 1 万要审批」;意图工程则是预先把「优先选有长期合作的供应商、同等价格下选本地厂商」这类组织偏好编码进去——后者让 Agent 在没人盯着时也朝正确方向走。
七、框架之外:基础设施层的新动向
这些不属于单个 Agent 的内部设计,而是「Agent 互联网」的基础设施,简单记录:
- 协议标准化:MCP(Agent ↔ 工具)+ A2A(Agent ↔ Agent)已成主流(详见《A2A 多 Agent 协作通信》)。新冒出的有 AgentDNS 这类给 Agent 做「根域名解析与服务发现」的设施——类比互联网的 DNS,让 Agent 能按名字找到彼此。
- 定位升级:2026 年的行业共识是,Agent 已从「实验」变成「自动化平台的第三层」,与 RPA、BPM 并列。Gartner 预测到 2026 年,40% 的企业应用会内嵌 AI Agent(2025 年还不到 5%)。
- 长程推理研究:COMPASS(演进式上下文)等工作,都在正面攻双轴框架「复合错误公理」描述的核心难题——链越长,单步误差复合得越狠。
八、汇总:新理念 × 双轴框架对照表
| 新理念 | 关系 | 落在 / 补充哪里 |
|---|---|---|
| 7 大模式共识 | 重合 | 七脉的清单版,Evaluator-Optimizer = 反思 × 循环 |
| Context Engineering | 升格 | 感知脉学科化,贯穿全局 |
| Compaction 压缩 | 填实 | 记忆 × 循环 |
| 结构化笔记 / 外部记忆 | 填实 | 记忆 × 链式(文件系统当记忆) |
| Subagent 上下文隔离 | 填实 | 协作 × 层级(强调隔离而非拆分) |
| Context Offloading 卸载 | 新增 | 感知 × 行动(原矩阵无此格) |
| Middleware 中间件 | 工程载体 | 治理脉的 harness 实现 |
| ACE 反思回流记忆 | 新维度 | 脉间耦合:反思 → 记忆(原框架缺失) |
| Intent / Spec 工程 | 上游延伸 | 治理脉 v2:事前对齐 |
一句话小结
双轴框架的骨架(资源得失 × 错误路径)依然成立,但 2025–2026 给它补了三块肌肉:上下文工程把感知做成了学科、上下文管理三件套把记忆和协作做成了战术、反思回流记忆点出了框架原本缺的脉间闭环。 选型时,先用七脉六式定坐标,再用这些前沿战术填具体打法。