跳至内容
Agent 架构前沿理念(2025–2026)

Agent 架构前沿理念(2025–2026)

上一篇《Agent 架构双轴框架》提出用「七脉六式」给每个 Agent 模式一个唯一坐标。这篇是它的配套更新:把 2025–2026 年业界冒出来的新设计理念逐一梳理,并对照回那套框架——哪些是旧模式换了新名字、哪些是真正的新维度、哪些填补了原框架的薄弱格子。

一句话结论:七脉六式和当前业界共识高度重合,但近一年有三个方向值得补进去——上下文工程把「感知脉」升格成一门独立学科、长任务的上下文管理战术(压缩/卸载/子代理隔离)填实了「记忆」和「协作」两脉、而「反思回流记忆」则点出了框架原本缺失的脉间耦合。

一、业界已收敛成「7 大模式」

先看共识。2026 年,Agent 设计模式基本固定成 7 个,它们和七脉一一对应:

业界模式对应的脉说明
ReAct推理 + 行动推理与工具调用交替(Reason + Act)
Planning(Plan-and-Execute)推理 × 编排先规划再执行
Tool Use行动工具调用
Reflection反思自我批评与修正
Evaluator-Optimizer反思 × 循环一个生成、一个打分,迭代优化
Multi-Agent Collaboration协作多 Agent 分工
Human-in-the-Loop治理关键步骤插入人工确认

注意 Evaluator-Optimizer(评估器-优化器) 并不是新维度——它就是双轴框架里「反思 × 循环 = 自愈循环」那一格的别名:一个 Generator 产出结果,一个 Evaluator 按标准打分,不达标就退回重做,直到达标或到迭代上限。

判断:业界是列清单,双轴框架是给坐标。两者不冲突,框架是这套共识的「正交化升级版」。

一个可以拿来做选型论据的量化数据:Plan-and-Execute(推理 × 编排)实测任务完成率可达 92%,比串行 ReAct 快约 3.6 倍——因为规划阶段一次性想清楚步骤,执行阶段就能并行、少走回头路。这正好支撑「ROUTE 选型」里「中等复杂 + 多步骤 → Orchestrate」的判断。

二、新理念一:上下文工程(Context Engineering)

这是 2025 年最大的范式转变,本质是把双轴框架里的「感知脉」从七脉之一,升格成贯穿全局的一级工程学科

从「提示工程」到「上下文工程」

2025 年 6 月,Andrej Karpathy 提出用「上下文工程」取代「提示工程」,定义是:

「恰到好处地用正确信息填满上下文窗口,为下一步做准备」——这是一门精细的艺术与科学。

2025 年 9 月 Anthropic 跟进,把核心问题重新表述为:

关键不再是「怎么措辞」(prompt engineering),而是「什么样的上下文配置,最可能让模型产生我们期望的行为」(context engineering)。

这和双轴框架的核心判断「Model spends, harness budgets」是同一回事:上下文窗口是稀缺资源,harness 要精打细算地决定「什么信息进入模型」。

为什么是「工程」而不只是「技巧」

「提示」这个词暗示你只在写一段话;但工业级 Agent 要管理的远不止一段话:任务描述、少样本示例、RAG 检索结果、多模态数据、工具定义、运行状态、历史对话——这些都要动态地、按需地拼进上下文。

举个具体例子:一个客服 Agent 处理一个退款请求,上下文里要不要塞进用户三个月前的聊天记录?塞了是噪声、占注意力;不塞可能丢关键背景。这个「塞什么、塞多少、什么时候塞」的决策,就是上下文工程——它显然不是「写好一句 prompt」能覆盖的。

对照双轴框架:上下文工程 ≈ 感知脉的学科化。框架把感知当成七脉之一(一个局部预算问题),业界则把它拎出来当成贯穿全局的一级学科。两种视角互补:框架给你「感知会在哪失控」的定位,上下文工程给你「怎么系统性管理感知」的方法论。

三、新理念二:长任务的上下文管理三件套

当任务变长(几十步、几小时),上下文窗口迟早会被撑爆。Anthropic 把应对手段总结成三招——它们填实了双轴框架里「记忆」和「协作」两脉的具体战术。

1. Compaction(压缩)

做法:当对话接近上下文窗口上限时,把已有内容总结成摘要,用这份摘要重新初始化一个新的上下文窗口,继续往下跑。

类比:你和同事开了三小时长会,中途有人把前两小时的结论写成一页纪要,后面的人只看纪要继续讨论,而不必回放整段录音。

落在双轴框架:记忆 × 循环。原框架这一格写的是「失败日志」,Compaction 是它的自然扩展——不只记失败,而是周期性地把整个历史蒸馏成摘要。

2. 结构化笔记 / 外部记忆(Note-taking)

做法:让 Agent 把关键状态写进外部文件,而不是全堆在上下文里;需要时再读回来。

类比:人脑记不住所有细节,于是用笔记本、待办清单。Agent 把「当前进度、已知事实、待办项」写进一个 progress.md,下一轮只读这个文件,而不是重新扫一遍全部历史。

落在双轴框架:记忆 × 链式,但介质从「向量数据库」换成了「文件系统」——这是一个值得注意的工程趋势:用文件系统当 Agent 的外部记忆,简单、可审计、可人工干预。

3. Subagents:子代理上下文隔离

做法:把探索性的脏活交给子代理(subagent)。子代理可以烧掉几万 token 去翻文档、试方案,但只向主代理回传一份 1–2K token 的蒸馏摘要。主代理的上下文始终保持干净,只负责综合。

类比:CEO 不会去读每份原始调研报告,而是让各部门主管各自调研,每人交一页摘要上来。CEO 的「上下文」(注意力)只装这几页摘要,而非成百上千页原始材料。

落在双轴框架:协作 × 层级。但 Anthropic 强调的重点和原框架不同——原框架强调「任务怎么拆」,这里强调「上下文怎么隔离」。这恰好是协作脉失败信号「大家都拿全量上下文 = 噪声淹没」的正面解法:通过子代理隔离,让每个 Agent 只看到它该看的。

技术解决的问题落在双轴框架
Compaction 压缩历史太长撑爆窗口记忆 × 循环
结构化笔记状态需要跨轮持久记忆 × 链式(文件系统当记忆)
Subagent 隔离多 Agent 互相污染上下文协作 × 层级(强调隔离)

四、新理念三:Deep Agents 与新执行循环

LangChain 在 2025 年把一类「能处理复杂多步任务」的 Agent 模式抽象成 Deep Agents,并开源成 SDK。它对双轴框架的「六式」是一个潜在补充。

从 Reason-Act 到 Plan-Delegate-Execute-Synthesize

经典 ReAct 是 Reason → Act 的简单循环。Deep Agents 换成了一个更重的骨架:

Plan(规划)→ Delegate(委派)→ Execute(执行)→ Synthesize(综合)

它本质上是「推理 × 编排」+「协作 × 层级」的组合骨架——先规划、把子任务委派给子代理、各自执行、最后综合。

两个值得吸收的新机制

做法:当某个工具返回的结果超过阈值(如 20,000 token)时,自动把完整结果写到磁盘,在上下文里只留下「文件路径 + 前 10 行预览」。需要细节时再按路径读回。

工具返回 35,000 token 的日志
        ↓  超过 20K 阈值,触发卸载
上下文里只保留:
  /tmp/tool_result_abc.txt
  ----(前 10 行预览)----
  [2026-06-24 10:01:02] INFO  starting...
  [2026-06-24 10:01:03] WARN  retrying...
  ... (还有 1240 行,需要时读取文件)

类比:你不会把整本字典背进脑子,而是记住「字典在书架第三格」,要查时再去翻。

这是「感知 × 行动」的一个新打法——双轴框架的 42 格矩阵里原本没有对应格子,可以视为一个新增模式。

五、新理念四:反思回流记忆(ACE 自进化剧本)

这是双轴框架真正缺失的一个维度:脉与脉之间的耦合。

代表性工作是 Agentic Context Engineering(ACE),结构为三角色:

Generator(生成器)→ 用当前「剧本 playbook」处理任务
Reflector(反思器)→ 评估这次做得好不好、哪里成功哪里失败
Curator(策展器)→ 把经验提炼成结构化条目,更新进剧本
(下一轮 Generator 用更新后的剧本,循环自我改进)

两个关键点:

  • 上下文表示成「一条条结构化 bullet」,而不是一整块 monolithic prompt——便于增量更新、便于定位哪条经验有用。
  • 反思的产物会回流进记忆,形成自改进闭环:这次踩的坑,下次写进剧本就不再踩。

举例:一个写 SQL 的 Agent,第一次因为没加 LIMIT 把库查崩了。反思器记下「大表查询要加 LIMIT」,策展器把这条写进剧本。下次它处理同类任务时,剧本里已经有这条经验,直接避坑——而不是每次重新犯错。

对照双轴框架:原框架把「反思」和「记忆」当成两条独立的脉。ACE 揭示了一个原框架没覆盖的方向——反思(Reflection)的产物应当回流进记忆(Memory)。这不是某一格的模式,而是脉间的耦合。如果给框架升级,这是值得新增的一条:在七脉之外,标注「哪些脉之间应该闭环」。

六、新理念五:治理的上游——意图与规范工程

学术界提出了一个「工程金字塔」成熟度模型,在「上下文工程」之上再加两层,把双轴框架的「治理脉」往上游延伸:

名称做什么
意图工程Intent Engineering把组织目标、价值观、权衡优先级,编码进 Agent 基础设施,确保它追求「正确的结果」
规范工程Specification Engineering把公司政策、质量标准、组织约定做成机器可读语料,让多 Agent 系统能大规模自洽运行

对照双轴框架:治理脉原本管的是「运行时管控」(限制、记录、审计——动作发生时拦一道)。意图/规范工程是「设计时注入」(在 Agent 跑起来之前,就把组织的目标和红线写进它的基础设施)。可以视为 Governance 脉的 v2 方向:从「事中拦截」走向「事前对齐」。

举个例子:一个能动用预算的采购 Agent,运行时治理是「单笔超过 1 万要审批」;意图工程则是预先把「优先选有长期合作的供应商、同等价格下选本地厂商」这类组织偏好编码进去——后者让 Agent 在没人盯着时也朝正确方向走。

七、框架之外:基础设施层的新动向

这些不属于单个 Agent 的内部设计,而是「Agent 互联网」的基础设施,简单记录:

  • 协议标准化:MCP(Agent ↔ 工具)+ A2A(Agent ↔ Agent)已成主流(详见《A2A 多 Agent 协作通信》)。新冒出的有 AgentDNS 这类给 Agent 做「根域名解析与服务发现」的设施——类比互联网的 DNS,让 Agent 能按名字找到彼此。
  • 定位升级:2026 年的行业共识是,Agent 已从「实验」变成「自动化平台的第三层」,与 RPA、BPM 并列。Gartner 预测到 2026 年,40% 的企业应用会内嵌 AI Agent(2025 年还不到 5%)。
  • 长程推理研究:COMPASS(演进式上下文)等工作,都在正面攻双轴框架「复合错误公理」描述的核心难题——链越长,单步误差复合得越狠。

八、汇总:新理念 × 双轴框架对照表

新理念关系落在 / 补充哪里
7 大模式共识重合七脉的清单版,Evaluator-Optimizer = 反思 × 循环
Context Engineering升格感知脉学科化,贯穿全局
Compaction 压缩填实记忆 × 循环
结构化笔记 / 外部记忆填实记忆 × 链式(文件系统当记忆)
Subagent 上下文隔离填实协作 × 层级(强调隔离而非拆分)
Context Offloading 卸载新增感知 × 行动(原矩阵无此格)
Middleware 中间件工程载体治理脉的 harness 实现
ACE 反思回流记忆新维度脉间耦合:反思 → 记忆(原框架缺失)
Intent / Spec 工程上游延伸治理脉 v2:事前对齐

一句话小结

双轴框架的骨架(资源得失 × 错误路径)依然成立,但 2025–2026 给它补了三块肌肉:上下文工程把感知做成了学科、上下文管理三件套把记忆和协作做成了战术、反思回流记忆点出了框架原本缺的脉间闭环。 选型时,先用七脉六式定坐标,再用这些前沿战术填具体打法。

最后更新于