Agent 架构前沿理念（2025–2026）

上一篇《Agent 架构双轴框架》提出用「七脉六式」给每个 Agent 模式一个唯一坐标。这篇是它的配套更新：把 2025–2026 年业界冒出来的新设计理念逐一梳理，并对照回那套框架——哪些是旧模式换了新名字、哪些是真正的新维度、哪些填补了原框架的薄弱格子。

一句话结论：七脉六式和当前业界共识高度重合，但近一年有三个方向值得补进去——上下文工程把「感知脉」升格成一门独立学科、长任务的上下文管理战术（压缩/卸载/子代理隔离）填实了「记忆」和「协作」两脉、而「反思回流记忆」则点出了框架原本缺失的脉间耦合。

一、业界已收敛成「7 大模式」

先看共识。2026 年，Agent 设计模式基本固定成 7 个，它们和七脉一一对应：

业界模式	对应的脉	说明
ReAct	推理 + 行动	推理与工具调用交替（Reason + Act）
Planning（Plan-and-Execute）	推理 × 编排	先规划再执行
Tool Use	行动	工具调用
Reflection	反思	自我批评与修正
Evaluator-Optimizer	反思 × 循环	一个生成、一个打分，迭代优化
Multi-Agent Collaboration	协作	多 Agent 分工
Human-in-the-Loop	治理	关键步骤插入人工确认

注意 Evaluator-Optimizer（评估器-优化器） 并不是新维度——它就是双轴框架里「反思 × 循环 = 自愈循环」那一格的别名：一个 Generator 产出结果，一个 Evaluator 按标准打分，不达标就退回重做，直到达标或到迭代上限。

判断：业界是列清单，双轴框架是给坐标。两者不冲突，框架是这套共识的「正交化升级版」。

一个可以拿来做选型论据的量化数据：Plan-and-Execute（推理 × 编排）实测任务完成率可达 92%，比串行 ReAct 快约 3.6 倍——因为规划阶段一次性想清楚步骤，执行阶段就能并行、少走回头路。这正好支撑「ROUTE 选型」里「中等复杂 + 多步骤 → Orchestrate」的判断。

二、新理念一：上下文工程（Context Engineering）

这是 2025 年最大的范式转变，本质是把双轴框架里的「感知脉」从七脉之一，升格成贯穿全局的一级工程学科。

从「提示工程」到「上下文工程」

2025 年 6 月，Andrej Karpathy 提出用「上下文工程」取代「提示工程」，定义是：

「恰到好处地用正确信息填满上下文窗口，为下一步做准备」——这是一门精细的艺术与科学。

2025 年 9 月 Anthropic 跟进，把核心问题重新表述为：

关键不再是「怎么措辞」（prompt engineering），而是「什么样的上下文配置，最可能让模型产生我们期望的行为」（context engineering）。

这和双轴框架的核心判断「Model spends, harness budgets」是同一回事：上下文窗口是稀缺资源，harness 要精打细算地决定「什么信息进入模型」。

为什么是「工程」而不只是「技巧」

「提示」这个词暗示你只在写一段话；但工业级 Agent 要管理的远不止一段话：任务描述、少样本示例、RAG 检索结果、多模态数据、工具定义、运行状态、历史对话——这些都要动态地、按需地拼进上下文。

举个具体例子：一个客服 Agent 处理一个退款请求，上下文里要不要塞进用户三个月前的聊天记录？塞了是噪声、占注意力；不塞可能丢关键背景。这个「塞什么、塞多少、什么时候塞」的决策，就是上下文工程——它显然不是「写好一句 prompt」能覆盖的。

对照双轴框架：上下文工程 ≈ 感知脉的学科化。框架把感知当成七脉之一（一个局部预算问题），业界则把它拎出来当成贯穿全局的一级学科。两种视角互补：框架给你「感知会在哪失控」的定位，上下文工程给你「怎么系统性管理感知」的方法论。

三、新理念二：长任务的上下文管理三件套

当任务变长（几十步、几小时），上下文窗口迟早会被撑爆。Anthropic 把应对手段总结成三招——它们填实了双轴框架里「记忆」和「协作」两脉的具体战术。

1. Compaction（压缩）

做法：当对话接近上下文窗口上限时，把已有内容总结成摘要，用这份摘要重新初始化一个新的上下文窗口，继续往下跑。

类比：你和同事开了三小时长会，中途有人把前两小时的结论写成一页纪要，后面的人只看纪要继续讨论，而不必回放整段录音。

落在双轴框架：记忆 × 循环。原框架这一格写的是「失败日志」，Compaction 是它的自然扩展——不只记失败，而是周期性地把整个历史蒸馏成摘要。

2. 结构化笔记 / 外部记忆（Note-taking）

做法：让 Agent 把关键状态写进外部文件，而不是全堆在上下文里；需要时再读回来。

类比：人脑记不住所有细节，于是用笔记本、待办清单。Agent 把「当前进度、已知事实、待办项」写进一个 progress.md，下一轮只读这个文件，而不是重新扫一遍全部历史。

落在双轴框架：记忆 × 链式，但介质从「向量数据库」换成了「文件系统」——这是一个值得注意的工程趋势：用文件系统当 Agent 的外部记忆，简单、可审计、可人工干预。

3. Subagents：子代理上下文隔离

做法：把探索性的脏活交给子代理（subagent）。子代理可以烧掉几万 token 去翻文档、试方案，但只向主代理回传一份 1–2K token 的蒸馏摘要。主代理的上下文始终保持干净，只负责综合。

类比：CEO 不会去读每份原始调研报告，而是让各部门主管各自调研，每人交一页摘要上来。CEO 的「上下文」（注意力）只装这几页摘要，而非成百上千页原始材料。

落在双轴框架：协作 × 层级。但 Anthropic 强调的重点和原框架不同——原框架强调「任务怎么拆」，这里强调「上下文怎么隔离」。这恰好是协作脉失败信号「大家都拿全量上下文 = 噪声淹没」的正面解法：通过子代理隔离，让每个 Agent 只看到它该看的。

技术	解决的问题	落在双轴框架
Compaction 压缩	历史太长撑爆窗口	记忆 × 循环
结构化笔记	状态需要跨轮持久	记忆 × 链式（文件系统当记忆）
Subagent 隔离	多 Agent 互相污染上下文	协作 × 层级（强调隔离）

四、新理念三：Deep Agents 与新执行循环

LangChain 在 2025 年把一类「能处理复杂多步任务」的 Agent 模式抽象成 Deep Agents，并开源成 SDK。它对双轴框架的「六式」是一个潜在补充。

从 Reason-Act 到 Plan-Delegate-Execute-Synthesize

经典 ReAct 是 Reason → Act 的简单循环。Deep Agents 换成了一个更重的骨架：

Plan（规划）→ Delegate（委派）→ Execute（执行）→ Synthesize（综合）

它本质上是「推理 × 编排」+「协作 × 层级」的组合骨架——先规划、把子任务委派给子代理、各自执行、最后综合。

两个值得吸收的新机制

做法：当某个工具返回的结果超过阈值（如 20,000 token）时，自动把完整结果写到磁盘，在上下文里只留下「文件路径 + 前 10 行预览」。需要细节时再按路径读回。

工具返回 35,000 token 的日志
        ↓  超过 20K 阈值，触发卸载
上下文里只保留：
  /tmp/tool_result_abc.txt
  ----（前 10 行预览）----
  [2026-06-24 10:01:02] INFO  starting...
  [2026-06-24 10:01:03] WARN  retrying...
  ... (还有 1240 行，需要时读取文件)

类比：你不会把整本字典背进脑子，而是记住「字典在书架第三格」，要查时再去翻。

这是「感知 × 行动」的一个新打法——双轴框架的 42 格矩阵里原本没有对应格子，可以视为一个新增模式。

做法：把规划、文件系统后端、子代理编排、上下文压缩、技能加载、prompt 缓存，都做成可插拔的中间件，按需组装。

Agent 核心循环
  ├── PlanningMiddleware      （规划）
  ├── FilesystemMiddleware    （外部记忆）
  ├── SubAgentMiddleware      （子代理隔离）
  ├── CompressionMiddleware   （上下文压缩）
  └── CachingMiddleware       （prompt 缓存降本降延迟）

这其实是双轴框架里「治理脉」的工程载体——还记得「Model spends, harness budgets」吗？这些中间件就是 harness「budget」的具体实现：它们决定 token 怎么花、什么时候卸载、什么时候压缩。

五、新理念四：反思回流记忆（ACE 自进化剧本）

这是双轴框架真正缺失的一个维度：脉与脉之间的耦合。

代表性工作是 Agentic Context Engineering（ACE），结构为三角色：

Generator（生成器）→ 用当前「剧本 playbook」处理任务
        ↓
Reflector（反思器）→ 评估这次做得好不好、哪里成功哪里失败
        ↓
Curator（策展器）→ 把经验提炼成结构化条目，更新进剧本
        ↓
（下一轮 Generator 用更新后的剧本，循环自我改进）

两个关键点：

上下文表示成「一条条结构化 bullet」，而不是一整块 monolithic prompt——便于增量更新、便于定位哪条经验有用。
反思的产物会回流进记忆，形成自改进闭环：这次踩的坑，下次写进剧本就不再踩。

举例：一个写 SQL 的 Agent，第一次因为没加 LIMIT 把库查崩了。反思器记下「大表查询要加 LIMIT」，策展器把这条写进剧本。下次它处理同类任务时，剧本里已经有这条经验，直接避坑——而不是每次重新犯错。

对照双轴框架：原框架把「反思」和「记忆」当成两条独立的脉。ACE 揭示了一个原框架没覆盖的方向——反思（Reflection）的产物应当回流进记忆（Memory）。这不是某一格的模式，而是脉间的耦合。如果给框架升级，这是值得新增的一条：在七脉之外，标注「哪些脉之间应该闭环」。

六、新理念五：治理的上游——意图与规范工程

学术界提出了一个「工程金字塔」成熟度模型，在「上下文工程」之上再加两层，把双轴框架的「治理脉」往上游延伸：

层	名称	做什么
意图工程	Intent Engineering	把组织目标、价值观、权衡优先级，编码进 Agent 基础设施，确保它追求「正确的结果」
规范工程	Specification Engineering	把公司政策、质量标准、组织约定做成机器可读语料，让多 Agent 系统能大规模自洽运行

对照双轴框架：治理脉原本管的是「运行时管控」（限制、记录、审计——动作发生时拦一道）。意图/规范工程是「设计时注入」（在 Agent 跑起来之前，就把组织的目标和红线写进它的基础设施）。可以视为 Governance 脉的 v2 方向：从「事中拦截」走向「事前对齐」。

举个例子：一个能动用预算的采购 Agent，运行时治理是「单笔超过 1 万要审批」；意图工程则是预先把「优先选有长期合作的供应商、同等价格下选本地厂商」这类组织偏好编码进去——后者让 Agent 在没人盯着时也朝正确方向走。

七、框架之外：基础设施层的新动向

这些不属于单个 Agent 的内部设计，而是「Agent 互联网」的基础设施，简单记录：

协议标准化：MCP（Agent ↔ 工具）+ A2A（Agent ↔ Agent）已成主流（详见《A2A 多 Agent 协作通信》）。新冒出的有 AgentDNS 这类给 Agent 做「根域名解析与服务发现」的设施——类比互联网的 DNS，让 Agent 能按名字找到彼此。
定位升级：2026 年的行业共识是，Agent 已从「实验」变成「自动化平台的第三层」，与 RPA、BPM 并列。Gartner 预测到 2026 年，40% 的企业应用会内嵌 AI Agent（2025 年还不到 5%）。
长程推理研究：COMPASS（演进式上下文）等工作，都在正面攻双轴框架「复合错误公理」描述的核心难题——链越长，单步误差复合得越狠。

八、汇总：新理念 × 双轴框架对照表

新理念	关系	落在 / 补充哪里
7 大模式共识	重合	七脉的清单版，Evaluator-Optimizer = 反思 × 循环
Context Engineering	升格	感知脉学科化，贯穿全局
Compaction 压缩	填实	记忆 × 循环
结构化笔记 / 外部记忆	填实	记忆 × 链式（文件系统当记忆）
Subagent 上下文隔离	填实	协作 × 层级（强调隔离而非拆分）
Context Offloading 卸载	新增	感知 × 行动（原矩阵无此格）
Middleware 中间件	工程载体	治理脉的 harness 实现
ACE 反思回流记忆	新维度	脉间耦合：反思 → 记忆（原框架缺失）
Intent / Spec 工程	上游延伸	治理脉 v2：事前对齐

一句话小结

双轴框架的骨架（资源得失 × 错误路径）依然成立，但 2025–2026 给它补了三块肌肉：上下文工程把感知做成了学科、上下文管理三件套把记忆和协作做成了战术、反思回流记忆点出了框架原本缺的脉间闭环。 选型时，先用七脉六式定坐标，再用这些前沿战术填具体打法。

最后更新于 2026-06-24

Agent 架构双轴框架：七脉六式