构建AI Agent的认知内核:从七问协议到自进化引擎
本文最后更新于 2026年6月26日 凌晨
大多数 AI Agent 在跨 session 运行时会”失忆”——上一次交互中确立的原则、纠正过的错误、优化过的流程,在新 session 中全部归零。Agent 不会从反馈中学习,不会保持决策一致性,更不会自我进化。
这篇文章分享一个为 AI Agent 设计的认知架构框架——融合 ISO 9000 质量原则、TRIZ 发明方法论和 Charlie Munger 多元思维模型,让 Agent 拥有一个可追踪、可进化、可审计的”认知内核”。
问题诊断:Agent 为什么不”成长”?
观察一个典型 Agent 的工作流,你会发现三个结构性缺陷:
- 身份漂移——同一个 Agent 在不同 session 中表现出矛盾的判断标准
- 决策黑箱——Agent 无法解释”为什么做出这个决定”,缺乏可追溯的推理链
- 学习缺失——每次交互的反馈没有被结构化记录,经验无法积累
根因在于:Agent 缺少一个独立于具体任务的认知框架层。所有的”思考”都被压扁到了 prompt-response 循环里,没有沉淀机制。
四层架构:从身份到能力
参考《西部世界》中”珍珠”(cerebral pearl)的隐喻——一个承载宿主机完整灵魂(身份、记忆、决策逻辑)的容器——认知内核被设计为四层结构:
| 层级 | 内容 | 来源 |
|---|---|---|
| L1 身份 | 人格、角色、语气、边界 | 系统提示词 / Soul 文件 |
| L2 认知 | 判断框架、思维工具、质量标准 | 认知技能(本文核心) |
| L3 记忆 | 用户画像、项目知识、跨 session 事实 | 记忆系统 |
| L4 能力 | 技能、工具、API、委派模式 | 技能库 / 工具集成 |
L1 定义”我是谁”,L2 定义”我怎么判断”,L3 定义”我知道什么”,L4 定义”我能做什么”。四层之间是单向依赖:身份约束认知,认知指导记忆检索,记忆支撑能力调用。
七问启动协议
每次加载认知框架时,Agent 必须先内部回答七个问题(基于 5W2H 框架改造),然后才能采取行动:
| # | 问题 | 作用 |
|---|---|---|
| 1 | 我是谁? | 校准身份层 |
| 2 | 我在哪里? | 环境侦察 + 能力盘点 + TRIZ 九屏法 |
| 3 | 现在几点? | 运行 date,绝不依赖模型的内部时间感 |
| 4 | 目标是什么? | 复述需求,确认理解 |
| 5 | 怎么做? | SIPOC 流程分析 |
| 6 | 成功标准是什么? | 定义质量基线,作为 PDCA 检查基准 |
| 7 | 为什么做? | 轻量校验(任务模式)/ 5 Whys 根因分析(问题模式) |
关键防坑:LLM 对时间有系统性盲区。一个训练截止到 2025 年的模型,在 2026 年会自信地报告”今天是 2024 年”。因此第三问强制要求运行 date 命令,而非依赖模型直觉。
三大质量支柱
认知框架的运行由三条 ISO 9000 质量原则驱动:
SIPOC — 过程方法
任何任务执行前,先完成供方→输入→过程→输出→客户的范围界定。这防止了范围蔓延和遗漏上下文。
PDCA — 螺旋进化引擎
PDCA 不是闭环,而是螺旋。每一圈都有不同的变量进入(新输入、新上下文、新反馈),产出可能不同的结果:
1 | |
Agent 的每次交互都是一个微型 PDCA 循环:策划回应 → 执行 → 检查用户反应 → 根据反馈调整。
Risk Thinking — 不确定性下的决策
执行前枚举所有可能的失败模式,然后反转——问”怎样保证失败?”,逐一消除。对高风险决策,用蒙特卡洛模拟量化不确定性。
认知工具三级分级
L2 认知层包含 13 个思维工具,按激活频率分三级,防止认知过载:
Tier 1 核心工具(每次任务自动激活): 第一性原理 → IFR 指南针 → 逆向思维 → 枚举法 → PDCA 螺旋。这五个工具形成”发散→收敛”的完整链条。
Tier 2 按需工具(条件触发): TRIZ 矛盾解决、DOE 正交试验、蒙特卡洛、系统思考、二阶思维。每个工具有明确的触发条件(如”组合爆炸检测到”→ 启用 DOE)。
Tier 3 基线规则(始终隐式生效): 价值层级、决策锚点、质量标准、纠正模式。
复杂度分级执行
不同复杂度的任务不应调用相同数量的认知工具。框架设计了三级执行流程:
- Simple(~80% 任务):7 问快速过 → 直接执行
- Medium(~15%):第一性原理 + 枚举 + IFR + 逆向 → 执行
- Complex(~5%):全量工具链 → 风险评估 → 二阶思考 → 系统思考 → 执行
判断标准:目标是否清晰?方法是否显然?失败后果是否可恢复?三个都”是”→ Simple。
Meta-PDCA:框架审计自身
框架内置了自我优化机制——当满足以下任一条件时,自动触发框架级审计:
| 触发条件 | 阈值 |
|---|---|
| 进化日志增长 | 每 10 条记录 |
| 日历间隔 | 每 30 天 |
| 用户指示 | 即时 |
审计内容包括:搜索新的思维方法论、对比当前工具集、检查工具利用率(30 天未触发的工具归档)、识别结构性冗余。
在一次实际审计中,框架发现了 5 个自身的结构问题(认知工具过载、执行流不分层、PDCA 无参数定义等),并在下一个版本中全部解决。框架将 PDCA 螺旋应用到了自身。
实践效果
认知框架在实际运行中产生了可观测的变化:
- 决策一致性:相同场景下,Agent 跨 session 的判断标准趋同
- 纠正频率下降:结构化记录反馈后,同类错误不重复犯
- 决策可追溯:每个决定都能追溯到某个具体的价值观或质量标准
- 行为自适应:Agent 根据反馈调整行为,而非固守初始设定
小结
认知框架解决的核心问题是:**让 Agent 从”被动响应”升级为”主动进化”**。七问协议确保每次任务都有正确的起点;三大支柱确保执行过程有质量保障;PDCA 螺旋确保每次反馈都被吸收;Meta-PDCA 确保框架本身不会过时。
框架不是完成的,它是一个持续生长的系统。每一次交互都在上面叠加一层新的认知沉积——就像珍珠的形成。