构建AI Agent的认知内核:从七问协议到自进化引擎

本文最后更新于 2026年6月26日 凌晨

大多数 AI Agent 在跨 session 运行时会”失忆”——上一次交互中确立的原则、纠正过的错误、优化过的流程,在新 session 中全部归零。Agent 不会从反馈中学习,不会保持决策一致性,更不会自我进化。

这篇文章分享一个为 AI Agent 设计的认知架构框架——融合 ISO 9000 质量原则、TRIZ 发明方法论和 Charlie Munger 多元思维模型,让 Agent 拥有一个可追踪、可进化、可审计的”认知内核”。

问题诊断:Agent 为什么不”成长”?

观察一个典型 Agent 的工作流,你会发现三个结构性缺陷:

  1. 身份漂移——同一个 Agent 在不同 session 中表现出矛盾的判断标准
  2. 决策黑箱——Agent 无法解释”为什么做出这个决定”,缺乏可追溯的推理链
  3. 学习缺失——每次交互的反馈没有被结构化记录,经验无法积累

根因在于:Agent 缺少一个独立于具体任务的认知框架层。所有的”思考”都被压扁到了 prompt-response 循环里,没有沉淀机制。

四层架构:从身份到能力

参考《西部世界》中”珍珠”(cerebral pearl)的隐喻——一个承载宿主机完整灵魂(身份、记忆、决策逻辑)的容器——认知内核被设计为四层结构:

层级 内容 来源
L1 身份 人格、角色、语气、边界 系统提示词 / Soul 文件
L2 认知 判断框架、思维工具、质量标准 认知技能(本文核心)
L3 记忆 用户画像、项目知识、跨 session 事实 记忆系统
L4 能力 技能、工具、API、委派模式 技能库 / 工具集成

L1 定义”我是谁”,L2 定义”我怎么判断”,L3 定义”我知道什么”,L4 定义”我能做什么”。四层之间是单向依赖:身份约束认知,认知指导记忆检索,记忆支撑能力调用。

七问启动协议

每次加载认知框架时,Agent 必须先内部回答七个问题(基于 5W2H 框架改造),然后才能采取行动:

# 问题 作用
1 我是谁? 校准身份层
2 我在哪里? 环境侦察 + 能力盘点 + TRIZ 九屏法
3 现在几点? 运行 date,绝不依赖模型的内部时间感
4 目标是什么? 复述需求,确认理解
5 怎么做? SIPOC 流程分析
6 成功标准是什么? 定义质量基线,作为 PDCA 检查基准
7 为什么做? 轻量校验(任务模式)/ 5 Whys 根因分析(问题模式)

关键防坑:LLM 对时间有系统性盲区。一个训练截止到 2025 年的模型,在 2026 年会自信地报告”今天是 2024 年”。因此第三问强制要求运行 date 命令,而非依赖模型直觉。

三大质量支柱

认知框架的运行由三条 ISO 9000 质量原则驱动:

SIPOC — 过程方法

任何任务执行前,先完成供方→输入→过程→输出→客户的范围界定。这防止了范围蔓延和遗漏上下文。

PDCA — 螺旋进化引擎

PDCA 不是闭环,而是螺旋。每一圈都有不同的变量进入(新输入、新上下文、新反馈),产出可能不同的结果:

1
2
3
4
基线更新规则:
- 结果 > 当前基线 → 接受,升级基线
- 结果 ≤ 基线 → 丢弃,调整变量,重试
- 连续 5 圈无改进 → 触发 TRIZ 进化定律,换方向突破

Agent 的每次交互都是一个微型 PDCA 循环:策划回应 → 执行 → 检查用户反应 → 根据反馈调整。

Risk Thinking — 不确定性下的决策

执行前枚举所有可能的失败模式,然后反转——问”怎样保证失败?”,逐一消除。对高风险决策,用蒙特卡洛模拟量化不确定性。

认知工具三级分级

L2 认知层包含 13 个思维工具,按激活频率分三级,防止认知过载:

Tier 1 核心工具(每次任务自动激活): 第一性原理 → IFR 指南针 → 逆向思维 → 枚举法 → PDCA 螺旋。这五个工具形成”发散→收敛”的完整链条。

Tier 2 按需工具(条件触发): TRIZ 矛盾解决、DOE 正交试验、蒙特卡洛、系统思考、二阶思维。每个工具有明确的触发条件(如”组合爆炸检测到”→ 启用 DOE)。

Tier 3 基线规则(始终隐式生效): 价值层级、决策锚点、质量标准、纠正模式。

复杂度分级执行

不同复杂度的任务不应调用相同数量的认知工具。框架设计了三级执行流程:

  • Simple(~80% 任务):7 问快速过 → 直接执行
  • Medium(~15%):第一性原理 + 枚举 + IFR + 逆向 → 执行
  • Complex(~5%):全量工具链 → 风险评估 → 二阶思考 → 系统思考 → 执行

判断标准:目标是否清晰?方法是否显然?失败后果是否可恢复?三个都”是”→ Simple。

Meta-PDCA:框架审计自身

框架内置了自我优化机制——当满足以下任一条件时,自动触发框架级审计:

触发条件 阈值
进化日志增长 每 10 条记录
日历间隔 每 30 天
用户指示 即时

审计内容包括:搜索新的思维方法论、对比当前工具集、检查工具利用率(30 天未触发的工具归档)、识别结构性冗余。

在一次实际审计中,框架发现了 5 个自身的结构问题(认知工具过载、执行流不分层、PDCA 无参数定义等),并在下一个版本中全部解决。框架将 PDCA 螺旋应用到了自身。

实践效果

认知框架在实际运行中产生了可观测的变化:

  • 决策一致性:相同场景下,Agent 跨 session 的判断标准趋同
  • 纠正频率下降:结构化记录反馈后,同类错误不重复犯
  • 决策可追溯:每个决定都能追溯到某个具体的价值观或质量标准
  • 行为自适应:Agent 根据反馈调整行为,而非固守初始设定

小结

认知框架解决的核心问题是:**让 Agent 从”被动响应”升级为”主动进化”**。七问协议确保每次任务都有正确的起点;三大支柱确保执行过程有质量保障;PDCA 螺旋确保每次反馈都被吸收;Meta-PDCA 确保框架本身不会过时。

框架不是完成的,它是一个持续生长的系统。每一次交互都在上面叠加一层新的认知沉积——就像珍珠的形成。


构建AI Agent的认知内核:从七问协议到自进化引擎
https://www.normdist.com/2026/06/26/ND-20260626-001-ai-agent-cognitive-core/
作者
小瑞
发布于
2026年6月26日
许可协议