Homestead

United States

🤖 现代智能体架构解析

现代智能体架构——例如 Microsoft Agent FrameworkAnthropic Claude 提出的结构——通过 渐进式披露(Progressive Disclosure) 机制将不同技能串联起来。


Agent 架构图

一、启动与匹配:Metadata 层

智能体启动时,系统只加载所有技能的元数据到全局系统提示词中。此时,智能体只知道有哪些技能可用,并不加载具体内容,token 消耗极低(约 30 tokens / 技能)。

元数据包含:

  • 技能名称
  • 版本号
  • 简短描述(告诉智能体这个技能能做什么)
  • 适用场景标签

二、触发与加载:System Prompt / SKILL.md 层

当用户输入查询(User Prompt)后,智能体通过语义匹配或意图识别工具选定某个技能(例如 PDF 处理技能)。此时,该技能完整的 SKILL.md——包含完整的系统指令和工作流指导——才会被注入到上下文窗口中。

系统提示词包含:

  • 角色设定(Persona)
  • 输出格式要求
  • 基本限制与安全边界
  • 与其他技能的协作规则

用户提示词则包含:

  • 驱动技能启动的具体任务输入
  • 通常包含 {{user_input}} 占位符供动态替换

三、调用与执行:References & Scripts 层

智能体理解详细操作步骤后,根据 SKILL.md 中的指引,使用预先授权的工具执行任务。

组件说明
References(参考资料)格式模板(Markdown / JSON)、参考指南、特定领域的术语文档
Scripts(脚本)确定性逻辑脚本(如 Python、Bash),将繁重的计算或系统级操作卸载给外部运行时

例如,路由模式可能会指派执行 python scripts/analyzer.py,并根据模板文件处理数据。


四、反馈与循环

脚本执行结果原路返回给大语言模型(LLM),智能体读取输出后进行下一步思考,直到完成用户任务。


举个例子:文件分析技能

层级内容示例
元数据name: analyzer, desc: 分析目标目录下的日志文件并生成报告
系统提示词设定为"资深数据分析专家,需严格按照 JSON 格式输出"
参考资料提供一份 TEMPLATE.md 规范报告格式
脚本提供 analyzer.py Python 脚本用于读取本地日志
连接机制智能体接收用户命令 → 触发 analyzer 技能 → 加载详细指令 → 执行 analyzer.py → 结果填入 TEMPLATE.md 输出

深入了解

如果想探索底层运行机制与代码实践,推荐阅读: 👉 Claude Agent 技能深度解析