Agent技术栈 | AI分享会

Agent核心概念

理解AI Agent的定义、架构设计模式以及多Agent协作系统

Agent定义

AI Agent是能够感知环境、进行决策并执行动作的自主智能体。与传统AI模型不同，Agent具备持续学习和与环境交互的能力。

自主性：独立完成任务
反应性：感知环境变化
主动性：主动追求目标
社交性：与其他Agent协作

Agent架构

典型的Agent架构包含感知模块、推理引擎、行动规划和执行器四个核心组件，形成完整的感知-思考-行动循环。

感知模块：接收环境输入
推理引擎：逻辑决策核心
行动规划：制定执行策略
执行器：与环境交互

ReAct模式

ReAct(Reasoning + Acting)是一种将推理与行动相结合的范式，通过交替进行思考、行动和观察来解决复杂问题。

Reasoning：分析当前状态
Action：执行具体动作
Observation：获取反馈
循环迭代直至目标达成

多Agent系统

多个Agent通过协作、竞争或层次化组织，共同完成单Agent难以处理的复杂任务，实现群体智能。

协作模式：分工合作
竞争模式：优胜劣汰
层次模式：上下级管理
市场模式：拍卖协商

OpenClaw

开源AI智能体执行网关 - 本地优先、多模型支持的Agent基础设施

项目特性

MIT协议本地优先多模型支持开源

本地优先架构 数据不出本地，保护隐私安全，支持离线运行
多模型统一接口 兼容OpenAI、Anthropic、本地LLM等多种模型
工具调用生态 丰富的内置工具，支持自定义工具扩展
流式响应支持 实时返回推理过程，提升用户体验

工作原理与应用场景

请求路由 智能路由用户请求到合适的模型和工具链
工具编排 自动规划工具调用顺序，执行复杂任务流程
上下文管理 维护对话历史和Agent状态，支持长程记忆
典型应用场景 自动化办公、代码助手、数据分析、客服机器人

OpenClaw工作原理演示

?

用户请求

发送任务

OpenClaw

智能网关

LLM模型

推理决策

工具执行

完成任务

处理流程

接收请求

解析意图

选择模型

规划工具

执行调用

返回结果

OpenClaw作为AI Agent的执行网关，负责接收用户请求、智能路由到合适的LLM模型、规划并执行工具调用链，最终返回处理结果。

OpenClaw vs Hermes Agent

两大AI Agent执行框架的对比分析

核心定位

本地优先的AI Agent执行网关，注重隐私和安全性

开源自我改进型Agent框架，注重自主学习和生产级高可用

架构模式

CLI + 本地服务，轻量级设计

多后端架构，支持本地/云端混合部署

部署方式

本地优先，支持离线运行

灵活部署，支持本地、云端、混合模式

模型支持

OpenAI、Anthropic、本地LLM等

供应商路由+容灾，自动降级+密钥池轮换

工具调用

内置丰富工具，支持自定义扩展

40+内置工具+MCP协议+沙盒RPC代码执行

记忆系统

基础上下文管理

持久化记忆+上下文自动发现+渐进式披露

多Agent协作

不支持

子Agent委托（最多3个并发）+定时任务调度

安全隐私

数据不出本地，隐私保护极强

文件操作自动快照+回滚+沙盒隔离

适用场景

个人开发者、代码助手、自动化脚本

生产环境、复杂长程任务、自我改进系统

学习曲线

较低，CLI命令行操作

中等，功能丰富但配置项较多

"OpenClaw和Hermes Agent代表了两条不同的技术路线。
OpenClaw追求轻量级和本地优先，Hermes Agent追求自我改进和生产级高可用。"

Hermes Agent 四大核心特性详解

持久化记忆

三层记忆架构：L1热记忆(2,200字符)、L2/L3长期记忆
记忆存储于 ~/.hermes/memories/ 目录
冻结快照(Frozen Snapshots)：支持KV缓存优化，降低Token成本
支持多种外部记忆提供者：Honcho、Mem0、RetainDB等
记忆自动压缩整合，Agent自行管理(添加/替换/删除)

子Agent委托

使用 delegate_task 工具实现任务委派
最多3个并发子代理并行执行(MAX_CONCURRENT_CHILDREN=3)
每个子代理拥有独立对话上下文和终端环境
基于 ThreadPoolExecutor 实现线程池并行
支持Python RPC程序化工具调用，零上下文开销

供应商路由容灾

同供应商凭证池：支持配置多个API Key并自动轮换
线程安全的 least_used 策略分配负载
401失败自动切换到下一个凭证
回退提供者后自动恢复主提供者(v0.7.0+)
支持OpenRouter智能路由控制和多供应商切换

使用即训练的数据飞轮

每15次工具调用运行自我评估检查点
自动创建/修补技能文档，存储于 ~/.hermes/skills/
技能(Skills)是程序化记忆，可跨会话复用
渐进式披露模式(Progressive Disclosure)最小化Token使用
社区技能市场支持一键安装共享技能

交互演示

通过可视化演示深入理解Agent的工作机制

Agent决策流程模拟

?

1

任务接收

Agent接收用户输入的任务描述

输入: "查询北京明天的天气并发送邮件提醒"

2

意图理解

分析任务意图，识别需要调用的工具

识别: [天气查询API, 邮件发送工具]

3

任务规划

制定执行计划，确定工具调用顺序

计划: 1.查询天气 2.撰写邮件 3.发送邮件

4

工具执行

按顺序调用工具，获取执行结果

执行: 获取天气数据 -> 生成邮件内容

5

结果整合

整合执行结果，生成最终回复

输出: "已查询到北京明天晴天，邮件已发送"

Agent决策流程包含任务接收、意图理解、任务规划、工具执行和结果整合五个阶段，形成完整的任务处理闭环。

ReAct模式演示

?

推理 Reasoning

行动 Action

观察 Observation

...

推理我需要查询天气信息来回答用户问题

ReAct模式通过推理(Reasoning)、行动(Action)、观察(Observation)的循环迭代，让Agent能够逐步解决复杂的多步骤问题。