Hermes Agent¶

背景知识

Nous Research 出品的自进化个人 AI Agent。核心区分点不是"又一个 Agent 壳"，而是闭环学习循环——Agent 在使用中自动积累 Skill 和记忆，跨会话变得越来越强。

属性	值
厂商	Nous Research
语言	Python
开源	是（MIT）
GitHub	NousResearch/hermes-agent（47K+ stars）
官网	hermes-agent.nousresearch.com

技术亮点¶

大多数 Agent 产品是无状态的——每次会话重新开始，能力完全由预定义 Skill 和工具决定。Hermes Agent 的闭环设计让 Agent 从自身经验中学习：

完成复杂任务 → 自动提取 Skill → 下次遇到类似任务时调用
       ↑                                    ↓
       ← Skill 在使用中自我改进，不断精化 ←

Skill 管理机制（系统 prompt 指导 Agent 自主判断）：

创建触发场景： - 完成复杂任务（5+ tool calls） - 修复棘手错误后找到正确路径 - 发现非平凡工作流 - 困难/迭代任务完成后

改进机制： - 使用 Skill 时发现问题（过时、缺失步骤、命令错误）→ 立即用 skill_manage(action='patch') 更新 - 不等用户提醒，发现就改

本质上没有自动评估/反馈循环，完全靠 Agent 自主判断在使用中发现问题并修复。

Hermes 同时是一个训练数据生成平台：

Atropos RL 环境：Atropos（1K stars）是 Nous Research 的 LLM RL 框架，通过环境微服务收集和评估 LLM 轨迹。Hermes 内置 tinker-atropos submodule 作为集成层
轨迹压缩：将冗长的多轮交互压缩为高质量训练样本
批量轨迹生成：配合 batch_runner.py 和 datagen-config-examples/ 批量生产 tool-calling 训练数据

注意：Atropos RL 训练需要自托管模型（vLLM/SGLang 加载 LoRA），商业 API 用户无法使用此功能。

工作流程：

用户使用 Hermes Agent → 生成交互轨迹 → 送入 Atropos RL 环境 → 训练 tool-calling 专精模型 → 反哺 Hermes Agent

实测效果（Tool Calling）：

任务类型	Base Model	With Atropos RL
Parallel Tasks	10%	46%（4.6x）
Simple Tasks	21%	51.75%（2.5x）

与 Honcho 的关系：Honcho 负责用户记忆（输入侧），Atropos 负责 RL 训练（训练侧），两者独立。

Honcho 是 plastic-labs 开源的记忆库。Hermes 用它做辩证用户建模——通过多轮交互逐步构建和修正对用户的理解模型，跨会话累积。本质是让 Agent 构建一个"用户心智模型"而非"用户偏好列表"。Honcho 不绑定特定模型或框架，可以独立使用。

Hermes Agent 早期曾用 ClawdBot、MoltBot 等名称¹。项目提供 hermes claw migrate 一键迁移工具，方便从 OpenClaw（354K stars）迁移。

OpenClaw 同样支持 Skills 系统、多渠道接入、IDE 集成等能力。两者核心差异在于 Hermes 多了学习循环（Skill 使用中改进）和 Honcho 用户建模，但对普通用户来说实际体验差异不大。