NousResearch/hermes-agent-self-evolution
GitHub: NousResearch/hermes-agent-self-evolution
基于 DSPy + GEPA 的 Hermes Agent 自动演化优化框架,无需 GPU 即可实现技能、Prompt 和代码的迭代改进。
Stars: 573 | Forks: 53
# 🧬 Hermes Agent 自演化
**用于 [Hermes Agent](https://github.com/NousResearch/hermes-agent) 的演化式自我改进。**
Hermes Agent Self-Evolution 使用 DSPy + GEPA (Genetic-Pareto Prompt Evolution) 自动演化并优化 Hermes Agent 的技能、工具描述、系统提示和代码 —— 通过反思性的演化搜索产生可衡量的更优版本。
**无需 GPU 训练。** 一切皆通过 API 调用运作 —— 变异文本、评估结果并选择最佳变体。每次优化运行约需 $2-10。
## 工作原理
```
Read current skill/prompt/tool ──► Generate eval dataset
│
▼
GEPA Optimizer ◄── Execution traces
│ ▲
▼ │
Candidate variants ──► Evaluate
│
Constraint gates (tests, size limits, benchmarks)
│
▼
Best variant ──► PR against hermes-agent
```
GEPA 读取执行轨迹以理解失败的根本*原因*(而不仅仅是知道失败了),然后提出针对性的改进建议。ICLR 2026 Oral,MIT 许可证。
## 快速开始
```
# 安装
git clone https://github.com/NousResearch/hermes-agent-self-evolution.git
cd hermes-agent-self-evolution
pip install -e ".[dev]"
# 指向你的 hermes-agent 仓库
export HERMES_AGENT_REPO=~/.hermes/hermes-agent
# Evolve 一个 skill (synthetic eval data)
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source synthetic
# 或使用来自 Claude Code、Copilot 和 Hermes 的真实会话历史
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondb
```
## 优化目标
| 阶段 | 目标 | 引擎 | 状态 |
|-------|--------|--------|--------|
| **阶段 1** | 技能文件 (SKILL.md) | DSPy + GEPA | ✅ 已实现 |
| **阶段 2** | 工具描述 | DSPy + GEPA | 🔲 计划中 |
| **阶段 3** | 系统 Prompt 部分 | DSPy + GEPA | 🔲 计划中 |
| **阶段 4** | 工具实现代码 | Darwinian Evolver | 🔲 计划中 |
| **阶段 5** | 持续改进循环 | 自动化流水线 | 🔲 计划中 |
## 引擎
| 引擎 | 功能 | 许可证 |
|--------|-------------|---------|
| **[DSPy](https://github.com/stanfordnlp/dspy) + [GEPA](https://github.com/gepa-ai/gepa)** | 反思性 Prompt 演化 —— 读取执行轨迹,提出针对性变异 | MIT |
| **[Darwinian Evolver](https://github.com/imbue-ai/darwinian_evolver)** | 基于 Git 生物体的代码演化 | AGPL v3 (仅限外部 CLI) |
## 防护机制
每个演化出的变体必须通过:
1. **完整测试套件** — `pytest tests/ -q` 必须 100% 通过
2. **大小限制** — 技能 ≤15KB,工具描述 ≤500 字符
3. **缓存兼容性** — 不得在对话中途更改
4. **语义保留** — 不得偏离原始目的
5. **PR 审查** — 所有变更均需经过人工审查,绝不直接提交
## 完整计划
参阅 [PLAN.md](PLAN.md) 了解完整架构、评估数据策略、约束条件、基准集成及分阶段时间表。
## 许可证
MIT — © 2026 Nous Research
标签:AutoML, DLL 劫持, DSPy, GEPA, Hermes Agent, ICLR 2026, NousResearch, Python, RESTful API, 人工智能, 代码优化, 反射搜索, 大语言模型, 开源, 技能优化, 提示词优化, 提示词工程, 无GPU训练, 无后门, 用户模式Hook绕过, 策略决策点, 网络安全研究, 自动机器学习, 自我进化, 逆向工具, 遗传算法