NousResearch/hermes-agent-self-evolution

GitHub: NousResearch/hermes-agent-self-evolution

基于 DSPy + GEPA 的 Hermes Agent 自动演化优化框架，无需 GPU 即可实现技能、Prompt 和代码的迭代改进。

Stars: 4727 | Forks: 537

# 🧬 Hermes Agent 自演化 **用于 [Hermes Agent](https://github.com/NousResearch/hermes-agent) 的演化式自我改进。** Hermes Agent Self-Evolution 使用 DSPy + GEPA (Genetic-Pareto Prompt Evolution) 自动演化并优化 Hermes Agent 的技能、工具描述、系统提示和代码 —— 通过反思性的演化搜索产生可衡量的更优版本。 **无需 GPU 训练。** 一切皆通过 API 调用运作 —— 变异文本、评估结果并选择最佳变体。每次优化运行约需 $2-10。 ## 工作原理 ``` Read current skill/prompt/tool ──► Generate eval dataset │ ▼ GEPA Optimizer ◄── Execution traces │ ▲ ▼ │ Candidate variants ──► Evaluate │ Constraint gates (tests, size limits, benchmarks) │ ▼ Best variant ──► PR against hermes-agent ``` GEPA 读取执行轨迹以理解失败的根本*原因*（而不仅仅是知道失败了），然后提出针对性的改进建议。ICLR 2026 Oral，MIT 许可证。 ## 快速开始 ``` # 安装 git clone https://github.com/NousResearch/hermes-agent-self-evolution.git cd hermes-agent-self-evolution pip install -e ".[dev]" # 指向你的 hermes-agent 仓库 export HERMES_AGENT_REPO=~/.hermes/hermes-agent # Evolve 一个 skill (synthetic eval data) python -m evolution.skills.evolve_skill \ --skill github-code-review \ --iterations 10 \ --eval-source synthetic # 或使用来自 Claude Code、Copilot 和 Hermes 的真实会话历史 python -m evolution.skills.evolve_skill \ --skill github-code-review \ --iterations 10 \ --eval-source sessiondb ``` ## 优化目标 | 阶段 | 目标 | 引擎 | 状态 | |-------|--------|--------|--------| | **阶段 1** | 技能文件 (SKILL.md) | DSPy + GEPA | ✅ 已实现 | | **阶段 2** | 工具描述 | DSPy + GEPA | 🔲 计划中 | | **阶段 3** | 系统 Prompt 部分 | DSPy + GEPA | 🔲 计划中 | | **阶段 4** | 工具实现代码 | Darwinian Evolver | 🔲 计划中 | | **阶段 5** | 持续改进循环 | 自动化流水线 | 🔲 计划中 | ## 引擎 | 引擎 | 功能 | 许可证 | |--------|-------------|---------| | **[DSPy](https://github.com/stanfordnlp/dspy) + [GEPA](https://github.com/gepa-ai/gepa)** | 反思性 Prompt 演化 —— 读取执行轨迹，提出针对性变异 | MIT | | **[Darwinian Evolver](https://github.com/imbue-ai/darwinian_evolver)** | 基于 Git 生物体的代码演化 | AGPL v3 (仅限外部 CLI) | ## 防护机制每个演化出的变体必须通过： 1. **完整测试套件** — `pytest tests/ -q` 必须 100% 通过 2. **大小限制** — 技能 ≤15KB，工具描述 ≤500 字符 3. **缓存兼容性** — 不得在对话中途更改 4. **语义保留** — 不得偏离原始目的 5. **PR 审查** — 所有变更均需经过人工审查，绝不直接提交 ## 完整计划参阅 [PLAN.md](PLAN.md) 了解完整架构、评估数据策略、约束条件、基准集成及分阶段时间表。 ## 许可证 MIT — © 2026 Nous Research

标签：AutoML, DLL 劫持, DSPy, GEPA, Hermes Agent, ICLR 2026, NousResearch, Python, RESTful API, 人工智能, 代码优化, 反射搜索, 大语言模型, 开源, 技能优化, 提示词优化, 提示词工程, 无GPU训练, 无后门, 用户模式Hook绕过, 策略决策点, 网络安全研究, 自动机器学习, 自我进化, 逆向工具, 遗传算法