NousResearch/hermes-agent-self-evolution

GitHub: NousResearch/hermes-agent-self-evolution

基于 DSPy + GEPA 的 Hermes Agent 自动演化优化框架,无需 GPU 即可实现技能、Prompt 和代码的迭代改进。

Stars: 573 | Forks: 53

# 🧬 Hermes Agent 自演化 **用于 [Hermes Agent](https://github.com/NousResearch/hermes-agent) 的演化式自我改进。** Hermes Agent Self-Evolution 使用 DSPy + GEPA (Genetic-Pareto Prompt Evolution) 自动演化并优化 Hermes Agent 的技能、工具描述、系统提示和代码 —— 通过反思性的演化搜索产生可衡量的更优版本。 **无需 GPU 训练。** 一切皆通过 API 调用运作 —— 变异文本、评估结果并选择最佳变体。每次优化运行约需 $2-10。 ## 工作原理 ``` Read current skill/prompt/tool ──► Generate eval dataset │ ▼ GEPA Optimizer ◄── Execution traces │ ▲ ▼ │ Candidate variants ──► Evaluate │ Constraint gates (tests, size limits, benchmarks) │ ▼ Best variant ──► PR against hermes-agent ``` GEPA 读取执行轨迹以理解失败的根本*原因*(而不仅仅是知道失败了),然后提出针对性的改进建议。ICLR 2026 Oral,MIT 许可证。 ## 快速开始 ``` # 安装 git clone https://github.com/NousResearch/hermes-agent-self-evolution.git cd hermes-agent-self-evolution pip install -e ".[dev]" # 指向你的 hermes-agent 仓库 export HERMES_AGENT_REPO=~/.hermes/hermes-agent # Evolve 一个 skill (synthetic eval data) python -m evolution.skills.evolve_skill \ --skill github-code-review \ --iterations 10 \ --eval-source synthetic # 或使用来自 Claude Code、Copilot 和 Hermes 的真实会话历史 python -m evolution.skills.evolve_skill \ --skill github-code-review \ --iterations 10 \ --eval-source sessiondb ``` ## 优化目标 | 阶段 | 目标 | 引擎 | 状态 | |-------|--------|--------|--------| | **阶段 1** | 技能文件 (SKILL.md) | DSPy + GEPA | ✅ 已实现 | | **阶段 2** | 工具描述 | DSPy + GEPA | 🔲 计划中 | | **阶段 3** | 系统 Prompt 部分 | DSPy + GEPA | 🔲 计划中 | | **阶段 4** | 工具实现代码 | Darwinian Evolver | 🔲 计划中 | | **阶段 5** | 持续改进循环 | 自动化流水线 | 🔲 计划中 | ## 引擎 | 引擎 | 功能 | 许可证 | |--------|-------------|---------| | **[DSPy](https://github.com/stanfordnlp/dspy) + [GEPA](https://github.com/gepa-ai/gepa)** | 反思性 Prompt 演化 —— 读取执行轨迹,提出针对性变异 | MIT | | **[Darwinian Evolver](https://github.com/imbue-ai/darwinian_evolver)** | 基于 Git 生物体的代码演化 | AGPL v3 (仅限外部 CLI) | ## 防护机制 每个演化出的变体必须通过: 1. **完整测试套件** — `pytest tests/ -q` 必须 100% 通过 2. **大小限制** — 技能 ≤15KB,工具描述 ≤500 字符 3. **缓存兼容性** — 不得在对话中途更改 4. **语义保留** — 不得偏离原始目的 5. **PR 审查** — 所有变更均需经过人工审查,绝不直接提交 ## 完整计划 参阅 [PLAN.md](PLAN.md) 了解完整架构、评估数据策略、约束条件、基准集成及分阶段时间表。 ## 许可证 MIT — © 2026 Nous Research
标签:AutoML, DLL 劫持, DSPy, GEPA, Hermes Agent, ICLR 2026, NousResearch, Python, RESTful API, 人工智能, 代码优化, 反射搜索, 大语言模型, 开源, 技能优化, 提示词优化, 提示词工程, 无GPU训练, 无后门, 用户模式Hook绕过, 策略决策点, 网络安全研究, 自动机器学习, 自我进化, 逆向工具, 遗传算法