houssem98/hermes-audit

GitHub: houssem98/hermes-audit

一个可部署于 Claude Code 的自我改进型多代理智能合约安全审计系统，通过证据驱动的流水线生成竞赛级审计报告。

Stars: 0 | Forks: 0

# Hermes 自主审计系统自我改进的多代理（multi-agent）智能合约安全审计系统，可部署于 Claude Code。粘贴 Code4rena / CodeHawks / Sherlock 链接（或代码仓库 URL） → 生成竞赛级、有证据支撑的报告，包含通过的 PoC，并以一次人工审查作为把关。该系统在每次运行中都会越来越擅长发现**真正的**漏洞 —— 它绝不会学会产生幻觉。 **证据是唯一的通行证。** ## 快速开始 ``` # 在这个 repo 中，使用 Claude Code： /audit # full PHASE 0–8 pipeline → report.md + findings.json /benchmark [prompt-version] # frozen suite gate before promoting any tuned prompt ``` ## 工作原理 ``` INGEST → ENV → ORCHESTRATOR ├── 12 SPECIALISTS (hunt their class, memory-primed) → findings.json[] ├── INVARIANT/FUZZ ENGINEER (Foundry/Echidna/Halmos) → property breaks ├── POC FORGE (loop until passing PoC or killed) → Confirmed exploits ├── TRIAGE (dedup · FP-kill gate · severity) └── LEARNING ENGINE (TP/FP/MISS memory → retrieval + gated tuning) │ ▼ HUMAN REVIEW GATE (required before any external submission) ▼ ``` ## 结构 | 路径 | 用途 | |---|---| | `CLAUDE.md` | 三大定律 + 自我改进不变量 + 误报清除关卡 + 严重性矩阵 + 发现 schema。由每个 agent 继承。 | | `.claude/agents/` | Orchestrator + 12 个专家 agent + poc-forge + triage + learning-engine。 | | `.claude/commands/` | `/audit`, `/benchmark`。 | | `.claude/memory/` | 仅追加的标记化存储：`tp/` `fp/` `miss/` `prompt-versions/` `benchmark/`。 | ## 三大定律（不可协商） 1. **证据定律** —— 没有精确锚点 + 通过的 PoC 或无懈可击的状态转换攻击路径，就没有任何发现。 2. **可达性定律** —— 证明非受信任角色可以调用该路径。受信任管理员的恶意行为 = 中心化备注，而不是 High。 3. **谦逊定律** —— 假设开发者是有能力的。清除一个误报就是一次胜利。 ## 自我改进不变量学习循环仅调整 *agent 关注的位置*、*优先级*以及 *它们表述发现的方式*。它**绝不会**降低证据标准、自动提升未确认的发现，或为了发现数量而进行优化。目标 = **已确认发现精确率（precision-at-confirmed）**。`status` 仅在 PoC 通过时才会翻转为 `Confirmed`。 ## 防护栏 - 在任何外部提交之前必须经过人工关卡（拒绝 AI 垃圾内容自动提交）。 - 仅限授权范围（允许测试的竞赛代码仓库 / 合作客户 / 漏洞赏金计划）。 - 使用一次性沙盒，无任何 secrets/keys，在只读 RPC 上进行 fork 测试。 - 每次运行都会固定并标明所用的工具及编译器版本。

标签：AI代码审计, Homebrew安装, Maven, Web3安全, 多智能体, 智能合约审计, 漏洞验证, 自动化漏洞挖掘, 防御加固