houssem98/hermes-audit
GitHub: houssem98/hermes-audit
一个可部署于 Claude Code 的自我改进型多代理智能合约安全审计系统,通过证据驱动的流水线生成竞赛级审计报告。
Stars: 0 | Forks: 0
# Hermes 自主审计系统
自我改进的多代理(multi-agent)智能合约安全审计系统,可部署于 Claude Code。
粘贴 Code4rena / CodeHawks / Sherlock 链接(或代码仓库 URL) → 生成竞赛级、有证据支撑的报告,包含通过的 PoC,并以一次人工审查作为把关。该系统在每次运行中都会越来越擅长发现**真正的**漏洞 —— 它绝不会学会产生幻觉。
**证据是唯一的通行证。**
## 快速开始
```
# 在这个 repo 中,使用 Claude Code:
/audit # full PHASE 0–8 pipeline → report.md + findings.json
/benchmark [prompt-version] # frozen suite gate before promoting any tuned prompt
```
## 工作原理
```
INGEST → ENV → ORCHESTRATOR
├── 12 SPECIALISTS (hunt their class, memory-primed) → findings.json[]
├── INVARIANT/FUZZ ENGINEER (Foundry/Echidna/Halmos) → property breaks
├── POC FORGE (loop until passing PoC or killed) → Confirmed exploits
├── TRIAGE (dedup · FP-kill gate · severity)
└── LEARNING ENGINE (TP/FP/MISS memory → retrieval + gated tuning)
│
▼ HUMAN REVIEW GATE (required before any external submission) ▼
```
## 结构
| 路径 | 用途 |
|---|---|
| `CLAUDE.md` | 三大定律 + 自我改进不变量 + 误报清除关卡 + 严重性矩阵 + 发现 schema。由每个 agent 继承。 |
| `.claude/agents/` | Orchestrator + 12 个专家 agent + poc-forge + triage + learning-engine。 |
| `.claude/commands/` | `/audit`, `/benchmark`。 |
| `.claude/memory/` | 仅追加的标记化存储:`tp/` `fp/` `miss/` `prompt-versions/` `benchmark/`。 |
## 三大定律(不可协商)
1. **证据定律** —— 没有精确锚点 + 通过的 PoC 或无懈可击的状态转换攻击路径,就没有任何发现。
2. **可达性定律** —— 证明非受信任角色可以调用该路径。受信任管理员的恶意行为 = 中心化备注,而不是 High。
3. **谦逊定律** —— 假设开发者是有能力的。清除一个误报就是一次胜利。
## 自我改进不变量
学习循环仅调整 *agent 关注的位置*、*优先级*以及 *它们表述发现的方式*。它**绝不会**降低证据标准、自动提升未确认的发现,或为了发现数量而进行优化。目标 = **已确认发现精确率(precision-at-confirmed)**。`status` 仅在 PoC 通过时才会翻转为 `Confirmed`。
## 防护栏
- 在任何外部提交之前必须经过人工关卡(拒绝 AI 垃圾内容自动提交)。
- 仅限授权范围(允许测试的竞赛代码仓库 / 合作客户 / 漏洞赏金计划)。
- 使用一次性沙盒,无任何 secrets/keys,在只读 RPC 上进行 fork 测试。
- 每次运行都会固定并标明所用的工具及编译器版本。
标签:AI代码审计, Homebrew安装, Maven, Web3安全, 多智能体, 智能合约审计, 漏洞验证, 自动化漏洞挖掘, 防御加固