0xdefence/defi30
GitHub: 0xdefence/defi30
一个专注于 DeFi 智能合约的安全检测基准测试框架,提供检测与真实性双赛道评分。
Stars: 0 | Forks: 0
# DeFi-30
**DeFi 智能合约安全检测的开放基准测试。**
DeFi-30 是一个原生 TypeScript 基准测试,用于评估任意工具(AI agent、静态分析器或人工辅助 pipeline)检测真实 DeFi 漏洞模式的能力。
## 原则
- **考题公开**。
- **考生保密**。
- 可重复的评分、透明的方法论以及可对比的输出。
## 本仓库包含的内容
- 30 个基准合约(分为 3 个等级,每级 10 个)
- 每个合约对应的 Ground truth JSON
- TypeScript 评分 CLI
- 提交 schema
- 公共排行榜
- 真实性排行榜(检测 + 利用 + 修复)
## 本仓库不包含的内容
- 0xDefend 专有 pipeline 逻辑
- LLM 提示词/系统指令
- 内部编排代码
- 私有基础设施
## 快速开始
```
bun install
bun run src/cli.ts score ./results/0xdefend-v1.json --strict
```
## 可复现性(v0.2 真实性赛道)
```
git clone https://github.com/0xdefence/defi30.git
cd defi30
bun install
./scripts/run-realism.sh ./results/0xdefend-v1.json
bun run src/cli.ts score ./results/submission-with-realism.json --strict
```
生成的产物:
- `results/realism-validation.json`
- `results/submission-with-realism.json`
- `results/latest-report.json`
- `results/latest-report.md`
版本控制与完整性:
- [BENCHMARK_VERSION.md](./BENCHMARK_VERSION.md)
- [BENCHMARK_CHECKSUMS.json](./BENCHMARK_CHECKSUMS.json)
## 仓库结构
```
defi-30/
├── contracts/
│ ├── tier1/
│ ├── tier2/
│ └── tier3/
├── src/
│ ├── types.ts
│ ├── loader.ts
│ ├── matcher.ts
│ ├── scorer.ts
│ ├── reporter.ts
│ └── cli.ts
├── results/
│ ├── 0xdefend-v1.json
│ └── LEADERBOARD.md
├── METHODOLOGY.md
└── CONTRIBUTING.md
```
## 评分权重(v0.2 感知执行)
- 检出率:40%
- 精确率:20%
- 严重性准确率:10%
- 漏洞利用成功率:20%
- 修复成功率:10%
综合得分 = `(检出率 * 0.4) + (精确率 * 0.2) + (严重性 * 0.1) + (漏洞利用 * 0.2) + (修复 * 0.1)`
参见 [METHODOLOGY.md](./METHODOLOGY.md) 和 [docs/EVALUATION_REALISM_MODE.md](./docs/EVALUATION_REALISM_MODE.md)。
分类规则:[TAXONOMY.md](./TAXONOMY.md)
## 排行榜(赛道分离)
DeFi-30 发布两个独立的赛道,**不**进行合并:
1. 仅检测赛道 (`results/LEADERBOARD.md`)
2. 真实性赛道 (`results/LEADERBOARD_REALISM.md`)
各赛道的分数不具备直接可比性。
## DeFi-30 与 EVMbench 对比(简述)
- **EVMbench**:侧重于广泛的智能合约基准测试/测试工具。
- **DeFi-30**:侧重于 DeFi 的基准测试,具有透明的 Ground truth 和双赛道评分。
两者是互补的。DeFi-30 专为 DeFi 特定的漏洞模式评估和可复现的社区提交而设计。
标签:AI安全, Bun, Chat Copilot, DeFi, Homebrew安装, TypeScript, Web3, 云安全监控, 公共排行榜, 区块链, 安全插件, 安全补丁, 文档安全, 文档结构分析, 智能合约安全, 真实漏洞库, 评估框架, 静态分析