0xdefence/defi30

GitHub: 0xdefence/defi30

一个专注于 DeFi 智能合约的安全检测基准测试框架,提供检测与真实性双赛道评分。

Stars: 0 | Forks: 0

# DeFi-30 **DeFi 智能合约安全检测的开放基准测试。** DeFi-30 是一个原生 TypeScript 基准测试,用于评估任意工具(AI agent、静态分析器或人工辅助 pipeline)检测真实 DeFi 漏洞模式的能力。 ## 原则 - **考题公开**。 - **考生保密**。 - 可重复的评分、透明的方法论以及可对比的输出。 ## 本仓库包含的内容 - 30 个基准合约(分为 3 个等级,每级 10 个) - 每个合约对应的 Ground truth JSON - TypeScript 评分 CLI - 提交 schema - 公共排行榜 - 真实性排行榜(检测 + 利用 + 修复) ## 本仓库不包含的内容 - 0xDefend 专有 pipeline 逻辑 - LLM 提示词/系统指令 - 内部编排代码 - 私有基础设施 ## 快速开始 ``` bun install bun run src/cli.ts score ./results/0xdefend-v1.json --strict ``` ## 可复现性(v0.2 真实性赛道) ``` git clone https://github.com/0xdefence/defi30.git cd defi30 bun install ./scripts/run-realism.sh ./results/0xdefend-v1.json bun run src/cli.ts score ./results/submission-with-realism.json --strict ``` 生成的产物: - `results/realism-validation.json` - `results/submission-with-realism.json` - `results/latest-report.json` - `results/latest-report.md` 版本控制与完整性: - [BENCHMARK_VERSION.md](./BENCHMARK_VERSION.md) - [BENCHMARK_CHECKSUMS.json](./BENCHMARK_CHECKSUMS.json) ## 仓库结构 ``` defi-30/ ├── contracts/ │ ├── tier1/ │ ├── tier2/ │ └── tier3/ ├── src/ │ ├── types.ts │ ├── loader.ts │ ├── matcher.ts │ ├── scorer.ts │ ├── reporter.ts │ └── cli.ts ├── results/ │ ├── 0xdefend-v1.json │ └── LEADERBOARD.md ├── METHODOLOGY.md └── CONTRIBUTING.md ``` ## 评分权重(v0.2 感知执行) - 检出率:40% - 精确率:20% - 严重性准确率:10% - 漏洞利用成功率:20% - 修复成功率:10% 综合得分 = `(检出率 * 0.4) + (精确率 * 0.2) + (严重性 * 0.1) + (漏洞利用 * 0.2) + (修复 * 0.1)` 参见 [METHODOLOGY.md](./METHODOLOGY.md) 和 [docs/EVALUATION_REALISM_MODE.md](./docs/EVALUATION_REALISM_MODE.md)。 分类规则:[TAXONOMY.md](./TAXONOMY.md) ## 排行榜(赛道分离) DeFi-30 发布两个独立的赛道,**不**进行合并: 1. 仅检测赛道 (`results/LEADERBOARD.md`) 2. 真实性赛道 (`results/LEADERBOARD_REALISM.md`) 各赛道的分数不具备直接可比性。 ## DeFi-30 与 EVMbench 对比(简述) - **EVMbench**:侧重于广泛的智能合约基准测试/测试工具。 - **DeFi-30**:侧重于 DeFi 的基准测试,具有透明的 Ground truth 和双赛道评分。 两者是互补的。DeFi-30 专为 DeFi 特定的漏洞模式评估和可复现的社区提交而设计。
标签:AI安全, Bun, Chat Copilot, DeFi, Homebrew安装, TypeScript, Web3, 云安全监控, 公共排行榜, 区块链, 安全插件, 安全补丁, 文档安全, 文档结构分析, 智能合约安全, 真实漏洞库, 评估框架, 静态分析