0xdefence/defi30

GitHub: 0xdefence/defi30

一个专注于 DeFi 智能合约的安全检测基准测试框架，提供检测与真实性双赛道评分。

Stars: 0 | Forks: 0

# DeFi-30 **DeFi 智能合约安全检测的开放基准测试。** DeFi-30 是一个原生 TypeScript 基准测试，用于评估任意工具（AI agent、静态分析器或人工辅助 pipeline）检测真实 DeFi 漏洞模式的能力。 ## 原则 - **考题公开**。 - **考生保密**。 - 可重复的评分、透明的方法论以及可对比的输出。 ## 本仓库包含的内容 - 30 个基准合约（分为 3 个等级，每级 10 个） - 每个合约对应的 Ground truth JSON - TypeScript 评分 CLI - 提交 schema - 公共排行榜 - 真实性排行榜（检测 + 利用 + 修复） ## 本仓库不包含的内容 - 0xDefend 专有 pipeline 逻辑 - LLM 提示词/系统指令 - 内部编排代码 - 私有基础设施 ## 快速开始 ``` bun install bun run src/cli.ts score ./results/0xdefend-v1.json --strict ``` ## 可复现性（v0.2 真实性赛道） ``` git clone https://github.com/0xdefence/defi30.git cd defi30 bun install ./scripts/run-realism.sh ./results/0xdefend-v1.json bun run src/cli.ts score ./results/submission-with-realism.json --strict ``` 生成的产物： - `results/realism-validation.json` - `results/submission-with-realism.json` - `results/latest-report.json` - `results/latest-report.md` 版本控制与完整性： - [BENCHMARK_VERSION.md](./BENCHMARK_VERSION.md) - [BENCHMARK_CHECKSUMS.json](./BENCHMARK_CHECKSUMS.json) ## 仓库结构 ``` defi-30/ ├── contracts/ │ ├── tier1/ │ ├── tier2/ │ └── tier3/ ├── src/ │ ├── types.ts │ ├── loader.ts │ ├── matcher.ts │ ├── scorer.ts │ ├── reporter.ts │ └── cli.ts ├── results/ │ ├── 0xdefend-v1.json │ └── LEADERBOARD.md ├── METHODOLOGY.md └── CONTRIBUTING.md ``` ## 评分权重（v0.2 感知执行） - 检出率：40% - 精确率：20% - 严重性准确率：10% - 漏洞利用成功率：20% - 修复成功率：10% 综合得分 = `(检出率 * 0.4) + (精确率 * 0.2) + (严重性 * 0.1) + (漏洞利用 * 0.2) + (修复 * 0.1)` 参见 [METHODOLOGY.md](./METHODOLOGY.md) 和 [docs/EVALUATION_REALISM_MODE.md](./docs/EVALUATION_REALISM_MODE.md)。分类规则：[TAXONOMY.md](./TAXONOMY.md) ## 排行榜（赛道分离） DeFi-30 发布两个独立的赛道，**不**进行合并： 1. 仅检测赛道 (`results/LEADERBOARD.md`) 2. 真实性赛道 (`results/LEADERBOARD_REALISM.md`) 各赛道的分数不具备直接可比性。 ## DeFi-30 与 EVMbench 对比（简述） - **EVMbench**：侧重于广泛的智能合约基准测试/测试工具。 - **DeFi-30**：侧重于 DeFi 的基准测试，具有透明的 Ground truth 和双赛道评分。两者是互补的。DeFi-30 专为 DeFi 特定的漏洞模式评估和可复现的社区提交而设计。

标签：AI安全, Bun, Chat Copilot, DeFi, Homebrew安装, TypeScript, Web3, 云安全监控, 公共排行榜, 区块链, 安全插件, 安全补丁, 文档安全, 文档结构分析, 智能合约安全, 真实漏洞库, 评估框架, 静态分析