jhandsomeboy12138/LLM4SmartContractPapers
GitHub: jhandsomeboy12138/LLM4SmartContractPapers
一份聚焦LLM智能体在智能合约漏洞检测、审计与利用生成方面的精选论文列表,汇总2023–2026年关键研究成果。
Stars: 0 | Forks: 0
# 基于LLM的智能合约漏洞检测论文



一份关于**基于LLM的智能合约漏洞检测、审计与利用生成**系统的必读论文精选。涵盖2023年至2026年的研究成果。
## 目录
- [1. 综述论文](#1-survey-papers)
- [2. 多智能体协同审计](#2-multi-agent-collaborative-auditing)
- [3. 对抗/双角色智能体框架](#3-adversarial--dual-role-agent-frameworks)
- [4. 知识驱动的智能体检测](#4-knowledge-driven-agentic-detection)
- [5. LLM智能体 + 程序分析混合](#5-llm-agent--program-analysis-hybrid)
- [6. 多视角智能体审计](#6-multi-perspective-agent-auditing)
- [7. 多智能体强化学习](#7-multi-agent-reinforcement-learning)
- [8. 端到端利用生成智能体](#8-end-to-end-exploit-generation-agents)
- [9. 智能体管道的微调与知识蒸馏](#9-fine-tuning--knowledge-distillation-for-agent-pipelines)
- [10. 基准测试与评估](#10-benchmarks--evaluation)
## 1. 综述论文
- **区块链安全的大型语言模型:系统性文献综述**
*IACR ePrint 2024* — *涵盖65+种基于LLM的智能合约安全工具,包括基于智能体的方法*
[](https://eprint.iacr.org/2024/477.pdf)
- **生成式大型语言模型在智能合约漏洞检测中的使用**
*arXiv 2025* — *系统回顾22种基于LLM的智能合约漏洞检测工具并评估9种工具*
[](https://arxiv.org/abs/2504.04685)
- **智能体安全综述:应用、威胁与防御**
*arXiv 2025* — *连接LLM智能体的应用、威胁与防御,包括区块链安全*
[](https://arxiv.org/abs/2510.06445)
## 2. 多智能体协同审计
- **通过LLM驱动的多智能体系统实现高级智能合约漏洞检测(LLM-SmartAudit)**
*IEEE TSE 2025* — *Zhiyuan Wei, Jing Sun, Yuqiang Sun, Ye Liu, Daoyuan Wu, Zijian Zhang, Xianhao Zhang, Meng Li, Yang Liu, Chunmiao Li, Mingchao Wan, Jin Dong, Liehuang Zhu*
[](https://arxiv.org/abs/2410.09381)
- **结合微调与基于LLM的智能体进行带理由说明的直观智能合约审计(iAudit)**
*ICSE 2025* — *Wei Ma, Daoyuan Wu, Yuqiang Sun, Tianwen Wang, Shangqing Liu, Jian Zhang, Yue Xue, Yang Liu*
[](https://arxiv.org/abs/2403.16073)
- **Smartify: 用于Solidity和Move智能合约的自动化漏洞检测与修复的多智能体框架**
*arXiv 2025* — *五智能体流水线(审计者、建筑师、代码生成器、精炼器、验证器),带有RAG和自优化循环*
[](https://arxiv.org/abs/2502.18515)
- **Agent4Vul: 多模态LLM智能体用于智能合约漏洞检测**
*Science China Information Sciences 2025* — *Jie W., Qiu W., Yang H. et al.*
[](https://link.springer.com/article/10.1007/s11432-024-4402-2)
## 3. 对抗/双角色智能体框架
- **大型语言模型驱动的智能合约漏洞检测:新视角(GPTLens)**
*IEEE TPS-ISA 2023* — *Sihao Hu, Tiansheng Huang, Fatih İlhan, Selim Furkan Tekin, Ling Liu*
[](https://arxiv.org/abs/2310.01152) [](https://github.com/git-disl/GPTLens)
## 4. 知识驱动的智能体检测
- **Knowdit: 带审计知识总结的智能合约智能体检测 ⭐ 2026新论文**
*arXiv 2026* — *Ziqiao Kong等人;从审计报告构建知识图谱,结合多智能体迭代模糊测试循环与共享工作内存*
[](https://arxiv.org/abs/2603.26270)
## 5. LLM智能体 + 程序分析混合
- **GPTScan:通过结合GPT与程序分析检测智能合约逻辑漏洞**
*ICSE 2024* — *Yuqiang Sun, Daoyuan Wu, Yue Xue, Han Liu, Haijun Wang, Zhengzi Xu, Xiaofei Xie, Yang Liu*
[](https://arxiv.org/abs/2308.03314)
- **PropertyGPT: 通过检索增强属性生成实现智能合约的形式化验证** 🏆 杰出论文奖
*NDSS 2025* — *Ye Liu, Yue Xue, Daoyuan Wu, Yuqiang Sun, Yi Li, Miaolei Shi, Yang Liu*
[](https://arxiv.org/abs/2405.02580)
- **LLM4Vuln: 解耦并增强LLM漏洞推理能力的统一评估框架**
*arXiv 2024* — *Yuqiang Sun, Daoyuan Wu, Yue Xue, Han Liu, Wei Ma, Lyuye Zhang, Miaolei Shi, Yang Liu*
[](https://arxiv.org/abs/2401.16185)
- **AuditGPT: 使用ChatGPT进行智能合约审计**
*arXiv 2024* — *S. Xia, S. Shao, M. He, T. Yu, L. Song, Y. Zhang*
[](https://arxiv.org/abs/2404.04306)
- **SmartGuard: 用于智能合约漏洞检测的LLM增强框架**
*Expert Systems with Applications 2025* — *Ding H., Liu Y., Piao X., Song H., Ji Z.; 语义代码检索 + 链式思维推理,95% F1*
[](https://doi.org/10.1016/j.eswa.2024.126479)
- **PROMFUZZ: 利用LLM驱动的、面向错误的复合分析检测智能合约的功能漏洞**
*ISSTA 2025* — *LLM生成的面向错误的分析指导模糊测试以检测功能漏洞*
- **SmartInv: 多模态学习用于智能合约不变式推理**
*ICSE 2024 (companion)* — *Sally Junsong Wang, Kexin Pei, Junfeng Yang; 分层思维提示用于不变式生成*
[](https://arxiv.org/abs/2411.07491)
- **不再有隐藏的陷阱?使用LLM驱动的混合分析(SCALM)暴露智能合约不良实践**
*arXiv 2025* — *上下文感知函数级切片 + 基于知识增强的语义推理向量化模式匹配*
[](https://arxiv.org/abs/2512.15179)
## 6. 多视角智能体审计
- **LLMSmartSec: 使用LLM和注释控制流图进行智能合约安全审计**
*IEEE Blockchain 2024* — *Viraaji Mothukuri, Reza M. Parizi, J. L. Massa*
[](https://ieeexplore.ieee.org/document/10664261/)
- **SmartLLM: 使用定制生成式AI进行智能合约审计**
*arXiv 2025* — *LLaMA 3.1 + RAG结合ERC文档;引入验证者角色进行事实核查*
[](https://arxiv.org/abs/2502.13167)
## 7. 多智能体强化学习
- **基于图注意力网络的多智能体强化学习框架,用于鲁棒的智能合约漏洞检测**
*Scientific Reports 2025* — *分层GAT + 多智能体演员-评论家;用于漏洞检测的高层与低层策略*
[](https://www.nature.com/articles/s41598-025-14032-w)
- **去中心化金融(DeFi)中的智能合约安全:使用强化学习增强漏洞检测**
*Applied Sciences 2025* — *在控制流图上使用DQN和PPO进行漏洞分类*
[](https://www.mdpi.com/2076-3417/15/11/5924) [](https://github.com/jjdlg361/SmartContractRL)
- **使用强化学习引导的模糊测试有效生成智能合约中的漏洞交易序列**
*ASE 2022* — *Jiao Su, Hai-Ning Dai, Lingxiao Wang, Zibin Zheng, Xiaolong Luo*
[](https://dl.acm.org/doi/10.1145/3551349.3560429)
## 8. 端到端利用生成智能体
- **A1: AI智能体智能合约利用生成**
*arXiv 2025* — *Arthur Gervais, Kaili Zhou等人;具有6个领域特定工具的智能体系统,用于自主漏洞发现*
[](https://arxiv.org/abs/2507.05558)
- **PoCo: 智能合约利用生成的智能体式概念验证**
*arXiv 2025* — *将审计报告转换为可执行的概念验证利用的智能体框架;在23个真实世界漏洞上测试*
[](https://arxiv.org/abs/2511.02780)
- **SmartPoc: 用于智能合约漏洞的LLM驱动概念验证合成**
*2025* — *Chen等人;LLM驱动的详细推理与执行,从审计报告合成经过验证的概念验证*
## 9. 智能体管道的微调与知识蒸馏
- **FTSmartAudit: 使用微调LLM的智能合约自动化审计知识蒸馏增强框架**
*arXiv 2024* — *Zhiyuan Wei, Jing Sun等人;从大型智能体工作流中多阶段知识蒸馏到轻量级模型*
[](https://arxiv.org/abs/2410.13918)
- **Smart-LLaMA-DPO: 用于可解释智能合约漏洞检测的强化大型语言模型**
*ISSTA 2025* — *Lei Yu, Shiqi Chen等人;持续预训练 + SFT + DPO用于检测与解释*
[](https://yangli8953.github.io/issta2025-ae-paper11.pdf)
- **VulnScan GPT: 结合向量数据库与GPT模型的智能合约漏洞检测新框架**
*Journal of Surveillance, Security and Safety 2024* — *函数签名提取 + 向量数据库 + 基于GPT的检测*
[](https://www.oaepublish.com/articles/jsss.2024.21)
- **通过微调LLM增强DApp中的智能合约漏洞检测**
*arXiv 2025* — *215个真实世界DApp项目(4,998个合约);使用Llama3-8B和Qwen2-7B,配合FFT和LoRA*
[](https://arxiv.org/abs/2504.05006)
## 10. 基准测试与评估
- **EVMbench: 在智能合约安全上评估AI智能体 ⭐ 2026新论文**
*OpenAI技术报告2026* — *Justin Wang等人;Detect/Patch/Exploit任务;测试GPT-5.2, GPT-5.3-Codex, Gemini 3 Pro*
[](https://cdn.openai.com/evmbench/evmbench.pdf)
- **用于大规模智能合约漏洞数据集构建的LLM驱动框架(forge)**
*ICSE 2026* — *基于MapReduce的LLM流水线,在81,390个Solidity文件中构建了27,497个漏洞发现*
[](https://nzjohng.github.io/publications/papers/icse2026.pdf)
## 11. 技术报告、博客文章与行业资源
### 11.1 红队测试与能力评估
- **智能合约——AI智能体发现460万美元区块链智能合约漏洞(SCONE-bench)**
*Anthropic前沿红队博客,2025年12月* — *评估10个前沿模型在405个真实世界被利用合约上的表现;Claude Opus 4.5 + Sonnet 4.5 + GPT-5在赛后合约上发现了460万美元的模拟漏洞;在2,849个全新合约中发现了2个零日漏洞*
[](https://red.anthropic.com/2025/smart-contracts/)
- **介绍EVMbench——范式博客**
*Paradigm,2026年2月* — *GPT-5.3-Codex漏洞修复超过70%的Code4rena漏洞(从<20%提升);用于检测/修复/利用任务的开放评估框架*
[](https://www.paradigm.xyz/2026/02/evmbench)
- **EVMbench:在智能合约安全上评估AI智能体——OpenAI**
*OpenAI技术报告,2026年2月* — *与Paradigm合作;测试GPT-5.2, GPT-5.3-Codex, Gemini 3 Pro在40次审计中120个 curated 漏洞上的表现*
[](https://cdn.openai.com/evmbench/evmbench.pdf)
- **我们审计了OpenAI的EVMbench。以下是发现**
*OpenZeppelin博客,2026年3月* — *对EVMbench的批判性审计,揭示了4+个无效的高严重性发现,训练数据污染问题,以及方法论缺陷*
[](https://www.openzeppelin.com/news/openai-evmbench-audit)
- **项目Glasswing:在AI时代保护关键软件**
*Anthropic,2026年4月* — *AI模型(Mythos Preview)识别和利用关键开源软件中的漏洞;技术细节请参见前沿红队博客*
[](https://www.anth.com/glasswing)
### 11.2 行业采用与AI原生审计
- **我们如何使Trail of Bits AI原生(目前)**
*Trail of Bits博客,2026年3月* — *94个插件,201个技能,84个专用智能体;AI增强审计员每周发现200个漏洞;六部分操作系统已开源*
[](https://blog.trailofbits.com/2026/03/31/how-we-made-trail-of-bits-ai-native-so-far/)
- **AI在智能合约审计中:弥合Web3安全缺口**
*SigIntZero博客,2026年3月* — *对Anthropic/OpenAI AI驱动漏洞扫描器的全面分析;OpenZeppelin的AI工具将审计时间减少50%;DARPA AIxCC结果*
[](https://sigintzero.com/blog/ai-auditing)
- **2026年智能合约审计格局:为什么34亿美元加密货币盗窃要求安全革命**
*BlockEden.xyz,2026年1月* — *AI智能体、连续监控和混合人机审计如何重塑智能合约安全*
[](https://blockeden.xyz/blog/2026/01/17/smart-contract-audit-landscape-vulnerabilities-prevention-2026/)
- **OpenAI与Paradigm合作推出智能合约安全的智能体工具**
*The Block,2026年2月* — *行业报道OpenAI-Paradigm在EVMbench上的合作及其对DeFi安全的意义*
[](https://www.theblock.co/post/390408/openai-and-paradigm-partner-on-ai-agent-tool-for-smart-contract-security)
### 11.3 分析与评论
- **Anthropic现在可以破解智能合约了——AI智能体对Web3安全行业的意义(2026)**
*AnChain.AI博客,2025年12月* — *对SCONE-bench结果的详细分析,包含进攻与防御的不对称性及其对DeFi协议的启示*
[](https://www.anchain.ai/blog/anthropic-red)
- **AI智能体仅花费1.22美元就能摧毁智能合约安全——揭示令人恐惧的经济现实**
*CryptoSlate,2025年12月* — *深入探讨利用经济学:70.2%的成本下降,每代模型1.3个月的翻倍时间*
[](https://cryptoslate.com/anthropic-ai-smart-contract-exploits/)
- **AI现在可以大规模利用智能合约——而DeFi尚未准备好**
*Medium (Activated Thinker),2026年2月* — *对EVMbench结果的利用经济学分析,攻击者在约6000美元漏洞价值时即可盈利*
[](https://medium.com/activated-thinker/ai-can-now-exploit-smart-contracts-at-scale-and-defi-isnt-ready-eb72cbed1b71)
## 致谢
**如何贡献**:欢迎提交Pull Request以添加新的必读论文。请遵循上述格式,并确保论文质量上乘(发表于顶级会议或arXiv上被高度引用)。
**相关资源**:
- [Awesome-LLMs-for-Vulnerability-Detection](https://github.com/huhusmang/Awesome-LLMs-for-Vulnerability-Detection)
- [Academic Smart Contract Papers](https://github.com/hzysvilla/Academic_Smart_Contract_Papers)
标签:2023, 2024, 2025, 2026, AICR, arXiv, PyRIT, 区块链安全, 基准测试与评估, 多智能体协同审计, 多智能体强化学习, 多智能体系统, 多视角审计, 大语言模型安全, 对抗智能体, 微调与知识蒸馏, 智能合约安全, 智能合约审计, 智能合约漏洞检测, 智能合约漏洞生成, 机密管理, 知识驱动检测, 程序分析混合, 端到端漏洞生成