jhandsomeboy12138/LLM4SmartContractPapers

GitHub: jhandsomeboy12138/LLM4SmartContractPapers

一份聚焦LLM智能体在智能合约漏洞检测、审计与利用生成方面的精选论文列表,汇总2023–2026年关键研究成果。

Stars: 0 | Forks: 0

# 基于LLM的智能合约漏洞检测论文 ![Awesome](https://img.shields.io/badge/Awesome-LLM%20SC%20Security-orange) ![Last Updated](https://img.shields.io/badge/Last%20Updated-April%202026-green) ![Papers](https://img.shields.io/badge/Papers-25%2B-blue) 一份关于**基于LLM的智能合约漏洞检测、审计与利用生成**系统的必读论文精选。涵盖2023年至2026年的研究成果。 ## 目录 - [1. 综述论文](#1-survey-papers) - [2. 多智能体协同审计](#2-multi-agent-collaborative-auditing) - [3. 对抗/双角色智能体框架](#3-adversarial--dual-role-agent-frameworks) - [4. 知识驱动的智能体检测](#4-knowledge-driven-agentic-detection) - [5. LLM智能体 + 程序分析混合](#5-llm-agent--program-analysis-hybrid) - [6. 多视角智能体审计](#6-multi-perspective-agent-auditing) - [7. 多智能体强化学习](#7-multi-agent-reinforcement-learning) - [8. 端到端利用生成智能体](#8-end-to-end-exploit-generation-agents) - [9. 智能体管道的微调与知识蒸馏](#9-fine-tuning--knowledge-distillation-for-agent-pipelines) - [10. 基准测试与评估](#10-benchmarks--evaluation) ## 1. 综述论文 - **区块链安全的大型语言模型:系统性文献综述** *IACR ePrint 2024* — *涵盖65+种基于LLM的智能合约安全工具,包括基于智能体的方法* [![Paper](https://img.shields.io/badge/Paper-IACR-red)](https://eprint.iacr.org/2024/477.pdf) - **生成式大型语言模型在智能合约漏洞检测中的使用** *arXiv 2025* — *系统回顾22种基于LLM的智能合约漏洞检测工具并评估9种工具* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2504.04685) - **智能体安全综述:应用、威胁与防御** *arXiv 2025* — *连接LLM智能体的应用、威胁与防御,包括区块链安全* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2510.06445) ## 2. 多智能体协同审计 - **通过LLM驱动的多智能体系统实现高级智能合约漏洞检测(LLM-SmartAudit)** *IEEE TSE 2025* — *Zhiyuan Wei, Jing Sun, Yuqiang Sun, Ye Liu, Daoyuan Wu, Zijian Zhang, Xianhao Zhang, Meng Li, Yang Liu, Chunmiao Li, Mingchao Wan, Jin Dong, Liehuang Zhu* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2410.09381) - **结合微调与基于LLM的智能体进行带理由说明的直观智能合约审计(iAudit)** *ICSE 2025* — *Wei Ma, Daoyuan Wu, Yuqiang Sun, Tianwen Wang, Shangqing Liu, Jian Zhang, Yue Xue, Yang Liu* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2403.16073) - **Smartify: 用于Solidity和Move智能合约的自动化漏洞检测与修复的多智能体框架** *arXiv 2025* — *五智能体流水线(审计者、建筑师、代码生成器、精炼器、验证器),带有RAG和自优化循环* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2502.18515) - **Agent4Vul: 多模态LLM智能体用于智能合约漏洞检测** *Science China Information Sciences 2025* — *Jie W., Qiu W., Yang H. et al.* [![Paper](https://img.shields.io/badge/Paper-Springer-red)](https://link.springer.com/article/10.1007/s11432-024-4402-2) ## 3. 对抗/双角色智能体框架 - **大型语言模型驱动的智能合约漏洞检测:新视角(GPTLens)** *IEEE TPS-ISA 2023* — *Sihao Hu, Tiansheng Huang, Fatih İlhan, Selim Furkan Tekin, Ling Liu* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2310.01152) [![Code](https://img.shields.io/badge/Code-GitHub-blue)](https://github.com/git-disl/GPTLens) ## 4. 知识驱动的智能体检测 - **Knowdit: 带审计知识总结的智能合约智能体检测 ⭐ 2026新论文** *arXiv 2026* — *Ziqiao Kong等人;从审计报告构建知识图谱,结合多智能体迭代模糊测试循环与共享工作内存* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2603.26270) ## 5. LLM智能体 + 程序分析混合 - **GPTScan:通过结合GPT与程序分析检测智能合约逻辑漏洞** *ICSE 2024* — *Yuqiang Sun, Daoyuan Wu, Yue Xue, Han Liu, Haijun Wang, Zhengzi Xu, Xiaofei Xie, Yang Liu* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2308.03314) - **PropertyGPT: 通过检索增强属性生成实现智能合约的形式化验证** 🏆 杰出论文奖 *NDSS 2025* — *Ye Liu, Yue Xue, Daoyuan Wu, Yuqiang Sun, Yi Li, Miaolei Shi, Yang Liu* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2405.02580) - **LLM4Vuln: 解耦并增强LLM漏洞推理能力的统一评估框架** *arXiv 2024* — *Yuqiang Sun, Daoyuan Wu, Yue Xue, Han Liu, Wei Ma, Lyuye Zhang, Miaolei Shi, Yang Liu* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2401.16185) - **AuditGPT: 使用ChatGPT进行智能合约审计** *arXiv 2024* — *S. Xia, S. Shao, M. He, T. Yu, L. Song, Y. Zhang* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2404.04306) - **SmartGuard: 用于智能合约漏洞检测的LLM增强框架** *Expert Systems with Applications 2025* — *Ding H., Liu Y., Piao X., Song H., Ji Z.; 语义代码检索 + 链式思维推理,95% F1* [![Paper](https://img.shields.io/badge/Paper-Elsevier-red)](https://doi.org/10.1016/j.eswa.2024.126479) - **PROMFUZZ: 利用LLM驱动的、面向错误的复合分析检测智能合约的功能漏洞** *ISSTA 2025* — *LLM生成的面向错误的分析指导模糊测试以检测功能漏洞* - **SmartInv: 多模态学习用于智能合约不变式推理** *ICSE 2024 (companion)* — *Sally Junsong Wang, Kexin Pei, Junfeng Yang; 分层思维提示用于不变式生成* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2411.07491) - **不再有隐藏的陷阱?使用LLM驱动的混合分析(SCALM)暴露智能合约不良实践** *arXiv 2025* — *上下文感知函数级切片 + 基于知识增强的语义推理向量化模式匹配* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2512.15179) ## 6. 多视角智能体审计 - **LLMSmartSec: 使用LLM和注释控制流图进行智能合约安全审计** *IEEE Blockchain 2024* — *Viraaji Mothukuri, Reza M. Parizi, J. L. Massa* [![Paper](https://img.shields.io/badge/Paper-IEEE-red)](https://ieeexplore.ieee.org/document/10664261/) - **SmartLLM: 使用定制生成式AI进行智能合约审计** *arXiv 2025* — *LLaMA 3.1 + RAG结合ERC文档;引入验证者角色进行事实核查* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2502.13167) ## 7. 多智能体强化学习 - **基于图注意力网络的多智能体强化学习框架,用于鲁棒的智能合约漏洞检测** *Scientific Reports 2025* — *分层GAT + 多智能体演员-评论家;用于漏洞检测的高层与低层策略* [![Paper](https://img.shields.io/badge/Paper-Nature-red)](https://www.nature.com/articles/s41598-025-14032-w) - **去中心化金融(DeFi)中的智能合约安全:使用强化学习增强漏洞检测** *Applied Sciences 2025* — *在控制流图上使用DQN和PPO进行漏洞分类* [![Paper](https://img.shields.io/badge/Paper-MDPI-red)](https://www.mdpi.com/2076-3417/15/11/5924) [![Code](https://img.shields.io/badge/Code-GitHub-blue)](https://github.com/jjdlg361/SmartContractRL) - **使用强化学习引导的模糊测试有效生成智能合约中的漏洞交易序列** *ASE 2022* — *Jiao Su, Hai-Ning Dai, Lingxiao Wang, Zibin Zheng, Xiaolong Luo* [![Paper](https://img.shields.io/badge/Paper-ACM-red)](https://dl.acm.org/doi/10.1145/3551349.3560429) ## 8. 端到端利用生成智能体 - **A1: AI智能体智能合约利用生成** *arXiv 2025* — *Arthur Gervais, Kaili Zhou等人;具有6个领域特定工具的智能体系统,用于自主漏洞发现* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2507.05558) - **PoCo: 智能合约利用生成的智能体式概念验证** *arXiv 2025* — *将审计报告转换为可执行的概念验证利用的智能体框架;在23个真实世界漏洞上测试* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2511.02780) - **SmartPoc: 用于智能合约漏洞的LLM驱动概念验证合成** *2025* — *Chen等人;LLM驱动的详细推理与执行,从审计报告合成经过验证的概念验证* ## 9. 智能体管道的微调与知识蒸馏 - **FTSmartAudit: 使用微调LLM的智能合约自动化审计知识蒸馏增强框架** *arXiv 2024* — *Zhiyuan Wei, Jing Sun等人;从大型智能体工作流中多阶段知识蒸馏到轻量级模型* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2410.13918) - **Smart-LLaMA-DPO: 用于可解释智能合约漏洞检测的强化大型语言模型** *ISSTA 2025* — *Lei Yu, Shiqi Chen等人;持续预训练 + SFT + DPO用于检测与解释* [![Paper](https://img.shields.io/badge/Paper-ACM-red)](https://yangli8953.github.io/issta2025-ae-paper11.pdf) - **VulnScan GPT: 结合向量数据库与GPT模型的智能合约漏洞检测新框架** *Journal of Surveillance, Security and Safety 2024* — *函数签名提取 + 向量数据库 + 基于GPT的检测* [![Paper](https://img.shields.io/badge/Paper-OAE-red)](https://www.oaepublish.com/articles/jsss.2024.21) - **通过微调LLM增强DApp中的智能合约漏洞检测** *arXiv 2025* — *215个真实世界DApp项目(4,998个合约);使用Llama3-8B和Qwen2-7B,配合FFT和LoRA* [![Paper](https://img.shields.io/badge/Paper-arXiv-red)](https://arxiv.org/abs/2504.05006) ## 10. 基准测试与评估 - **EVMbench: 在智能合约安全上评估AI智能体 ⭐ 2026新论文** *OpenAI技术报告2026* — *Justin Wang等人;Detect/Patch/Exploit任务;测试GPT-5.2, GPT-5.3-Codex, Gemini 3 Pro* [![Paper](https://img.shields.io/badge/Paper-OpenAI-red)](https://cdn.openai.com/evmbench/evmbench.pdf) - **用于大规模智能合约漏洞数据集构建的LLM驱动框架(forge)** *ICSE 2026* — *基于MapReduce的LLM流水线,在81,390个Solidity文件中构建了27,497个漏洞发现* [![Paper](https://img.shields.io/badge/Paper-PDF-red)](https://nzjohng.github.io/publications/papers/icse2026.pdf) ## 11. 技术报告、博客文章与行业资源 ### 11.1 红队测试与能力评估 - **智能合约——AI智能体发现460万美元区块链智能合约漏洞(SCONE-bench)** *Anthropic前沿红队博客,2025年12月* — *评估10个前沿模型在405个真实世界被利用合约上的表现;Claude Opus 4.5 + Sonnet 4.5 + GPT-5在赛后合约上发现了460万美元的模拟漏洞;在2,849个全新合约中发现了2个零日漏洞* [![博客](https://img.shields.io/badge/Blog-Anthropic-red)](https://red.anthropic.com/2025/smart-contracts/) - **介绍EVMbench——范式博客** *Paradigm,2026年2月* — *GPT-5.3-Codex漏洞修复超过70%的Code4rena漏洞(从<20%提升);用于检测/修复/利用任务的开放评估框架* [![博客](https://img.shields.io/badge/Blog-Paradigm-red)](https://www.paradigm.xyz/2026/02/evmbench) - **EVMbench:在智能合约安全上评估AI智能体——OpenAI** *OpenAI技术报告,2026年2月* — *与Paradigm合作;测试GPT-5.2, GPT-5.3-Codex, Gemini 3 Pro在40次审计中120个 curated 漏洞上的表现* [![报告](https://img.shields.io/badge/Report-OpenAI-red)](https://cdn.openai.com/evmbench/evmbench.pdf) - **我们审计了OpenAI的EVMbench。以下是发现** *OpenZeppelin博客,2026年3月* — *对EVMbench的批判性审计,揭示了4+个无效的高严重性发现,训练数据污染问题,以及方法论缺陷* [![博客](https://img.shields.io/badge/Blog-OpenZeppelin-red)](https://www.openzeppelin.com/news/openai-evmbench-audit) - **项目Glasswing:在AI时代保护关键软件** *Anthropic,2026年4月* — *AI模型(Mythos Preview)识别和利用关键开源软件中的漏洞;技术细节请参见前沿红队博客* [![博客](https://img.shields.io/badge/Blog-Anthropic-red)](https://www.anth.com/glasswing) ### 11.2 行业采用与AI原生审计 - **我们如何使Trail of Bits AI原生(目前)** *Trail of Bits博客,2026年3月* — *94个插件,201个技能,84个专用智能体;AI增强审计员每周发现200个漏洞;六部分操作系统已开源* [![博客](https://img.shields.io/badge/Blog-Trail%20of%20Bits-red)](https://blog.trailofbits.com/2026/03/31/how-we-made-trail-of-bits-ai-native-so-far/) - **AI在智能合约审计中:弥合Web3安全缺口** *SigIntZero博客,2026年3月* — *对Anthropic/OpenAI AI驱动漏洞扫描器的全面分析;OpenZeppelin的AI工具将审计时间减少50%;DARPA AIxCC结果* [![博客](https://img.shields.io/badge/Blog-SigIntZero-red)](https://sigintzero.com/blog/ai-auditing) - **2026年智能合约审计格局:为什么34亿美元加密货币盗窃要求安全革命** *BlockEden.xyz,2026年1月* — *AI智能体、连续监控和混合人机审计如何重塑智能合约安全* [![博客](https://img.shields.io/badge/Blog-BlockEden-red)](https://blockeden.xyz/blog/2026/01/17/smart-contract-audit-landscape-vulnerabilities-prevention-2026/) - **OpenAI与Paradigm合作推出智能合约安全的智能体工具** *The Block,2026年2月* — *行业报道OpenAI-Paradigm在EVMbench上的合作及其对DeFi安全的意义* [![博客](https://img.shields.io/badge/Blog-The%20Block-red)](https://www.theblock.co/post/390408/openai-and-paradigm-partner-on-ai-agent-tool-for-smart-contract-security) ### 11.3 分析与评论 - **Anthropic现在可以破解智能合约了——AI智能体对Web3安全行业的意义(2026)** *AnChain.AI博客,2025年12月* — *对SCONE-bench结果的详细分析,包含进攻与防御的不对称性及其对DeFi协议的启示* [![博客](https://img.shields.io/badge/Blog-AnChain.AI-red)](https://www.anchain.ai/blog/anthropic-red) - **AI智能体仅花费1.22美元就能摧毁智能合约安全——揭示令人恐惧的经济现实** *CryptoSlate,2025年12月* — *深入探讨利用经济学:70.2%的成本下降,每代模型1.3个月的翻倍时间* [![博客](https://img.shields.io/badge/Blog-CryptoSlate-red)](https://cryptoslate.com/anthropic-ai-smart-contract-exploits/) - **AI现在可以大规模利用智能合约——而DeFi尚未准备好** *Medium (Activated Thinker),2026年2月* — *对EVMbench结果的利用经济学分析,攻击者在约6000美元漏洞价值时即可盈利* [![博客](https://img.shields.io/badge/Blog-Medium-red)](https://medium.com/activated-thinker/ai-can-now-exploit-smart-contracts-at-scale-and-defi-isnt-ready-eb72cbed1b71) ## 致谢 **如何贡献**:欢迎提交Pull Request以添加新的必读论文。请遵循上述格式,并确保论文质量上乘(发表于顶级会议或arXiv上被高度引用)。 **相关资源**: - [Awesome-LLMs-for-Vulnerability-Detection](https://github.com/huhusmang/Awesome-LLMs-for-Vulnerability-Detection) - [Academic Smart Contract Papers](https://github.com/hzysvilla/Academic_Smart_Contract_Papers)
标签:2023, 2024, 2025, 2026, AICR, arXiv, PyRIT, 区块链安全, 基准测试与评估, 多智能体协同审计, 多智能体强化学习, 多智能体系统, 多视角审计, 大语言模型安全, 对抗智能体, 微调与知识蒸馏, 智能合约安全, 智能合约审计, 智能合约漏洞检测, 智能合约漏洞生成, 机密管理, 知识驱动检测, 程序分析混合, 端到端漏洞生成