muhammad-47/AI-Pentest-Pipeline

GitHub: muhammad-47/AI-Pentest-Pipeline

这是一个AI驱动的自动化渗透测试管道,用于比较不同大型语言模型在漏洞发现中的表现。

Stars: 0 | Forks: 0

# AI渗透测试管道 AI驱动的自动化渗透测试管道,比较Claude Sonnet、GPT-4o与Gemini 2.0 Flash的表现 ### Web仪表盘 ``` python3 app.py ``` Screenshot 2026-05-19 11 40 13 AM Screenshot 2026-05-19 11 41 31 AM Screenshot 2026-05-19 11 41 03 AM 在浏览器中打开 `http://127.0.0.1:5000` ## 实验环境 | 机器 | IP | 用途 | |---|---|---| | Kali Linux | 10.1.205.14 | 攻击机 — 运行管道 | | Metasploitable Linux | 10.1.205.12 | 目标1 — 存在漏洞的Ubuntu系统 | | Metasploitable Windows | 10.1.205.13 | 目标2 — 存在漏洞的Windows系统 | Screenshot 2026-05-22 11 03 22 PM ## 结果 — Claude Sonnet | 指标 | 结果 | |---|---| | 消耗的tokens数 | 9,542 | | 发现的漏洞数 | 9 / 9 | | 误报数 | 0 | | 报告质量 | 优秀 | ## 已识别的关键漏洞 | 端口 | 服务 | CVE | |---|---|---| | 21 | ProFTPD 1.3.5 | CVE-2015-3306 | | 80 | Apache 2.4.7 | CVE-2017-15710 | | 445 | Samba — SambaCry | CVE-2017-7494 | | 6697 | UnrealIRCd | CVE-2010-2075 | | 3306 | MySQL | 对外暴露 | ## 参考研究论文 - Deng et al. (2024) — PentestGPT — USENIX Security 2024 - Martinez et al. (2025) — Claude vs GPT-4 vs Copilot - CheckMate (2025) — 结合LLM的经典规划方法 ## 伦理声明 本项目在提赛德大学伦敦校区批准的伦理项目ID E4341888下开发。所有测试均仅在隔离的实验环境中针对Metasploitable虚拟机进行。未测试任何真实世界的系统。 ## 作者 **Muhammad Nasir** 信息与网络安全理学硕士(含高级实践) 提赛德大学伦敦校区 — 2026届 [![GitHub](https://img.shields.io/badge/GitHub-muhammad--47-blue)](https://github.com/muhammad-47)
标签:AI 驱动, CISA项目, Claude Sonnet, CVE 漏洞, DLL 劫持, Gemini 2.0 Flash, GPT-4o, Metasploitable, Python, Web 仪表板, 人工智能, 后端开发, 大语言模型, 安全测试, 实验室环境, 插件系统, 攻击性安全, 无后门, 比较分析, 渗透测试管道, 用户模式Hook绕过, 结构化查询, 结果分析, 网络安全, 自动化安全, 逆向工具, 隐私保护