mansredfire/BugPredict-AI

GitHub: mansredfire/BugPredict-AI

基于机器学习的 Nuclei 模板生成器，从历史漏洞报告中学习模式，为目标域名智能预测可能的漏洞类型并自动生成定制化扫描模板。

Stars: 0 | Forks: 0

# 🤖 BugPredict AI [![Python 3.10+](https://img.shields.io/badge/python-3.10+-blue.svg)](https://www.python.org/downloads/) [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) ## 🎯 概述 BugPredict AI 是一个 **Nuclei 模板生成器**，它利用基于历史数据训练的机器学习模型来生成定制化的安全测试模板。 **工作原理：** 1. 在你的数据上**训练 ML 模型**（包含特定版本的漏洞数据） 2. **提供目标域名**用于模板生成 3. **ML 预测**基于训练数据学习到的模式，推测可能的漏洞类型 4. **生成自定义 Nuclei YAML 模板**，按预测置信度排序 5. 使用生成的模板通过 Nuclei **扫描**目标 **此系统能做什么：** - ✅ 从历史漏洞报告中学习模式 - ✅ 生成定制化的 Nuclei 模板（非通用模板） - ✅ 基于 ML 预测结果对漏洞类型进行优先级排序 - ✅ 自动生成 10 个模板以节省手动创建的时间 **此系统不能做什么：** - ❌ 不主动扫描或测试目标域名 - ❌ 不指纹识别或检测技术栈版本（除非你添加此功能） - ❌ 不向目标发送 HTTP 请求 - ❌ 不发现漏洞（这是 Nuclei 的工作） **把它想象成：** 一个智能模板生成器，它从你过去的发现中学习，为 Nuclei 扫描创建更好的起点。 **价值所在：** 不需要手动创建通用的 Nuclei 模板，你可以获得通过学习到的模式加权生成的 ML 模板。 ## 🔧 系统要求 | 组件 | 最低配置 | 推荐配置 | |-----------|---------|-------------| | **Python** | 3.10+ | 3.11+ | | **RAM** | 4GB | 8GB | | **Disk Space** | 2GB | 5GB | | **OS** | Windows 10+, Ubuntu 20.04+, macOS 10.15+ | Latest versions | ## 📦 依赖项 ### 核心依赖（必需） ``` pandas>=2.0.0 # Data processing scikit-learn>=1.3.0 # Machine learning models sqlalchemy>=2.0.0 # Database connectivity pyyaml>=6.0 # Nuclei template generation ``` ### 可选数据库驱动 ``` # PostgreSQL pip install psycopg2-binary # MySQL pip install pymysql # SQL Server pip install pyodbc ``` ## 🚀 安装说明 ### Windows ``` # 从 GitHub 下载 ZIP，解压到桌面，然后： cd ~\Desktop\BugPredict-AI-main # 创建 virtual environment python -m venv venv .\venv\Scripts\Activate.ps1 # 安装 dependencies pip install -r requirements.txt # 验证安装 python -c "from src.collectors import CSVImporter; print('✓ Installation successful!')" ``` ### Linux/Mac ``` # Clone repository git clone https://github.com/yourusername/BugPredict-AI.git cd BugPredict-AI # 创建 virtual environment python3 -m venv venv source venv/bin/activate # 安装 dependencies pip install -r requirements.txt # 验证安装 python -c "from src.collectors import CSVImporter; print('✓ Installation successful!')" ``` ## 🗑️ 卸载说明 ``` # Deactivate virtual environment deactivate # Remove project directory cd .. rm -rf BugPredict-AI # Linux/Mac Remove-Item -Recurse -Force BugPredict-AI # Windows PowerShell ``` ## 📁 项目结构 ``` BugPredict-AI/ ├── data/ │ ├── models/ # Trained ML models │ └── mock_vulns.db # SQLite database (generated) ├── examples/ │ ├── sample_vulnerabilities.csv │ └── sample_vulnerabilities.json ├── nuclei-templates/ │ └── custom/ # Generated Nuclei templates ├── scripts/ │ ├── create_mock_database.py │ ├── train_from_csv.py │ ├── train_from_json.py │ ├── train_from_database.py │ └── generate_nuclei_templates.py ├── src/ │ ├── collectors/ # CSV/JSON/Database importers │ ├── features/ # Feature engineering (28 features) │ ├── models/ # ML models │ ├── training/ # Training pipeline │ └── inference/ # Prediction & template generation ├── requirements.txt └── README.md ``` ## 📖 文档 - **[INSTALL.md](INSTALL.md)** - 完整安装指南 - **[DATABASE.md](DATABASE.md)** - 数据库设置 (SQLite, PostgreSQL, MySQL, SQL Server) - **[TRAINING.md](TRAINING.md)** - 数据管理和模型训练 - **[SCRIPTS.md](SCRIPTS.md)** - 所有脚本文档 ## 🎓 使用场景 - **Bug Bounty 侦察** - 为初始目标测试生成自定义模板 - **渗透测试** - 创建针对特定任务的 Nuclei 模板 - **安全研究** - 基于技术栈预测漏洞模式 - **培训与教育** - 使用模拟数据学习基于 ML 的安全测试 ## 🎯 支持的漏洞类型 | # | 漏洞类型 | 严重程度范围 | Nuclei 模板 | |---|-------------------|----------------|-----------------| | 1 | SQL Injection (SQL 注入) | High - Critical | ✅ | | 2 | XSS (Cross-Site Scripting) | Medium - High | ✅ | | 3 | SSRF (Server-Side Request Forgery) | High - Critical | ✅ | | 4 | IDOR (Insecure Direct Object Reference) | Medium - High | ✅ | | 5 | CSRF (Cross-Site Request Forgery) | Medium - High | ✅ | | 6 | Authentication Bypass (身份验证绕过) | Critical | ✅ | | 7 | RCE (Remote Code Execution) | Critical | ✅ | | 8 | XXE (XML External Entity) | High - Critical | ✅ | | 9 | Path Traversal (路径遍历) | Medium - High | ✅ | | 10 | Information Disclosure (信息泄露) | Low - Medium | ✅ | **每个模板包括：** - 多个攻击向量 - 模式匹配器 - 严重程度评级 - CWE 映射 ## 🗄️ 支持的数据库 | 数据库 | 状态 | 附加包 | |----------|--------|--------------------| | **SQLite** | ✅ 完全支持 | None (built-in) | | **PostgreSQL** | ✅ 完全支持 | `pip install psycopg2-binary` | | **MySQL** | ✅ 完全支持 | `pip install pymysql` | | **SQL Server** | ✅ 完全支持 | `pip install pyodbc` | ## ⚠️ 重要说明 ### 模型准确率 - **100 份报告**: ~70-80% 准确率 - **500 份报告**: ~85-90% 准确率 - **1000+ 份报告**: ~90-95% 准确率 - 准确率取决于训练数据的质量 ### 训练时间 - **100 份报告**: ~5-10 秒 - **1000 份报告**: ~30-60 秒 - **10,000 份报告**: ~5-10 分钟 ### Nuclei 模板 - 生成的模板是**预测结果**，而非保证存在的漏洞 - 在报告之前务必**手动验证**发现 - 模板作为测试的**起点** - 预期基于 ML 的预测会有**误报** ## 📊 模型性能基准 **在 1000 份模拟漏洞报告上测试：** | 模型 | Accuracy (准确率) | Precision (精确率) | Recall (召回率) | F1-Score | |-------|----------|-----------|--------|----------| | Vulnerability Classifier (漏洞分类器) | 92-95% | 90-93% | 88-92% | 89-92% | | Severity Predictor (严重程度预测器) | 96-98% | 95-97% | 94-96% | 95-97% | **测试环境：** - Windows 11 / Ubuntu 22.04 上的 Python 3.11 - Intel i7-9700K, 16GB RAM - 训练时间：~45 秒 (1000 份报告) - 模板生成：每个目标约 2-3 秒 ## ⚠️ 免责声明 **仅供授权安全测试使用** 此工具设计用于： - ✅ 经书面授权的渗透测试 - ✅ 在规定范围内的 Bug Bounty 项目 - ✅ 对你拥有的系统进行安全研究 - ✅ 教育和培训目的 **切勿使用此工具：** - ❌ 在未经明确授权的情况下测试系统 - ❌ 执行恶意攻击或未授权访问 - ❌ 违反法律、法规或服务条款 - ❌ 未经适当批准测试生产系统 **法律要求：** 1. 测试前获取书面授权 2. 遵守所有 Bug Bounty 项目规则和范围 3. 尊重速率限制和测试边界 4. 通过正当渠道负责任地报告漏洞 **作者和贡献者不对本工具的任何误用负责。用户全权负责确保其测试合法且经授权。** ## 📄 许可证 MIT License - Copyright (c) 2026 BugPredict AI Contributors Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software. THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE. **由安全研究人员倾力构建，为安全研究人员服务** **负责任地使用。合乎道德地测试。祝狩猎愉快！** 🎯🔐 **如果这个项目对你有帮助，请给个 Star ⭐！**

标签：Apex, Bug Bounty, Google, ML, Nuclei, POC生成, Python, YAML, 人工智能, 可自定义解析器, 安全库, 恶意代码分类, 无后门, 机器学习, 模板生成, 用户模式Hook绕过, 结构化查询, 网络安全, 自动化安全, 逆向工具, 隐私保护, 预测分析