chhavimittal7489-svg/PhishGuard
GitHub: chhavimittal7489-svg/PhishGuard
PhishGuard 是一个基于随机森林与机器学习的钓鱼 URL 检测工具,帮助安全团队实时识别恶意网站并提供风险评估。
Stars: 0 | Forks: 0
# PhishGuard
PhishGuard 是一个基于机器学习的钓鱼 URL 检测系统,利用机器学习和网络威胁情报集成,实时识别恶意和可疑网站。
该系统结合手工构建的 URL 特征提取、随机森林分类模型、基于 WHOIS 的域名取证和威胁情报查询来分析 URL 并生成风险评估。它还包括一个 FastAPI 后端、基于 Web 的分析师仪表板和用于实时网站扫描的浏览器扩展。
## 功能特性
* 实时钓鱼 URL 检测
* 随机森林机器学习模型
* URL 特征提取管道
* WHOIS 域名情报查询
* URLhaus 威胁情报集成
* FastAPI REST API 后端
* 交互式前端仪表板
* 用于实时网站扫描的浏览器扩展
## 技术栈
* Python
* FastAPI
* scikit-learn
* Random Forest Classifier
* HTML/CSS/JavaScript
* Browser Extension APIs
* URLhaus API
* python-whois
## 系统架构
浏览器扩展 / 仪表板
↓
FastAPI 后端
↓
特征提取
↓
随机森林 ML 模型
↓
威胁情报 APIs + WHOIS
↓
风险分析与检测结果
## 运行方式
### 后端
```
cd backend
uvicorn main:app --reload
```
### 前端
在浏览器中打开 `frontend/index.html`。
### 浏览器扩展
1. 打开 `chrome://extensions`
2. 启用开发者模式
3. 点击"加载已解压的扩展程序"
4. 选择 `extension` 文件夹
## 未来规划
* 基于深度学习的钓鱼检测
* 邮件钓鱼分析
* 二维码钓鱼检测
* 云端部署
* 实时黑名单同步
## 免责声明
本项目是为教育和黑客马拉松目的开发的原型。
## 注意
由于 GitHub 文件大小限制,大型数据集文件和序列化模型权重未包含在此仓库中。仓库包含完整的模型训练管道(`train_model.py`)和重现训练模型所需的特征提取逻辑。
标签:AMSI绕过, Apex, AV绕过, DNS枚举, DNS解析, FastAPI, IP 地址批量处理, Phishing, Python, REST API, Scikit-learn, URLfuscation, URLhaus, URL分析, Web安全, WHOIS, 二维码钓鱼, 云部署, 前端仪表盘, 反钓鱼, 威胁情报, 威胁检测, 实时检测, 密码管理, 开发者工具, 开源项目, 恶意软件防护, 教育项目, 数据科学, 无后门, 机器学习, 模型训练, 浏览器扩展, 深度学习, 特征提取, 电子邮件钓鱼, 网络信息收集, 网络安全, 网络安全工具, 网络测绘, 网络钓鱼检测, 蓝队分析, 资源验证, 逆向工具, 随机森林, 隐私保护, 风险分析, 黑名单同步, 黑客马拉松