Kzian/phishing-detection-system
GitHub: Kzian/phishing-detection-system
一个AI驱动的钓鱼检测系统,可自动识别URL、邮件和短信中的钓鱼内容。
Stars: 0 | Forks: 0
## 🚀 入门指南
### 前置条件
- Python 3.10+
- Git
- Node.js (用于前端)
- n8n (用于自动化工作流)
### 安装说明
```
# 克隆仓库
git clone https://github.com/Kzian/phishing-detection-system.git
cd phishing-detection-system
# 创建并激活虚拟环境
python3 -m venv venv
source venv/bin/activate
# 安装依赖项
pip install -r requirements.txt
# 训练所有模型
python3 backend/detection/url_detector.py
python3 backend/detection/email_detector.py
python3 backend/detection/sms_detector.py
# 运行后端
uvicorn backend.main:app --reload
```
## 📊 模型性能
### 第二阶段 — URL 检测
数据集:GregaVrbancic 钓鱼数据集 (88,647 个 URL, 111 个特征)
| 指标 | 合法 | 钓鱼 |
|---|---|---|
| 精确率 | 98% | 95% |
| 召回率 | 97% | 96% |
| F1 分数 | 98% | 96% |
| **准确率** | **97%** | |
### 第三阶段 — 邮件检测
数据集:综合钓鱼邮件数据集 — Kaggle (82,484 封邮件)
| 指标 | 合法 | 钓鱼 |
|---|---|---|
| 精确率 | 99% | 98% |
| 召回率 | 98% | 99% |
| F1 分数 | 98% | 98% |
| **准确率** | **98%** | |
### 第四阶段 — 短信/短信钓鱼检测
数据集:UCI SMS 垃圾短信收集 (5,570 条信息)
| 指标 | 合法 | 垃圾/钓鱼 |
|---|---|---|
| 精确率 | 99% | 86% |
| 召回率 | 98% | 95% |
| F1 分数 | 98% | 90% |
| **准确率** | **97%** | |
## 🗺️ 开发路线图
- [x] 第一阶段 — 环境搭建与项目结构
- [x] 第二阶段 — URL 钓鱼检测 (Random Forest, 97% 准确率)
- [x] 第三阶段 — 邮件钓鱼检测 (TF-IDF + LR, 98% 准确率)
- [x] 第四阶段 — 短信钓鱼检测 (97% 准确率)
- [ ] 第五阶段 — 自动化事件响应 (n8n)
- [ ] 第六阶段 — 仪表板与完整系统集成
- [ ] 第七阶段 — 评估与论文撰写
## 👤 作者
**Cyb3rry**
网络安全硕士候选人 — FUTO
| 讲师 | 网络安全研究员 | AI 爱好者
GitHub: [@Kzian](https://github.com/Kzian)
## 📄 许可证
本项目是为学术研究目的而开发。
## 🙏 致谢
- GregaVrbancic 钓鱼数据集
- Kaggle 钓鱼邮件数据集 (Naser Abdullah Alam)
- UCI SMS 垃圾短信收集
- HuggingFace Transformers
- Anthropic Claude API
- FUTO 计算机科学系
标签:AMSI绕过, Apex, MITM代理, n8n, Python, URL检测, 人工智能, 后端开发, 威胁检测, 安全防护, 无后门, 机器学习, 模型训练, 用户模式Hook绕过, 短信检测, 网络安全, 网络安全研究, 自动化事件响应, 逆向工具, 邮件检测, 钓鱼检测, 隐私保护