SunnY2513/Phishing-Website-Detection-ML
GitHub: SunnY2513/Phishing-Website-Detection-ML
该项目利用随机森林、SVM、决策树等机器学习算法,通过分析 URL 特征来自动识别钓鱼网站与合法网站。
Stars: 0 | Forks: 1
基于机器学习的钓鱼网站检测
概述
钓鱼攻击是最常见的网络安全威胁之一,攻击者通过创建虚假网站来窃取用户名、密码和银行信息等敏感用户数据。本项目提出了一种基于机器学习的系统,用于检测钓鱼网站并将其分类为 **Phishing** 或 **Legitimate**。
该系统分析网站 URL 特征,并应用机器学习算法以高准确率识别恶意网站。
功能
* 检测钓鱼网站和合法网站
* URL 特征提取与预处理
* 基于机器学习的分类
* Django Web 应用程序界面
* 多种算法的性能比较
* 实时网站预测
## 使用的技术
* Python
* Django
* Scikit-Learn
* Pandas
* NumPy
* HTML
* CSS
* SQLite
## 机器学习算法
以下算法已实现并进行了评估:
1. Decision Tree Classifier
2. Random Forest Classifier
3. Support Vector Machine (SVM)
4. SGD Classifier
基于准确率和评估指标选择了表现最佳的模型。
## 数据集
本项目使用了一个包含钓鱼网站和合法网站 URL 的数据集。
文件:
* Website_urls.csv
* labeled_data.csv
数据集预处理包括:
* 数据清洗
* 特征提取
* 特征选择
* 标签编码
## 系统架构
用户输入 URL
↓
特征提取
↓
机器学习模型
↓
分类
↓
Phishing / Legitimate 结果
## 性能
| 算法 | 准确率 |
| -------------- | -------- |
| Decision Tree | ~94% |
| Random Forest | ~95% |
| SGD Classifier | ~96% |
| SVM | ~94% |
在实验过程中,SGD Classifier 获得了最高的准确率。
## 安装
克隆仓库:
```
git clone https://github.com/SunnY2513/Phishing-Website-Detection-ML.git
```
导航至项目文件夹:
```
cd detection_of_phishing_websites
```
安装依赖项:
```
pip install -r requirements.txt
```
运行 Django 服务器:
```
python manage.py runserver
```
打开:
```
http://127.0.0.1:8000/
```
## 未来增强功能
* 基于 Deep Learning 的钓鱼检测
* 实时浏览器扩展
* 云部署
* 改进的特征工程
* 实时威胁情报集成
## 许可证
本项目为学术和教育目的而开发。
标签:Apex, Django, Python, 后端开发, 多模态安全, 数据分类, 无后门, 机器学习, 网络安全, 逆向工具, 钓鱼检测, 隐私保护