SunnY2513/Phishing-Website-Detection-ML

GitHub: SunnY2513/Phishing-Website-Detection-ML

该项目利用随机森林、SVM、决策树等机器学习算法,通过分析 URL 特征来自动识别钓鱼网站与合法网站。

Stars: 0 | Forks: 1

基于机器学习的钓鱼网站检测 概述 钓鱼攻击是最常见的网络安全威胁之一,攻击者通过创建虚假网站来窃取用户名、密码和银行信息等敏感用户数据。本项目提出了一种基于机器学习的系统,用于检测钓鱼网站并将其分类为 **Phishing** 或 **Legitimate**。 该系统分析网站 URL 特征,并应用机器学习算法以高准确率识别恶意网站。 功能 * 检测钓鱼网站和合法网站 * URL 特征提取与预处理 * 基于机器学习的分类 * Django Web 应用程序界面 * 多种算法的性能比较 * 实时网站预测 ## 使用的技术 * Python * Django * Scikit-Learn * Pandas * NumPy * HTML * CSS * SQLite ## 机器学习算法 以下算法已实现并进行了评估: 1. Decision Tree Classifier 2. Random Forest Classifier 3. Support Vector Machine (SVM) 4. SGD Classifier 基于准确率和评估指标选择了表现最佳的模型。 ## 数据集 本项目使用了一个包含钓鱼网站和合法网站 URL 的数据集。 文件: * Website_urls.csv * labeled_data.csv 数据集预处理包括: * 数据清洗 * 特征提取 * 特征选择 * 标签编码 ## 系统架构 用户输入 URL ↓ 特征提取 ↓ 机器学习模型 ↓ 分类 ↓ Phishing / Legitimate 结果 ## 性能 | 算法 | 准确率 | | -------------- | -------- | | Decision Tree | ~94% | | Random Forest | ~95% | | SGD Classifier | ~96% | | SVM | ~94% | 在实验过程中,SGD Classifier 获得了最高的准确率。 ## 安装 克隆仓库: ``` git clone https://github.com/SunnY2513/Phishing-Website-Detection-ML.git ``` 导航至项目文件夹: ``` cd detection_of_phishing_websites ``` 安装依赖项: ``` pip install -r requirements.txt ``` 运行 Django 服务器: ``` python manage.py runserver ``` 打开: ``` http://127.0.0.1:8000/ ``` ## 未来增强功能 * 基于 Deep Learning 的钓鱼检测 * 实时浏览器扩展 * 云部署 * 改进的特征工程 * 实时威胁情报集成 ## 许可证 本项目为学术和教育目的而开发。
标签:Apex, Django, Python, 后端开发, 多模态安全, 数据分类, 无后门, 机器学习, 网络安全, 逆向工具, 钓鱼检测, 隐私保护