YASH7732/Smart-Phishing-Detection-URL-Risk-Analyzer-Yash

GitHub: YASH7732/Smart-Phishing-Detection-URL-Risk-Analyzer-Yash

结合威胁情报与规则引擎的混合式钓鱼URL风险检测系统，帮助用户在访问可疑链接前识别潜在钓鱼威胁。

Stars: 0 | Forks: 0

# 🔗 智能钓鱼检测与 URL 风险分析器一个基于 Web 的系统，用于分析 URL 并评估潜在的钓鱼风险，帮助用户在访问可疑或恶意链接之前识别它们。 ## 🚀 项目概述本项目旨在通过混合方法提供**实时 URL 风险分析**： - 🔍 基于规则的验证 - 🧠 特征提取引擎 - 🛡️ 威胁情报 (OpenPhish + URLHaus) - 🤖 机器学习（计划中 / 开发中）该系统确保用户能够在**成为受害者之前**检测到钓鱼企图。 ## 整体系统流程 ``` flowchart TD A[User Enters URL] --> B[Input Validation] B --> C[Feature Extraction Engine] C --> D[Machine Learning Detection Engine] C --> E[Threat Intelligence Check] D --> F[Prediction Score] E --> G[Reputation Result] F --> H[Final Risk Evaluation] G --> H H --> I[Risk Score Generation] I --> J[Result Visualization Dashboard] ``` ## ⚙️ 系统架构 ## ... ## 📁 项目文件结构 ... ## 🧠 后端概述后端基于 **Flask** 构建，并遵循清晰的模块化设计： ### 🔹 验证器模块 - 确保有效的 URL 输入 - 强制执行标准格式 (`http/https + www`) ### 🔹 特征提取引擎 - 将 URL 转换为数值特征向量 - 提取域名用于威胁情报 - 具有双重用途： - ML 输入 - 威胁数据库查询 ### 🔹 威胁情报模块 - 使用 OpenPhish + URLHaus 数据源 - 本地数据库用于快速查询 - 基于域名的匹配 ### 🔹 ML 引擎 *(开发中)* - 预测钓鱼可能性 - 使用基于提取特征训练的模型 ### 🔹 评估器模块 *(计划中)* - 结合 ML + 威胁情报的结果 - 生成最终决策 ### 🔹 评分模块 *(计划中)* - 生成风险评分 (0–100%) - 加权逻辑： - ML → 40% - 威胁情报 → 60% ## 🌐 前端概述前端使用以下技术构建： - React + Vite - Tailwind CSS ### 功能： - 用户友好的 URL 输入界面 - 实时分析结果 - 简洁且响应迅速的 UI ## 🔄 工作流程 1. 用户提交 URL 2. 验证器清理并标准化输入 3. 特征提取器生成特征 + 域名 4. 威胁情报检查本地数据库 5. （未来）ML 模型预测风险 6. 评估器结合各项结果 7. 评分器生成置信度得分 8. 将最终响应返回给用户 ## 🛡️ 威胁情报系统 - 数据源： - OpenPhish - URLHaus - 自动化数据库更新： - 下载数据源 - 提取域名 - 去除重复项 - 安全替换数据库 ## 📌 核心亮点 - ✔ 模块化架构 - ✔ 可扩展设计 - ✔ 实时检测能力 - ✔ 混合检测方法 (ML + 威胁情报) - ✔ 生产级流水线 ## 🚧 当前状态 - ✔ 验证器模块 → 已完成 - ✔ 特征提取器 → 已完成 - ✔ 威胁情报 → 已完成 - ✔ 流水线集成 → 已完成 - ⏳ ML 引擎 → 开发中 - ⏳ 评估器与评分器 → 计划中 ## 📖 未来改进 - 高级 ML 模型 - 感知子域名的威胁匹配 - API 安全性改进 - 分析仪表板 - 浏览器扩展

标签：Apex, Caido项目解析, DNS枚举, Flask, HTTP/HTTPS抓包, OpenPhish, React, Syscalls, URLHaus, URL风险分析, URL验证, Vite, 云计算, 威胁情报, 安全可视化, 开发者工具, 态势感知, 恶意链接识别, 机器学习, 欺诈防护, 混合检测模型, 特征提取, 网络安全, 网络安全工具, 规则引擎, 逆向工具, 钓鱼检测, 隐私保护, 风险评分