Sridharjagan/PhishGuard-X-Multimodal-Cyber-Threat-Intelligence-Engine
GitHub: Sridharjagan/PhishGuard-X-Multimodal-Cyber-Threat-Intelligence-Engine
PhishGuard-X 是一款基于人工智能的多模态网络钓鱼威胁情报平台,用于实时检测和归因钓鱼攻击。
Stars: 0 | Forks: 0
# PhishGuard-X-多模态网络威胁情报引擎
由人工智能驱动的多模态网络钓鱼威胁情报平台,结合机器学习、大型语言模型(LLM)、计算机视觉、图分析和威胁情报,用于实时钓鱼检测和归因。
# 🛡️ PhishGuard-X -> 🛡️ PhishGuard-X
### 多模态人工智能驱动的网络钓鱼威胁情报平台
PhishGuard-X 是一个下一代网络安全平台,旨在通过结合人工智能、威胁情报、机器学习、大型语言模型(LLM)、计算机视觉和图智能来检测、分析、解释和归因网络钓鱼攻击。
与仅依赖 URL 分析的传统网络钓鱼检测器不同,PhishGuard-X 在 URL、域名、网站内容、视觉元素、基础设施关系和威胁情报源上执行多层安全分析。
## 🚀 愿景
PhishGuard-X 致力于将网络钓鱼检测从简单的分类转变为一个完整的网络威胁情报系统,能够:
- 检测网络钓鱼攻击
- 解释为什么一个网站是恶意的
- 识别目标品牌
- 发现网络钓鱼基础设施
- 检测社会工程学策略
- 为安全分析师提供可解释的人工智能支持
## 🏗 系统架构
```
┌─────────────────────┐
│ User Request │
└──────────┬──────────┘
│
▼
┌──────────────────────────────┐
│ URL Intelligence Engine │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Domain Intelligence Engine │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Content Intelligence Engine │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Vision Intelligence Engine │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ LLM Security Reasoner │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Threat Intelligence Layer │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Graph Intelligence Engine │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Explainable AI Layer │
└──────────────────────────────┘
│
▼
┌──────────────────────────────┐
│ Threat Verdict & Attribution │
└──────────────────────────────┘
```
## 🔍 核心功能
### URL 智能分析
- 词汇 URL 分析
- 基于熵的检测
- 同音字检测
- Unicode 攻击检测
- Leetspeak 品牌检测
- 可疑 TLD 检测
- 重定向分析
- URL 声誉评分
### 域名智能分析
- WHOIS 分析
- 域名年龄验证
- 注册商声誉
- DNS 分析
- MX 记录验证
- SPF 验证
- DMARC 验证
- SSL 证书检查
### 网站内容智能分析
- HTML 解析
- 凭据收集检测
- 登录表单检测
- 隐藏输入检测
- 混淆 JavaScript 检测
- 可疑脚本检测
### 视觉智能分析
- 截图分析
- OCR 提取
- 品牌标志识别
- 视觉相似度评分
- 假登录页面检测
### LLM 安全推理
- 社会工程学检测
- 恐惧策略分析
- 紧迫性检测
- 心理操纵检测
- 可读性威胁解释
### 威胁情报
- OpenPhish 集成
- PhishTank 集成
- IOC 丰富化
- 声誉评分
- 威胁源关联
### 图智能分析
- 基础设施映射
- URL 关系
- 域名关系
- 重定向链
- 品牌目标分析
- 网络钓鱼活动发现
### 可解释人工智能
- SHAP 分析
- 特征归因
- 威胁归因
- 分析师报告
- 可解释决策
## 🧠 人工智能模型
| 组件 | 模型 |
|------------|--------|
| URL 检测 | XGBoost |
| 域名分析 | LightGBM |
| 内容分析 | 随机森林 |
| 视觉分析 | CLIP |
| OCR | EasyOCR |
| LLM 推理 | TinyLlama |
| 图分析 | GraphSAGE |
| 可解释性 | SHAP |
## 📂 项目结构
```
PhishGuard-X/
│
├── data/
│
├── datasets/
│
├── models/
│
├── notebooks/
│
├── src/
│ ├── url_intelligence/
│ ├── domain_intelligence/
│ ├── content_intelligence/
│ ├── vision_intelligence/
│ ├── llm_reasoning/
│ ├── graph_intelligence/
│ ├── explainability/
│ ├── threat_intelligence/
│ └── api/
│
├── frontend/
│
├── browser_extension/
│
├── docs/
│
├── tests/
│
├── research/
│
├── deployment/
│
├── train.py
│
├── app.py
│
├── requirements.txt
│
└── README.md
```
## 📊 支持的数据集
- PhishTank
- OpenPhish
- Alexa Top Domains
- Tranco Dataset
- Common Crawl
- CIC Phishing Dataset
- UCI URL Dataset
## ⚙️ 安装
```
git clone https://github.com/yourusername/PhishGuard-X.git
cd PhishGuard-X
pip install -r requirements.txt
```
## 🚀 运行
```
python train.py
```
```
python app.py
```
打开:
```
http://localhost:5000
```
## 📈 研究目标
- 实时网络钓鱼检测
- 多模态威胁情报
- 网络安全可解释人工智能
- 基于图的攻击归因
- 基于LLM的社会工程学检测
- 对抗性鲁棒检测模型
## 🎯 未来路线图
### 第一阶段
- URL 智能引擎
- 域名智能引擎
### 第二阶段
- 内容智能
- 视觉智能
### 第三阶段
- LLM 威胁推理
### 第四阶段
- 图神经网络分析
### 第五阶段
- 浏览器扩展
### 第六阶段
- 云部署
## 📚 研究贡献
- 多模态网络钓鱼检测
- 跨层威胁关联
- 人工智能驱动的威胁归因
- 基于图的网络钓鱼活动发现
- 可解释的网络钓鱼情报
- 对抗性网络钓鱼鲁棒性
## 🏆 应用
- 安全运营中心(SOC)运营
- 威胁情报团队
- 安全分析师
- 企业电子邮件安全
- 浏览器安全扩展
- 管理安全服务提供商(MSSPs)
## 📜 许可证
MIT 许可证
## 👨💻 作者
Sridhar J
人工智能与数据科学学士
网络安全研究员 | 人工智能工程师 | 威胁情报爱好者
## ⭐ 如果您觉得这个项目有用,请考虑给它加星。
标签:Apex, C2, DLL 劫持, ESC8, PFX证书, Sigma 规则, URL分析, 人工智能, 内容分析, 可解释AI, 品牌保护, 图分析, 域名分析, 基础设施分析, 多模态分析, 大语言模型, 威胁情报, 开发者工具, 恶意网站识别, 攻击分析, 攻击检测, 攻击溯源, 机器学习, 用户模式Hook绕过, 社会工程学, 网络安全, 计算机视觉, 逆向工具, 钓鱼检测, 隐私保护