Poojan1777/AI-Phishing-Investigation-System
GitHub: Poojan1777/AI-Phishing-Investigation-System
基于Python和Flask构建的AI驱动钓鱼检测与调查平台,通过多维分析自动化完成可疑URL的识别、情报关联和调查报告生成。
Stars: 0 | Forks: 0
# AI-Phishing-调查系统
基于 Python 和 Flask 构建的 AI 驱动网络钓鱼检测与调查平台,支持实时 URL 分析、威胁情报关联、域名情报、品牌假冒检测、同形字攻击检测、屏幕截图以及自动化的钓鱼调查报告生成。
## 概述
AI 钓鱼检测与调查平台是一个基于 Python 的网络安全解决方案,旨在通过结合启发式检测、威胁情报、域名情报和可视化调查技术,实现网络钓鱼 URL 分析的自动化。
该平台协助 SOC 分析师、安全研究人员和应急响应人员快速识别钓鱼网站,并生成可用于调查的报告。
## 核心功能
### URL 安全分析
- URL 结构与熵值分析
- 冗长/混淆 URL 检测
- 数字字符检测
- 可疑字符/连字符分析
### 域名情报
- WHOIS 域名年龄验证
- 域名 IP 解析
- 托管国家情报
- 新注册域名检测
### Web 安全验证
- SSL/TLS 证书验证
- HTTPS 可用性检查
### 内容与页面分析
- 登录表单检测
- 凭证窃取指标分析
- 可疑关键词检测
### 高级钓鱼检测
- 同形字/Unicode 域名检测
- 品牌假冒检测
- 模糊域名相似度匹配
### 威胁情报集成
- VirusTotal 信誉查询
- 多引擎恶意检测检查
### 调查功能
- 自动化网站屏幕截图捕获
- HTML 调查报告生成
- 实时 REST API 支持
## 检测工作流
```
User URL Input
│
▼
Feature Extraction Engine
│
├── URL Heuristics
├── Domain Age Check
├── SSL Validation
├── Keyword Detection
├── Login Form Detection
│
▼
Threat Intelligence Enrichment
│
├── VirusTotal Lookup
├── Domain Intelligence
├── Brand Similarity Check
├── Homograph Detection
│
▼
Risk Scoring Engine
│
▼
Automated Investigation Report
```
## 技术栈
| 类别 | 技术 |
|---------|-------------|
| 后端 | Python, Flask |
| 解析 | BeautifulSoup4 |
| 网络 | Requests, Socket, SSL |
| 威胁情报 | VirusTotal API |
| 域名情报 | Python-WHOIS, IPWhois |
| 浏览器自动化 | Selenium |
| 模糊匹配 | Levenshtein |
| 图像分析 | OpenCV, scikit-image |
## 项目结构
```
AI-Phishing-Detector/
│
├── app.py # Flask Web Application
├── analyzer.py # Main Analysis Pipeline
│
├── url_features.py # URL Heuristic Analysis
├── domain_checker.py # WHOIS Domain Age Analysis
├── ssl_checker.py # SSL/TLS Verification
├── keyword_checker.py # Suspicious Keyword Detection
├── page_analyzer.py # Login Page Detection
├── risk_engine.py # Risk Scoring Engine
│
├── virustotal_checker.py # Threat Intel Integration
├── domain_intelligence.py # IP / Country Resolution
├── homograph_detector.py # Unicode Domain Detection
├── brand_impersonation.py # Brand Similarity Detection
│
├── screenshot_capture.py # Webpage Screenshot Utility
├── visual_similarity.py # Image Similarity Analysis
│
├── report_generator.py # HTML Report Builder
│
├── templates/
│ └── index.html
│
├── reports/
├── screenshots/
│
└── requirements.txt
```
## 安装
```
git clone https://github.com/YOUR_USERNAME/AI-Phishing-Detector.git
cd AI-Phishing-Detector
pip install -r requirements.txt
```
## 配置
将你的 VirusTotal API 密钥添加到以下位置:
```
virustotal_checker.py
```
```
API_KEY = "YOUR_API_KEY"
```
## 运行应用
```
python app.py
```
访问 Web UI:
```
http://127.0.0.1:5000
```
## REST API 示例
### 请求
```
POST /api/scan
```
```
{
"url": "https://suspicious-example.com"
}
```
## 示例输出
```
{
"url": "https://suspicious-example.com",
"score": 9,
"message": "Likely Phishing Website",
"virustotal": "Malicious engines: 6",
"ip": "192.168.1.1",
"country": "US"
}
```
## 真实安全用例
- SOC 警报分类
- 钓鱼调查自动化
- 蓝队威胁狩猎
- 安全意识演示
- 应急响应信息丰富化
- 学术安全研究
## 计划增强功能
- 机器学习 URL 分类模型
- 邮件头钓鱼分析
- 浏览器扩展部署
- SIEM 集成 (Splunk / Wazuh)
- PDF / JSON 导出支持
- 沙箱 URL 引爆引擎
## 许可证
MIT License © 2026 Poojan Patel
## 作者
**Poojan Patel**
网络安全爱好者 | 安全自动化开发者 | SOC 分析师候选人
## 免责声明
本项目严格仅用于教育、研究和合法的防御性安全目的。
禁止在未经授权的情况下,对您不拥有或未获准测试的系统进行使用。
标签:AI安全, Chat Copilot, Flask, HTML报告生成, Python, REST API, SOC分析工具, TLS证书验证, URL安全分析, VT集成, WHOIS查询, 凭证窃取检测, 协议探测, 同形异义词攻击检测, 品牌仿冒检测, 域名情报, 威胁情报, 安全事件响应, 开发者工具, 恶意URL检测, 搜索语句(dork), 无后门, 欺诈检测, 网站截图, 网络安全, 自动化安全分析, 自动化报告, 逆向工具, 钓鱼检测, 隐私保护