Sadhakrishnan/-AI-Malware-Intelligence-and-Forensic-Investigation-Platform
GitHub: Sadhakrishnan/-AI-Malware-Intelligence-and-Forensic-Investigation-Platform
一个由AI驱动的恶意软件情报与取证调查平台,通过静态分析、行为分析、MITRE ATT&CK映射、RAG威胁情报检索和多智能体推理,安全地分析可疑文件与取证日志并生成专业事件报告。
Stars: 0 | Forks: 0
# AI 恶意软件分析助手
一个由 AI 驱动的恶意软件情报与取证调查平台,通过静态分析、行为威胁分析、MITRE ATT&CK 映射、基于 RAG 的威胁情报、可解释 AI 以及多智能体推理,对可疑可执行文件、行为痕迹和取证日志进行分析。
## 🚀 功能特性
- 静态恶意软件分析
- 行为威胁分析
- IOC(失陷标示)提取
- YARA 规则匹配
- MITRE ATT&CK 映射
- 恶意软件家族分类
- 基于 RAG 的威胁情报检索
- 可解释 AI 威胁推理
- 攻击链关联
- 专业的取证事件报告生成
## ⚠️ 安全声明
本项目严格设计用于:
✅ 防御性网络安全研究
✅ 恶意软件理解与取证分析
✅ 安全的静态与行为分析工作流
本系统:
- **绝不**直接执行真实的恶意软件
- 使用沙箱日志、离线痕迹和模拟数据集
- 专注于安全的恶意软件情报工作流
## 🎯 项目目标
本系统能够:
✅ 安全地分析可疑可执行文件
✅ 自动提取 IOC
✅ 检测恶意行为模式
✅ 将攻击映射至 MITRE ATT&CK 技术
✅ 检索相关威胁情报
✅ 对潜在恶意软件家族进行分类
✅ 利用 LLM 推理解释恶意软件行为
✅ 生成专业的取证报告
### 输出示例
```
{
"malware_family": "possible ransomware",
"severity": "high",
"mitre_mapping": [
"T1059",
"T1112"
],
"iocs": [
"192.168.1.5",
"malicious-domain.com"
],
"explanation": "The malware likely establishes persistence and downloads secondary payloads using PowerShell execution."
}
```
## 🧠 系统架构
```
Suspicious File / Logs Upload
↓
File Analysis Pipeline
↓
Static Analysis Engine
↓
Behavioral Analysis Engine
↓
IOC Extraction
↓
Threat Intelligence RAG
↓
Multi-Agent Investigation System
↓
MITRE ATT&CK Mapping
↓
LLM Threat Reasoning
↓
Dashboard + Incident Reports
```
## 🛠️ 技术栈
### 恶意软件分析
- pefile
- yara-python
- lief
### 机器学习 / AI
- scikit-learn
- XGBoost
- PyTorch
- TensorFlow
### 序列建模
- LSTM
- Transformers
### RAG
- FAISS
- ChromaDB
### LLMs
- OpenAI GPT
- Mistral / LLaMA
### 多智能体框架
- LangChain
- CrewAI
### 后端
- FastAPI
### 前端
- Streamlit / React
### 数据库
- PostgreSQL
## 📂 支持的输入
- `.exe` 文件
- `.dll` 文件
- 行为日志
- 沙箱报告
- 网络痕迹
- 系统日志
- JSON 取证痕迹
## 🔥 核心组件
### 🔍 静态分析引擎
提取内容:
- 文件哈希
- PE 头
- 导入/导出表
- 可疑 API
- 内嵌字符串
- 熵值
- 加壳特征
示例可疑 API:
- `CreateRemoteThread`
- `VirtualAlloc`
- `WriteProcessMemory`
- `WinExec`
### 🚨 IOC 提取
提取如下指标:
- IP 地址
- 域名
- 注册表键
- 可疑 URL
- 互斥体名称
- 文件路径
### 🧬 YARA 规则匹配
使用 YARA 规则进行:
- 检测恶意软件签名
- 识别勒索软件特征
- 检测加壳可执行文件
- 匹配恶意软件家族
示例:
### 🧪 行为分析引擎
分析内容:
- 进程创建日志
- 注册表修改
- 网络活动
- 文件系统更改
- 沙箱执行痕迹
检测内容:
- 持久化机制
- PowerShell 滥用
- 权限提升
- 勒索软件行为
- 凭证窃取
### 🔗 序列建模
检测多阶段攻击链,例如:
```
Macro Execution
↓
PowerShell Spawned
↓
External Network Connection
↓
Registry Persistence
↓
File Encryption
```
推理:
```
Likely Ransomware Activity
```
### 🗺️ MITRE ATT&CK 映射智能体
将检测到的行为映射到 ATT&CK 技术。
示例:
- `T1059` — 命令和脚本解释器
- `T1112` — 修改注册表
- `T1027` — 混淆文件或信息
### 🧠 威胁解释智能体
利用 LLM 生成可解释的威胁推理。
示例:
### 🧾 事件报告智能体
生成结构化的取证报告,包含:
- 威胁摘要
- IOC 表格
- 攻击时间线
- MITRE 映射
- 严重程度评分
- 缓解建议
## ⚙️ 安装说明
```
git clone https://github.com/your-username/malware-analysis-agent.git
cd malware-analysis-agent
pip install -r requirements.txt
```
## 🌐 API 端点
```
POST /analyze
POST /logs
GET /report
GET /mitre_mapping
```
## 🔥 高级功能
- 沙箱集成
- 恶意软件家族聚类
- 基于图的攻击可视化
- AI 威胁狩猎智能体
- 自主威胁关联
- 可解释的恶意软件分类
## 📊 评估指标
- 恶意软件分类准确率
- 误报率
- IOC 提取精确率
- MITRE 映射准确率
- 分析延迟
## 🎯 最终产品愿景
一个由 AI 驱动的恶意软件情报与取证调查平台,能够通过 AI、RAG 和多智能体推理,实现恶意软件分析、行为威胁检测、MITRE ATT&CK 映射以及可解释的 SOC 风格调查工作流。
标签:AI智能体, Cloudflare, DAST, DLL 劫持, DNS信息、DNS暴力破解, IOC提取, Kubernetes, LLM推理, MITRE ATT&CK, RAG检索增强生成, YARA规则, 云安全监控, 凭据扫描, 勒索软件分析, 可解释AI, 大语言模型, 威胁情报, 威胁检测与响应(TDR), 安全分析助手, 安全报告生成, 开发者工具, 恶意软件分析, 恶意软件家族分类, 数字取证, 沙箱日志分析, 测试用例, 网络威胁情报(CTI), 网络安全, 自动化脚本, 逆向工具, 隐私保护, 静态分析, 高级持续性威胁(APT)分析