chakradhar2004/Quantum-Enhanced-Machine-Learning-for-Robust-Threat-Intelligence
GitHub: chakradhar2004/Quantum-Enhanced-Machine-Learning-for-Robust-Threat-Intelligence
一个结合经典机器学习和量子增强方法的威胁情报系统,用于检测DGA恶意域名和分类恶意软件。
Stars: 0 | Forks: 0
# 量子增强威胁情报
一个使用经典和量子增强方法检测恶意域名和恶意软件的机器学习系统。
## 项目结构
```
Quantum-Enhanced_Threat_Intelligence/
│
├── data/
│ ├── domains/
│ │ ├── raw/
│ │ │ └── dga-domain.txt # Raw DGA domain data
│ │ ├── external/
│ │ │ └── top10milliondomains.csv # External benign domain data
│ │ └── processed/
│ │ └── domain_features.csv # Processed domain features
│ │
│ ├── malware/
│ │ ├── raw/
│ │ │ └── train_features_0.jsonl # Raw EMBER malware features
│ │ └── processed/
│ │ └── ember_features.csv # Processed malware features
│
├── models/
│ ├── domain_rf_model.pkl # Domain classification model
│ └── ember_rf_model.pkl # Malware classification model
│
├── notebooks/
│ ├── 01_feature_engineering.ipynb # Feature extraction and preprocessing
│ ├── 02_classical_models.ipynb # Classical ML model training
│ ├── 03_quantum_models.ipynb # Quantum-enhanced model training
│ └── 04_inference_cli.ipynb # Inference examples (optional)
│
├── utils/
│ ├── feature_utils.py # Feature extraction utilities
│ └── quantum_utils.py # Quantum computing utilities
│
├── main.py # CLI interface for predictions
├── README.md # This file
└── requirements.txt # Python dependencies
```
## 设置
1. 安装依赖:
```
pip install -r requirements.txt
```
2. 确保数据文件就位:
- DGA 域名位于 `data/domains/raw/dga-domain.txt`
- Top 10M 域名位于 `data/domains/external/top10milliondomains.csv`
- EMBER 特征位于 `data/malware/raw/train_features_0.jsonl`
## 使用
### 特征工程
运行特征工程 notebook 处理原始数据:
```
jupyter notebook notebooks/01_feature_engineering.ipynb
```
### 模型训练
训练经典模型:
```
jupyter notebook notebooks/02_classical_models.ipynb
```
训练量子增强模型:
```
jupyter notebook notebooks/03_quantum_models.ipynb
```
### CLI 推理
预测域名是否为恶意:
```
python main.py domain example.com
```
预测文件是否为恶意软件:
```
python main.py malware --features path/to/features.csv
```
## 功能
- **域名分类**:检测 DGA(域名生成算法)域名
- **恶意软件检测**:使用 EMBER 特征对文件进行分类
- **量子增强模型**:探索量子计算以实现更好的检测
- **经典 ML 模型**:Random Forest 及其他经典方法
## 环境要求
- Python 3.8+
- 完整依赖列表请参见 `requirements.txt`
## 许可证
[在此处添加您的许可证]
## 贡献
[在此处添加贡献指南]
标签:Apex, DGA检测, EMBER, IP 地址批量处理, NoSQL, 人工智能, 分类模型, 威胁情报, 开发者工具, 恶意域名检测, 机器学习, 混合计算, 特征工程, 用户模式Hook绕过, 网络安全, 逆向工具, 量子计算, 随机森林, 隐私保护