41R3/malware-dna-scan
GitHub: 41R3/malware-dna-scan
该项目利用生物信息学技术将恶意软件二进制代码转化为DNA序列,通过序列比对和系统发育分析来识别变种、追踪家族进化关系并区分恶意与良性文件。
Stars: 0 | Forks: 0
# 🧬 Malware DNA Scanner - 受恶意软件分析启发的恶意软件分析

*恶意软件家族之间的遗传关系,以树状图形式可视化*
## 概述
本项目通过将可执行文件转换为核苷酸序列(A、C、T、G),将恶意软件二进制文件视为“数字 DNA”。受生物信息学技术的启发,我们应用序列比对算法(BLAST)和系统发育分析来:
1. 识别恶意软件样本之间的相似性
2. 可视化恶意软件家族之间的进化关系
3. 检测已知恶意软件菌株的新变种
4. 区分恶意文件和良性文件
## 组件
### DNA 转换引擎
- **`malware_to_adn.py`**:使用安全的字节映射将二进制文件转换为核苷酸序列
- **`crear_db.py`**:构建按家族组织的恶意软件序列 FASTA 数据库
### 分析工具包
- **`blast_similitud.py`**:针对恶意软件数据库执行 BLAST 搜索
- **`visualizacion.py`**:生成相似性矩阵和系统发育树
- **`run_safe.sh`**:具有样本保护功能的安全执行管道
### 安全系统
- **`protect_samples.sh`**:使用 `chattr +i` 使样本不可变
- **`unpack_safely.sh`**:使用 Docker 隔离进行安全样本提取
- **`download_benign_samples.sh`**:用于获取安全对照样本的脚本
## 可视化

*显示恶意软件样本之间余弦相似性的热图*
### 前置条件
- Python 3.8+
- Biopython、scikit-learn、matplotlib
- BLAST+ 命令行工具
- Docker(用于安全样本解包)
```
# 安装依赖
pip install -r requirements.txt
sudo apt install ncbi-blast+ docker.io
```
**安全协议**
所有恶意软件样本均:
- 使用 `chmod 400`(只读)存储
- 使用 `chattr +i` 设为不可变
- 解包时在 Docker 容器中处理
- 使用 `inotifywait` 监控访问尝试
```
# 启用 sample protection:
bash scripts/protect_samples.sh
# 安全解压 samples:
bash scripts/unpack_safely.sh
# 启用 sample protection:
bash scripts/protect_samples.sh
# 安全解压 samples:
bash scripts/unpack_safely.sh
```
## 结构
pgsql
Copiar
Editar
malware-dna-scan/
├── databases/ # Malware sequence database
├── resultados/ # Analysis outputs
│ ├── dendrogram.png # Family relationship visualization
│ └── matriz_similitud.png # Similarity matrix
├── scripts/ # Core analysis scripts
│ ├── blast_similitud.py # BLAST analysis
│ ├── crear_db.py # Database creation
│ ├── malware_to_adn.py # Binary-to-DNA conversion
│ ├── protect_samples.sh # Security hardening
│ ├── run_safe.sh # Safe execution pipeline
│ ├── unpack_safely.sh # Secure sample extraction
│ └── visualizacion.py # Visualization tools
└── requirements.txt # Python dependencies
## ⚠️ 警告
出于安全考虑,本仓库中不包含实际的恶意软件样本。
该数据集仅包含序列分析结果和可视化图表。
标签:Biopython, BLAST, DAST, Docker, Mutation, 二进制分析, 云安全运维, 云资产清单, 变体识别, 可视化, 同源性检测, 基因组学应用, 安全防御评估, 序列比对, 恶意软件分析, 数字DNA, 树状图, 沙箱隔离, 热力图, 生物信息学, 相似度矩阵, 系统发育树, 聚类分析, 请求拦截, 逆向工具, 逆向工程