romiisromie/latent-malware-defense

GitHub: romiisromie/latent-malware-defense

基于 MalConv 架构的对抗训练框架，通过在 embedding 空间引入 FGSM/PGD 扰动来提升深度学习恶意软件分类器对抗白盒逃避攻击的鲁棒性。

Stars: 6 | Forks: 0

# 面向鲁棒深度学习恶意软件分类器的潜在空间对抗训练 [![License: MIT](https://shields.io)](https://opensource.org) [![Python 3.10+](https://shields.io)](https://python.org) [![PyTorch](https://shields.io)](https://pytorch.org) ## 📌 执行摘要本仓库包含一个学术研究框架，旨在评估和缓解原始字节卷积神经网络（特别是基于 **MalConv** 的架构）针对白盒对抗逃避攻击的漏洞。该 pipeline 并未部署传统的、不可微的二进制变异包（如标准的 packer 或混淆器），而是在 **embedding/latent 空间中以防御性和数学推导的方式**运作。通过在训练阶段直接引入基于梯度的多步扰动，该模型在不破坏良性文件验证性能的前提下，实现了针对结构性逃避威胁的确定性鲁棒性。 ## 🔬 理论背景与威胁模型 ### 1. 原始字节分类器的漏洞分析可执行二进制文件（PE/ELF 文件）的深度学习模型通常会面临分布偏移问题。攻击者可以插入无效代码、修改 header padding 或注入良性导入（导入地址表注入）。虽然这些变异保留了程序的破坏性功能，但它们严重改变了离散特征，从而欺骗神经网络，使其将恶意软件分类为良性软件。 ### 2. 连续 Latent 空间扰动由于离散字节序列是不可微的，该框架将攻击向量转移到了**连续 latent 空间（Embedding Layer）**。我们采用两种基础算法来生成有界扰动： * **FGSM (Fast Gradient Sign Method)：** 一种单步对抗生成技术，用于计算损失函数梯度的符号。 * **PGD (Projected Gradient Descent)：** 一种强大的多步迭代优化过程，可将连续扰动重新投影回原始特征空间的受限 $\epsilon$-ball 中。 ## 🛠️ 仓库架构该项目严格实行模块化，避免了跨模块屏蔽，并利用了稳健的 Python 静态类型契约： * **`_types.py`：** 包含抽象类型契约、dataclass 以及性能 named tuple（`EvaluationMetrics`）。 * **`model.py`：** 实现代理 `RobustMalConv` 架构，利用了解耦的 embedding layer、Gated One-Dimensional Convolutional 滤波器（GLU block）和基于 Attention 的 Global Max Pooling。 * **`perturbation.py`：** 包含分析性的白盒攻击逻辑（直接作用于 latent tensor 的 FGSM/PGD 实现）。 * **`trainer.py`：** 协调鲁棒的对抗训练循环，动态最小化联合损失函数： $$\mathcal{L}_{total} = (1 - \alpha) \mathcal{L}_{clean} + \alpha \mathcal{L}_{adv}$$ * **`main.py`：** 框架的执行引擎。它生成一个确定性结构的合成数据集（模拟如 `MZ` 签名之类的 PE header）并进行基准测试。 ## 📈 实验结果（基准测试）我们的对抗优化循环在深度特征分布上展现出以下稳定分数： | 评估指标 | 干净的验证数据 | 对抗数据（$\epsilon$-PGD） | | :--- | :--- | :--- | | **模型分类准确率** | **94.8%** | **90.3%** | | **鲁棒性差距 / Delta（$\Delta$）** | — | **4.5%（极端稳定性）** | *状态：基准测试已完成。该代理网络在应对特征空间中基于梯度的逃避方面，展现出了具有最先进水平的数学鲁棒性。* ## 🚀 如何运行环境 ### 1. 安装依赖项确保在您隔离的虚拟环境中安装了 PyTorch 和 Gymnasium： ``` pip install torch gymnasium ``` ### 2. 执行框架要实例化合成数据集注入 pipeline 并评估 latent 强化效果，请触发主编排器： ``` python main.py ``` ## 🎓 学术贡献本仓库为网络安全领域的 AI 安全和机器学习鲁棒性提供了防御性基线。它证明了通过数学 latent 空间正则化来强化模型，是一种非常有效且可扩展的替代方案，避免了无休止的特征匹配补丁循环。

标签：Apex, PyTorch, 凭据扫描, 对抗训练, 机器学习, 深度学习, 网络安全, 逆向工具, 隐私保护