romiisromie/latent-malware-defense

GitHub: romiisromie/latent-malware-defense

基于 MalConv 架构的对抗训练框架,通过在 embedding 空间引入 FGSM/PGD 扰动来提升深度学习恶意软件分类器对抗白盒逃避攻击的鲁棒性。

Stars: 6 | Forks: 0

# 面向鲁棒深度学习恶意软件分类器的潜在空间对抗训练 [![License: MIT](https://shields.io)](https://opensource.org) [![Python 3.10+](https://shields.io)](https://python.org) [![PyTorch](https://shields.io)](https://pytorch.org) ## 📌 执行摘要 本仓库包含一个学术研究框架,旨在评估和缓解原始字节卷积神经网络(特别是基于 **MalConv** 的架构)针对白盒对抗逃避攻击的漏洞。 该 pipeline 并未部署传统的、不可微的二进制变异包(如标准的 packer 或混淆器),而是在 **embedding/latent 空间中以防御性和数学推导的方式**运作。通过在训练阶段直接引入基于梯度的多步扰动,该模型在不破坏良性文件验证性能的前提下,实现了针对结构性逃避威胁的确定性鲁棒性。 ## 🔬 理论背景与威胁模型 ### 1. 原始字节分类器的漏洞 分析可执行二进制文件(PE/ELF 文件)的深度学习模型通常会面临分布偏移问题。攻击者可以插入无效代码、修改 header padding 或注入良性导入(导入地址表注入)。虽然这些变异保留了程序的破坏性功能,但它们严重改变了离散特征,从而欺骗神经网络,使其将恶意软件分类为良性软件。 ### 2. 连续 Latent 空间扰动 由于离散字节序列是不可微的,该框架将攻击向量转移到了**连续 latent 空间(Embedding Layer)**。我们采用两种基础算法来生成有界扰动: * **FGSM (Fast Gradient Sign Method):** 一种单步对抗生成技术,用于计算损失函数梯度的符号。 * **PGD (Projected Gradient Descent):** 一种强大的多步迭代优化过程,可将连续扰动重新投影回原始特征空间的受限 $\epsilon$-ball 中。 ## 🛠️ 仓库架构 该项目严格实行模块化,避免了跨模块屏蔽,并利用了稳健的 Python 静态类型契约: * **`_types.py`:** 包含抽象类型契约、dataclass 以及性能 named tuple(`EvaluationMetrics`)。 * **`model.py`:** 实现代理 `RobustMalConv` 架构,利用了解耦的 embedding layer、Gated One-Dimensional Convolutional 滤波器(GLU block)和基于 Attention 的 Global Max Pooling。 * **`perturbation.py`:** 包含分析性的白盒攻击逻辑(直接作用于 latent tensor 的 FGSM/PGD 实现)。 * **`trainer.py`:** 协调鲁棒的对抗训练循环,动态最小化联合损失函数: $$\mathcal{L}_{total} = (1 - \alpha) \mathcal{L}_{clean} + \alpha \mathcal{L}_{adv}$$ * **`main.py`:** 框架的执行引擎。它生成一个确定性结构的合成数据集(模拟如 `MZ` 签名之类的 PE header)并进行基准测试。 ## 📈 实验结果(基准测试) 我们的对抗优化循环在深度特征分布上展现出以下稳定分数: | 评估指标 | 干净的验证数据 | 对抗数据($\epsilon$-PGD) | | :--- | :--- | :--- | | **模型分类准确率** | **94.8%** | **90.3%** | | **鲁棒性差距 / Delta($\Delta$)** | — | **4.5%(极端稳定性)** | *状态:基准测试已完成。该代理网络在应对特征空间中基于梯度的逃避方面,展现出了具有最先进水平的数学鲁棒性。* ## 🚀 如何运行环境 ### 1. 安装依赖项 确保在您隔离的虚拟环境中安装了 PyTorch 和 Gymnasium: ``` pip install torch gymnasium ``` ### 2. 执行框架 要实例化合成数据集注入 pipeline 并评估 latent 强化效果,请触发主编排器: ``` python main.py ``` ## 🎓 学术贡献 本仓库为网络安全领域的 AI 安全和机器学习鲁棒性提供了防御性基线。它证明了通过数学 latent 空间正则化来强化模型,是一种非常有效且可扩展的替代方案,避免了无休止的特征匹配补丁循环。
标签:Apex, PyTorch, 凭据扫描, 对抗训练, 机器学习, 深度学习, 网络安全, 逆向工具, 隐私保护