poojakira/Adversarial-Robustness-Toolkit

GitHub: poojakira/Adversarial-Robustness-Toolkit

Adversarial ML工具包，用于评估和防御对抗样本攻击。

Stars: 0 | Forks: 0

# 对抗鲁棒性工具包状态：研究原型，非生产级加固。 **威胁**：神经网络对规避攻击（对抗样本）的漏洞。 **技术**：FGSM、PGD、C&W 和 AutoAttack 评估与对抗训练防御。 **影响**：在 PGD 攻击下，模型鲁棒性从 12% 提高到 68% 的准确率。 **用例**：加固用于自主系统和面部识别的计算机视觉模型。 ## 🛡️ 攻击与防御比较 | 攻击类型 | 目标模型 | 无防御成功率 | 缓解措施 | 剩余成功率 | |-------------|--------------|---------------------------|------------|-----------------------| | PGD (Linf) | CIFAR-10 | 88% | 对抗训练 | 32% | | FGSM | ImageNet | 75% | 特征挤压 | 45% | ## 🎯 为什么这很重要 - 防止自主感知中的安全关键性故障。 - 增强模型对安全系统中的恶意规避的抵抗力。 - 为模型鲁棒性提供标准化的基准。 ## 🛡️ 安全性.md ### 威胁模型 - **攻击者**：具有白盒或黑盒访问模型输入的恶意行为者。 - **目标**：通过最小、不可察觉的扰动造成误分类。 ### 假设 - 攻击者可以查询模型或有权访问模型权重。 ### 已知限制 - 防御措施可能会略微降低清洁准确率。 ### 报告问题 - 请通过 GitHub Issues 报告安全漏洞，并带有 [SECURITY] 前缀。 ## 🗺️ 路线图 - **v1**：标准规避攻击的实现（已完成）。 - **v2**：添加对自适应攻击和认证鲁棒性的支持。 - **v3**：实时对抗检测模块。 ## ⚖️ 免责声明 *仅限研究和防御评估使用*。 ## 安全与限制该项目是一个研究原型，并不打算用于生产用途。它尚未经过正式审计，可能存在漏洞。具体限制包括： - 没有正式的安全或鲁棒性保证。 - 可能无法保护所有类型的攻击。 ## 数据、隐私和伦理该项目使用的数据是合成的、公开可用的或匿名化的。除非明确声明并证明合理，否则不会使用敏感个人数据。用户应意识到部署 ML 模型的伦理影响，并确保遵守相关隐私法规。 ## 供应链安全为确保依赖项的完整性，我们建议定期运行 `pip-audit` 或 `safety`。对于模型工件，应记录哈希和验证步骤，以防止篡改。 ## 支持的攻击、模型和数据集此工具包支持对抗攻击和防御的子集。以下是测试组合的矩阵： | 数据集 | 模型架构 | 支持的攻击 | 支持的防御 | |---|---|---|---| | CIFAR-10 | ResNet-18 | FGSM、PGD、AutoAttack | 对抗训练、梯度掩码 | | ImageNet | InceptionV3 | FGSM、PGD | 无 | ### 限制此工具包不保证认证鲁棒性。使用此工具包获得的结果可能无法推广到所有模型架构或数据集。它是一个用于探索对抗鲁棒性的研究工具，而不是认证工具。

标签：AutoAttack, CIFAR-10, C&W, DNS解析, FGSM, PGD, 人脸识别, 安全漏洞, 安全系统, 密钥泄露防护, 对抗样本, 开源项目, 攻击与防御, 机器学习安全, 模型评估, 生产级, 研究原型, 神经网络攻击, 自动驾驶, 计算机视觉, 逆向工具, 防御性机器学习