poojakira/Adversarial-Robustness-Toolkit

GitHub: poojakira/Adversarial-Robustness-Toolkit

Adversarial ML工具包,用于评估和防御对抗样本攻击。

Stars: 0 | Forks: 0

# 对抗鲁棒性工具包 状态:研究原型,非生产级加固。 **威胁**:神经网络对规避攻击(对抗样本)的漏洞。 **技术**:FGSM、PGD、C&W 和 AutoAttack 评估与对抗训练防御。 **影响**:在 PGD 攻击下,模型鲁棒性从 12% 提高到 68% 的准确率。 **用例**:加固用于自主系统和面部识别的计算机视觉模型。 ## 🛡️ 攻击与防御比较 | 攻击类型 | 目标模型 | 无防御成功率 | 缓解措施 | 剩余成功率 | |-------------|--------------|---------------------------|------------|-----------------------| | PGD (Linf) | CIFAR-10 | 88% | 对抗训练 | 32% | | FGSM | ImageNet | 75% | 特征挤压 | 45% | ## 🎯 为什么这很重要 - 防止自主感知中的安全关键性故障。 - 增强模型对安全系统中的恶意规避的抵抗力。 - 为模型鲁棒性提供标准化的基准。 ## 🛡️ 安全性.md ### 威胁模型 - **攻击者**:具有白盒或黑盒访问模型输入的恶意行为者。 - **目标**:通过最小、不可察觉的扰动造成误分类。 ### 假设 - 攻击者可以查询模型或有权访问模型权重。 ### 已知限制 - 防御措施可能会略微降低清洁准确率。 ### 报告问题 - 请通过 GitHub Issues 报告安全漏洞,并带有 [SECURITY] 前缀。 ## 🗺️ 路线图 - **v1**:标准规避攻击的实现(已完成)。 - **v2**:添加对自适应攻击和认证鲁棒性的支持。 - **v3**:实时对抗检测模块。 ## ⚖️ 免责声明 *仅限研究和防御评估使用*。 ## 安全与限制 该项目是一个研究原型,并不打算用于生产用途。它尚未经过正式审计,可能存在漏洞。具体限制包括: - 没有正式的安全或鲁棒性保证。 - 可能无法保护所有类型的攻击。 ## 数据、隐私和伦理 该项目使用的数据是合成的、公开可用的或匿名化的。除非明确声明并证明合理,否则不会使用敏感个人数据。用户应意识到部署 ML 模型的伦理影响,并确保遵守相关隐私法规。 ## 供应链安全 为确保依赖项的完整性,我们建议定期运行 `pip-audit` 或 `safety`。对于模型工件,应记录哈希和验证步骤,以防止篡改。 ## 支持的攻击、模型和数据集 此工具包支持对抗攻击和防御的子集。以下是测试组合的矩阵: | 数据集 | 模型架构 | 支持的攻击 | 支持的防御 | |---|---|---|---| | CIFAR-10 | ResNet-18 | FGSM、PGD、AutoAttack | 对抗训练、梯度掩码 | | ImageNet | InceptionV3 | FGSM、PGD | 无 | ### 限制 此工具包不保证认证鲁棒性。使用此工具包获得的结果可能无法推广到所有模型架构或数据集。它是一个用于探索对抗鲁棒性的研究工具,而不是认证工具。
标签:AutoAttack, CIFAR-10, C&W, DNS解析, FGSM, PGD, 人脸识别, 安全漏洞, 安全系统, 密钥泄露防护, 对抗样本, 开源项目, 攻击与防御, 机器学习安全, 模型评估, 生产级, 研究原型, 神经网络攻击, 自动驾驶, 计算机视觉, 逆向工具, 防御性机器学习