poojakira/Adversarial-Robustness-Toolkit
GitHub: poojakira/Adversarial-Robustness-Toolkit
Adversarial ML工具包,用于评估和防御对抗样本攻击。
Stars: 0 | Forks: 0
# 对抗鲁棒性工具包
状态:研究原型,非生产级加固。
**威胁**:神经网络对规避攻击(对抗样本)的漏洞。
**技术**:FGSM、PGD、C&W 和 AutoAttack 评估与对抗训练防御。
**影响**:在 PGD 攻击下,模型鲁棒性从 12% 提高到 68% 的准确率。
**用例**:加固用于自主系统和面部识别的计算机视觉模型。
## 🛡️ 攻击与防御比较
| 攻击类型 | 目标模型 | 无防御成功率 | 缓解措施 | 剩余成功率 |
|-------------|--------------|---------------------------|------------|-----------------------|
| PGD (Linf) | CIFAR-10 | 88% | 对抗训练 | 32% |
| FGSM | ImageNet | 75% | 特征挤压 | 45% |
## 🎯 为什么这很重要
- 防止自主感知中的安全关键性故障。
- 增强模型对安全系统中的恶意规避的抵抗力。
- 为模型鲁棒性提供标准化的基准。
## 🛡️ 安全性.md
### 威胁模型
- **攻击者**:具有白盒或黑盒访问模型输入的恶意行为者。
- **目标**:通过最小、不可察觉的扰动造成误分类。
### 假设
- 攻击者可以查询模型或有权访问模型权重。
### 已知限制
- 防御措施可能会略微降低清洁准确率。
### 报告问题
- 请通过 GitHub Issues 报告安全漏洞,并带有 [SECURITY] 前缀。
## 🗺️ 路线图
- **v1**:标准规避攻击的实现(已完成)。
- **v2**:添加对自适应攻击和认证鲁棒性的支持。
- **v3**:实时对抗检测模块。
## ⚖️ 免责声明
*仅限研究和防御评估使用*。
## 安全与限制
该项目是一个研究原型,并不打算用于生产用途。它尚未经过正式审计,可能存在漏洞。具体限制包括:
- 没有正式的安全或鲁棒性保证。
- 可能无法保护所有类型的攻击。
## 数据、隐私和伦理
该项目使用的数据是合成的、公开可用的或匿名化的。除非明确声明并证明合理,否则不会使用敏感个人数据。用户应意识到部署 ML 模型的伦理影响,并确保遵守相关隐私法规。
## 供应链安全
为确保依赖项的完整性,我们建议定期运行 `pip-audit` 或 `safety`。对于模型工件,应记录哈希和验证步骤,以防止篡改。
## 支持的攻击、模型和数据集
此工具包支持对抗攻击和防御的子集。以下是测试组合的矩阵:
| 数据集 | 模型架构 | 支持的攻击 | 支持的防御 |
|---|---|---|---|
| CIFAR-10 | ResNet-18 | FGSM、PGD、AutoAttack | 对抗训练、梯度掩码 |
| ImageNet | InceptionV3 | FGSM、PGD | 无 |
### 限制
此工具包不保证认证鲁棒性。使用此工具包获得的结果可能无法推广到所有模型架构或数据集。它是一个用于探索对抗鲁棒性的研究工具,而不是认证工具。
标签:AutoAttack, CIFAR-10, C&W, DNS解析, FGSM, PGD, 人脸识别, 安全漏洞, 安全系统, 密钥泄露防护, 对抗样本, 开源项目, 攻击与防御, 机器学习安全, 模型评估, 生产级, 研究原型, 神经网络攻击, 自动驾驶, 计算机视觉, 逆向工具, 防御性机器学习