nbehar/ai-security-labs

GitHub: nbehar/ai-security-labs

涵盖OWASP LLM Top 10、Red/Blue Team、多模态安全等十大主题的AI安全互动培训平台,提供可在线体验的攻击复现与防御演练环境。

Stars: 0 | Forks: 0

# AI 安全实验室 由 Nikolas Behar 教授推出的互动式 AI 安全培训平台。10 个研讨会产品涵盖了 OWASP LLM/MCP/Agentic Top 10、Red Teaming、多模态安全、Blue Team 防御等内容。 ## 空间 | # | 空间 | 内容 | 硬件 | 状态 | |---|-------|---------|----------|--------| | 1 | [OWASP Top 10 研讨会](https://huggingface.co/spaces/nikobehar/llm-top-10) | LLM Top 10 (10) + MCP Top 10 (9) + Agentic AI (6) + 5 项防御措施 | CPU | **已上线** | | 2 | Red Team 研讨会 | Red Teaming + Jailbreak Benchmark + 社会工程学 | CPU | 计划中 | | 3 | Blue Team 研讨会 | Prompt 加固 + 行为测试 + WAF 规则 + 防御 Pipeline | CPU | 计划中 | | 4 | 多模态安全 | 图像注入 + 对抗性攻击 + 隐写术 + OCR + Deepfake + CAPTCHA | GPU (T4) | 计划中 | | 5 | 数据投毒实验室 | RAG 投毒 + Fine-Tuning 投毒 + 合成数据 | GPU (T4) | 计划中 | | 6 | 事件响应实验室 | AI 泄露模拟 + 遏制 + 取证分析 | CPU | 计划中 | | 7 | 检测与监控 | 日志分析 + 异常检测 + 输出过滤 | CPU | 计划中 | | 8 | AI 治理实验室 | 安全策略编写器 + 风险评估 + 威胁建模 | CPU | 计划中 | | 9 | Multi-Agent 安全 | Multi-Agent 攻击 + 级联故障 | CPU | 计划中 | | 10 | 模型取证 | 后门检测 + 训练您自己的 Guard + 差分隐私 | GPU (T4) | 计划中 | ## 仓库结构 ``` ai-security-labs/ ├── framework/ # Shared code across all Spaces │ ├── static/ # Common CSS + JS framework │ ├── scanner.py # Defense tools (reusable) │ └── templates/ # Base HTML template │ ├── spaces/ │ ├── owasp-top-10/ # LIVE — 25 attacks, 5 defenses, 3 workshops │ ├── red-team/ # Planned │ ├── blue-team/ # Planned │ ├── multimodal/ # Planned │ └── ... # 6 more planned Spaces │ ├── docs/ # Platform documentation ├── scripts/ # Deploy scripts └── CLAUDE.md # AI assistant instructions ``` ## 技术栈 - **后端:** FastAPI + Uvicorn (Python) - **前端:** 原生 HTML/CSS/JS (无框架) - **模型:** LLaMA 3.3 70B via Groq API - **防御工具:** Meta Prompt Guard 2, LLM Guard, 自定义 guardrail - **部署:** Docker on HuggingFace Spaces ## 部署 ``` # 部署特定 space 到 HuggingFace ./scripts/deploy.sh owasp-top-10 ``` ## 许可证 MIT ## 作者 Nikolas Behar 教授
标签:Agentic AI安全, AI安全, AI攻防靶场, AI治理, AI风险评估, Chat Copilot, CISA项目, Deepfake, ESC8, Hugging Face Spaces, Jailbreak, OCR安全, OWASP LLM, OWASP MCP, OWASP Top 10, Python, RAG安全, Red Canary, Sysdig, WAF规则, 交互式培训, 人工智能安全, 合规性, 后门检测, 多智能体安全, 大模型安全, 威胁建模, 安全培训, 安全实训平台, 实战演练, 实验室, 对抗样本, 差分隐私, 异常检测, 微调安全, 提示词强化, 数字取证, 数据展示, 文档安全, 无后门, 检索增强生成安全, 模型水印与后门, 深度伪造检测, 社会工程学, 红队, 网络安全, 网络安全实验室, 网络安全教育, 自动化脚本, 自定义脚本, 行为测试, 请求拦截, 逆向工具, 防御流水线, 隐写术, 隐私保护, 验证码安全