drod1473/ai-security-portfolio

GitHub: drod1473/ai-security-portfolio

一个基于资深DFIR经验构建的AI/LLM安全实战项目集,聚焦防御性检测工程、事件响应Playbook和红队评估方法论。

Stars: 0 | Forks: 0

# AI 安全作品集 AI/LLM 安全领域的实战项目 —— 攻击性测试、防御性检测与事件响应 —— 建立在 20 多年横跨联邦机构和财富 500 强企业的 DFIR(数字取证与事件响应)经验之上。 ## 关于本作品集 大多数 AI 安全内容侧重于攻击(prompt 注入、越狱、模型提取)。本作品集则强调**防御与 IR(事件响应)层面** —— 针对AI/LLM系统的检测工程、事件响应 Playbook 以及威胁狩猎 —— 这些内容在公开资料中大量缺失。 ## 项目 *项目完成后将陆续添加。每个项目在适用时均包含方法论、证据以及可复现的代码。* ### 阶段 1 — 基础 (第 1–3 周) - **项目 1:** AI 安全框架交叉参考 *(进行中)* - **项目 2:** 针对脆弱 RAG 应用的红队评估 *(计划中)* ### 阶段 2 — 防御方向 (第 4–6 周) - **项目 3:** 针对 LLM 应用滥用的 Splunk 检测内容包 *(计划中)* - **项目 4:** AI 事件响应 Playbook *(计划中)* - **项目 5:** 通过电子邮件进行的间接 Prompt 注入 —— 攻击与检测 *(计划中)* ### 阶段 3 — 专业化 (第 7–9 周) - **项目 6:** AI CTF 解题报告 *(持续更新)* - **超越 LLM 的对抗性 ML:** 规避攻击、成员推断 *(计划中)* - **深度技术报告:** 主题待定 *(计划中)* ## 参考框架 - **OWASP LLM 应用 Top 10** - **MITRE ATLAS** (AI 系统对抗性威胁全景) - **NIST AI 风险管理框架 (AI RMF)** - **Google 安全 AI 框架 (SAIF)** ## 工具与技术栈 **攻击性:** Garak · PyRIT · Promptfoo · 自定义 Python 脚本 **防御性:** Splunk · Sigma · 自定义检测内容 **模型托管:** Ollama · Hugging Face · ChromaDB (RAG) **环境:** Kali Linux · Ubuntu (VirtualBox) ## 背景 我将二十年的事件响应和数字取证经验带入了 AI 安全领域。联邦级别的工作包括 CISA 的狩猎与事件响应团队、五角大楼 CIRT、DoD 网络犯罪中心以及美国国务院 CIRT。企业工作包括 Synchrony Financial、Biogen 和 E*Trade Financial。 本作品集所借鉴的 IR 和 Playbook 编写经验,在公开的 AI 安全内容中确实少有体现。AI 系统的部署速度远超其安全防护的完善速度,而在该领域发表内容的人中,几乎没有人曾真正操刀过从检测、遏制到经验总结的完整事件响应过程。 ## 联系方式 - 🌐 [directaiautomation.com](https://www.directaiautomation.com) - 💼 [LinkedIn](https://linkedin.com/in/danielrodriguezcisspence) - 📫 Daniel.Rodriguez@directaiautomation.com *作品集更新至 2026 年。随着工作的发布,仓库结构和项目列表将不断演进。*
标签:AI风险缓解, ChromaDB, CISA项目, CTF解题报告, DNS 反向解析, Garak, GitHub, Google SAIF, Hugging Face, IaC 扫描, IP 地址批量处理, LLM评估, MITRE ATLAS, NIST AI RMF, Ollama, OPA, OWASP LLM Top 10, Promptfoo, PyRIT, Python, RAG应用安全, Ruby, Sigma规则, TGT, 人工智能安全, 合规性, 多智能体系统, 大语言模型安全, 实时处理, 密码管理, 对抗性机器学习, 库, 应急响应, 提示注入, 插件系统, 攻防演练, 数字取证, 无后门, 无线安全, 机密管理, 模型提取, 目标导入, 知识库, 管理员页面发现, 红队评估, 网络安全审计, 网络安全攻防, 自动化脚本, 逆向工具, 邮件安全, 防御策略, 集群管理, 靶场