tachyonic-sh/taxonomy

GitHub: tachyonic-sh/taxonomy

一份结构化的AI/LLM攻击向量开放分类法,涵盖168种攻击技术并映射至OWASP LLM Top 10与MITRE ATLAS框架,帮助团队系统性地识别、评估和防御大模型安全风险。

Stars: 2 | Forks: 0

# Tachyonic Taxonomy **包含 168 个 AI/LLM 攻击向量的开放分类法,映射至 OWASP LLM Top 10 和 MITRE ATLAS。** [![License: Apache 2.0](https://img.shields.io/badge/License-Apache_2.0-blue.svg)](https://opensource.org/licenses/Apache-2.0) [![ESF Phases 1-3](https://img.shields.io/badge/ESF-Phases_1--3-green.svg)](https://github.com/tachyonic-sh/esf) ## 这是什么? 一份结构化、机器可读的已记录攻击 AI 系统技术目录。每种攻击均包含 ID、名称、类别、描述、严重性评级,以及与行业标准框架(OWASP LLM Top 10、MITRE ATLAS)的映射。 这是关于**“是什么”**的指南——阐述了存在哪些攻击以及如何防御。本目录不包含 payload、检测逻辑或特定模型的数据。 本仓库实现了 [Evolutionary Security Framework (ESF)](https://github.com/tachyonic-sh/esf)(即用于逐步强化 AI 安全系统的开放成熟度模型)的**第 1-3 阶段**。详情请参阅 [ESF.md](ESF.md)。 ## 为什么需要这个? 大多数 AI 安全讨论都集中在少数几个众所周知的攻击上。实际上,在 16 个类别中存在超过 160 种截然不同的攻击技术。一个能阻止简单指令覆盖的系统,可能仍然会沦陷于编码绕过、多轮对话升级,或通过检索内容进行的间接注入。 此分类法为您提供: * **一份检查清单** —— 您的防御措施是否覆盖了所有 16 个类别? * **一种通用语言** —— 在安全讨论中引用特定的攻击 ID(例如 PI-007、JB-015) * **框架映射** —— 用于合规与审计的 OWASP LLM Top 10 和 MITRE ATLAS * **修复指南** —— 按类别提供防御策略和代码示例 * **ESF 第 1-3 阶段的基础** —— 所有下游强化所依赖的命名、关系映射和初步启发式方法 ## 攻击类别 | 类别 | ID 前缀 | 数量 | OWASP LLM Top 10 | | --- | --- | --- | --- | | Prompt Injection | PI | 20 | LLM01 | | System Prompt Leakage | SPL | 12 | LLM07 | | Jailbreaks | JB | 22 | LLM01 | | Vision/Multimodal | VI | 12 | LLM01 | | Excessive Agency / Tool Abuse | EA | 20 | LLM06 | | Multi-Turn Manipulation | MT | 10 | LLM01 | | Sensitive Information Disclosure | SID | 10 | LLM02 | | Supply Chain | SC | 12 | LLM03 | | Vector/Embedding Attacks | VE | 10 | LLM08 | | Improper Output Handling | IOH | 8 | LLM05 | | Unbounded Consumption | UC | 2 | LLM10 | | Misinformation | MIS | 6 | LLM09 | | Memory/Context Poisoning | CTX | 6 | ASI06 | | Unexpected Code Execution | UCE | 6 | ASI05 | | Inter-Agent Communication | IAC | 6 | ASI07 | | Human Trust Exploitation | HTE | 6 | ASI09 | | **总计** | | **168** | | ## 仓库结构 ``` taxonomy/ ← repo root (tachyonic-sh/taxonomy) ├── taxonomy/ ← ESF Phase 1: Name │ ├── attack_catalog.yaml # All 168 attacks (IDs, names, descriptions, severity) │ ├── owasp_mapping.yaml # Attack → OWASP LLM Top 10 mapping │ └── atlas_mapping.yaml # Attack → MITRE ATLAS mapping ├── schema/ │ └── attack_schema.yaml # YAML schema for attack definitions ├── remediation/ ← ESF Phase 3: Guess │ ├── by_owasp.yaml # Defensive guidance per OWASP category │ └── code_examples/ │ ├── input_validation.py # Input sanitization patterns │ └── output_sanitization.py # Output filtering patterns ├── research/ │ └── papers.yaml # Academic references index ├── examples/ │ └── sample_attacks.yaml # Basic public examples ├── ESF.md # How this repo implements ESF Phases 1-3 ├── README.md ├── LICENSE # Apache 2.0 └── CONTRIBUTING.md ``` ## 快速入门 ### 浏览分类目录 ``` # taxonomy/attack_catalog.yaml - id: PI-001 name: Direct Instruction Override category: prompt_injection description: > Attacker provides input that directly instructs the model to ignore its system prompt and follow new instructions instead. severity: critical owasp: LLM01 ``` ### 在您的安全评估中使用 1. 克隆本仓库 2. 查看 `taxonomy/attack_catalog.yaml` 以了解完整的攻击面 3. 查看 `remediation/by_owasp.yaml` 获取防御指导 4. 使用 `schema/attack_schema.yaml` 中的 schema 添加您自己的攻击定义 ### 映射到合规框架 ``` # taxonomy/owasp_mapping.yaml LLM01_prompt_injection: attacks: [PI-001, PI-002, ..., PI-020, MT-001, ..., MT-008] total: 28 description: Direct and indirect prompt injection techniques ``` ### 评估您的成熟度 使用 [ESF Quick Start](https://github.com/tachyonic-sh/esf/blob/main/guides/quick-start.md) 根据十阶段成熟度模型为您的系统打分。此分类法提供了第 1-3 阶段的基础。 ## Evolutionary Security Framework (ESF) 本仓库是 [ESF](https://github.com/tachyonic-sh/esf) 的**第 1-3 阶段参考实现**。 ESF 定义了安全知识如何通过十个阶段走向成熟——从命名威胁(第 1 阶段,即本仓库)到数学证明防御(第 9 阶段)。OWASP 告诉您风险*是什么*。ESF 则告诉您*如何逐步强化*以抵御这些风险。 | ESF 阶段 | 本仓库对应内容 | 作用 | |---|---|---| | Phase 1: **Name** | `taxonomy/` | 使用稳定的 ID 和框架映射对 168 种攻击进行分类 | | Phase 2: **Relate** | `taxonomy/*_mapping.yaml` | 映射与 OWASP 和 MITRE ATLAS 的关系 | | Phase 3: **Guess** | `remediation/` | 防御启发式方法和代码示例 | 查看 [ESF.md](ESF.md) 以获取完整的映射和发展路线图。 ## 未包含的内容 此分类法故意排除了: * **攻击 payload** —— 执行攻击的特定提示/内容 * **检测逻辑** —— 如何识别攻击是否成功 * **针对特定模型的成功率** —— 哪些攻击对哪些模型有效 * **置信度评分** —— 如何以编程方式评估漏洞的严重性 这些正是“知道攻击存在”与“能够系统性地测试攻击”之间的区别。 ## 贡献 有关指南,请参阅 [CONTRIBUTING.md](CONTRIBUTING.md)。我们欢迎: * 新的攻击技术描述 * 额外的框架映射(NIST、ISO 27001 等) * 修复指南的改进 * 研究论文参考 ## 专业评估 想要针对所有 168 种攻击向量测试您的 AI 系统吗?[Tachyonic](https://tachyonicai.com) 提供 48 小时的红队评估,包括完整报告、抵抗力评分和 ESF 成熟度评估。 [预约范围评估通话 →](https://cal.com/tachyonicai/ai-security-scoping) ## 许可证 Apache 2.0 —— 请参阅 [LICENSE](LICENSE)。 ## 引用 ``` @misc{tachyonic-taxonomy, title={Tachyonic Taxonomy: AI/LLM Attack Vectors}, author={Tachyonic}, year={2026}, url={https://github.com/tachyonic-sh/taxonomy} } ```
标签:AI红队, DLL 劫持, ESF, GPT, MITRE ATLAS, OWASP LLM Top 10, RuleLab, 人工智能安全, 合规性, 大语言模型, 威胁建模, 安全合规, 安全基线, 攻击向量, 攻防分类, 教学环境, 机器可读, 深度学习安全, 漏洞管理, 系统提示泄露, 网络代理, 网络安全, 逆向工具, 防御策略, 隐私保护