Drvivek34/Jailbreak-Bazaar

GitHub: Drvivek34/Jailbreak-Bazaar

一个 LLM 红队攻击与防御配对的目录,收录越狱和提示注入技术并附带缓解措施,帮助安全研究者和工程师加固模型。

Stars: 0 | Forks: 0

# 🛡️ Jailbreak Bazaar [![Mega AI Bazaar](https://img.shields.io/badge/🌐_Mega_AI_Bazaar-browse_all-6C5CE7)](https://drvivek34.github.io/Mega-AI-Bazaar/) [![提交](https://img.shields.io/badge/➕_Submit-a_techniques-2ecc71)](https://github.com/Drvivek34/Jailbreak-Bazaar/issues/new/choose) [![许可证](https://img.shields.io/badge/License-MIT-blue)](LICENSE) Jailbreak Bazaar 是一个**防御性安全研究**目录,收录了 LLM 越狱和提示注入技术,**并附带了相应的缓解措施**,旨在帮助红队和安全工程师加固他们自己的系统。⚠️ 仅限用于授权的测试和研究——每个条目都必须记录防御措施。 ## ⚠️ 负责任使用声明 本仓库旨在用于**授权的红队对抗、模型鲁棒性测试和安全研究**。请勿将这些材料用于未获授权测试的系统或个人。每个条目都将技术与**缓解措施**配对,以便防御者能够加固他们的模型。针对真实个人/系统或有助于造成具体伤害的内容将被移除。 ## 📂 分类 **[⭐ 精选](featured/)** — 精选内容,展示在最前面。 | 分类 | 关于 | |---|---| | [基准与数据集](benchmarks-datasets/) | 用于衡量越狱鲁棒性的评估套件和数据集。 | | [上下文操纵](context-manipulation/) | 上下文填充、干扰和 few-shot 投毒 + 防御。 | | [数据渗出](data-exfiltration/) | 间接注入 → 通过工具/链接渗出及出口防御。 | | [防御与缓解](defenses-mitigations/) | 独立的护栏、分类器和加固指南。 | | [编码与混淆](encoding-obfuscation/) | Base64/leetspeak/unicode 混淆和标准化防御。 | | [指令覆盖](instruction-override/) | 系统提示覆盖 / 忽略先前指令模式及护栏。 | | [杂项](misc/) | 其他授权研究项目。 | | [特定模型](model-specific/) | 限于特定模型/版本的发现(每个模型使用单独的子文件夹)。 | | [多轮攻击](multi-turn-attacks/) | 渐进式和多次多轮升级 + 会话级别防御。 | | [载荷拆分](payload-splitting/) | token/载荷碎片化和重组 + 输入聚合防御。 | | [提示注入](prompt-injection/) | 直接和间接提示注入攻击及输入处理防御。 | | [拒绝抑制](refusal-suppression/) | 抑制拒绝/安全补全以及 alignment 如何应对它们。 | | [角色扮演与人设](roleplay-personas/) | 人设/基于角色的绕过(DAN 风格)及人设锁定防御。 | | [系统提示提取](system-prompt-extraction/) | 提示泄漏/提取技术和机密性防御。 | | [工具与代理滥用](tool-agent-abuse/) | 滥用工具调用/代理循环及最小权限/沙箱防御。 | | [工具](tooling/) | 用于 LLM 安全测试的自动化红队/模糊测试框架。 | ## 🗂️ 组织方式 每项技术都位于某个分类下**独立的子文件夹**中,并附带一个 `README.md`,记录其**来源、作者和原始许可证**(保留所有文件的完整副本)。请参阅 **[CONTRIBUTING.md](CONTRIBUTING.md)**。 ## 📜 许可证与署名 仓库结构和原创文本:**MIT**(详见 [LICENSE](LICENSE))。收集的每项技术**保留其原作者的许可证**;条目记录了其来源。如果您是作者并希望进行修改,请提交一个 issue。 **[Mega AI Bazaar](https://drvivek34.github.io/Mega-AI-Bazaar/)** 的一部分 — 所有 bazaar 的入口。
标签:AI安全, Chat Copilot, CISA项目, DLL 劫持, DNS 反向解析, 大语言模型, 数据展示, 红队, 防御 mitigation, 防御加固