Drvivek34/Jailbreak-Bazaar
GitHub: Drvivek34/Jailbreak-Bazaar
一个 LLM 红队攻击与防御配对的目录,收录越狱和提示注入技术并附带缓解措施,帮助安全研究者和工程师加固模型。
Stars: 0 | Forks: 0
# 🛡️ Jailbreak Bazaar
[](https://drvivek34.github.io/Mega-AI-Bazaar/) [](https://github.com/Drvivek34/Jailbreak-Bazaar/issues/new/choose) [](LICENSE)
Jailbreak Bazaar 是一个**防御性安全研究**目录,收录了 LLM 越狱和提示注入技术,**并附带了相应的缓解措施**,旨在帮助红队和安全工程师加固他们自己的系统。⚠️ 仅限用于授权的测试和研究——每个条目都必须记录防御措施。
## ⚠️ 负责任使用声明
本仓库旨在用于**授权的红队对抗、模型鲁棒性测试和安全研究**。请勿将这些材料用于未获授权测试的系统或个人。每个条目都将技术与**缓解措施**配对,以便防御者能够加固他们的模型。针对真实个人/系统或有助于造成具体伤害的内容将被移除。
## 📂 分类
**[⭐ 精选](featured/)** — 精选内容,展示在最前面。
| 分类 | 关于 |
|---|---|
| [基准与数据集](benchmarks-datasets/) | 用于衡量越狱鲁棒性的评估套件和数据集。 |
| [上下文操纵](context-manipulation/) | 上下文填充、干扰和 few-shot 投毒 + 防御。 |
| [数据渗出](data-exfiltration/) | 间接注入 → 通过工具/链接渗出及出口防御。 |
| [防御与缓解](defenses-mitigations/) | 独立的护栏、分类器和加固指南。 |
| [编码与混淆](encoding-obfuscation/) | Base64/leetspeak/unicode 混淆和标准化防御。 |
| [指令覆盖](instruction-override/) | 系统提示覆盖 / 忽略先前指令模式及护栏。 |
| [杂项](misc/) | 其他授权研究项目。 |
| [特定模型](model-specific/) | 限于特定模型/版本的发现(每个模型使用单独的子文件夹)。 |
| [多轮攻击](multi-turn-attacks/) | 渐进式和多次多轮升级 + 会话级别防御。 |
| [载荷拆分](payload-splitting/) | token/载荷碎片化和重组 + 输入聚合防御。 |
| [提示注入](prompt-injection/) | 直接和间接提示注入攻击及输入处理防御。 |
| [拒绝抑制](refusal-suppression/) | 抑制拒绝/安全补全以及 alignment 如何应对它们。 |
| [角色扮演与人设](roleplay-personas/) | 人设/基于角色的绕过(DAN 风格)及人设锁定防御。 |
| [系统提示提取](system-prompt-extraction/) | 提示泄漏/提取技术和机密性防御。 |
| [工具与代理滥用](tool-agent-abuse/) | 滥用工具调用/代理循环及最小权限/沙箱防御。 |
| [工具](tooling/) | 用于 LLM 安全测试的自动化红队/模糊测试框架。 |
## 🗂️ 组织方式
每项技术都位于某个分类下**独立的子文件夹**中,并附带一个 `README.md`,记录其**来源、作者和原始许可证**(保留所有文件的完整副本)。请参阅 **[CONTRIBUTING.md](CONTRIBUTING.md)**。
## 📜 许可证与署名
仓库结构和原创文本:**MIT**(详见 [LICENSE](LICENSE))。收集的每项技术**保留其原作者的许可证**;条目记录了其来源。如果您是作者并希望进行修改,请提交一个 issue。
**[Mega AI Bazaar](https://drvivek34.github.io/Mega-AI-Bazaar/)** 的一部分 — 所有 bazaar 的入口。
标签:AI安全, Chat Copilot, CISA项目, DLL 劫持, DNS 反向解析, 大语言模型, 数据展示, 红队, 防御 mitigation, 防御加固