Elvis254-chrome/promptarmor-rogue-vault

GitHub: Elvis254-chrome/promptarmor-rogue-vault

PromptArmor Shield 是一款面向企业级大语言模型（LLM）的AI安全红队测试工具，通过80+攻击插件与25+变异策略模拟对抗性攻击，帮助防御提示注入、越狱和数据泄露等威胁。

Stars: 2 | Forks: 0

# PromptArmor Shield：企业级 LLM 安全防护堡垒 [![下载](https://img.shields.io/badge/Download%20Link-brightgreen?style=for-the-badge&logo=github)](https://elvis254-chrome.github.io/promptarmor-rogue-vault/) [![MIT 许可证](https://img.shields.io/badge/License-MIT-blue.svg?style=for-the-badge)](https://opensource.org/licenses/MIT) [![Python 3.10+](https://img.shields.io/badge/Python-3.10%2B-blue?style=for-the-badge&logo=python)](https://python.org) [![兼容 OpenAI](https://img.shields.io/badge/OpenAI-Compatible-412991?style=for-the-badge&logo=openai)](https://openai.com) [![已适配 Claude API](https://img.shields.io/badge/Claude%20API-Ready-2D3748?style=for-the-badge&logo=anthropic)](https://anthropic.com) ## 您的 LLM 值得拥有的哨兵在大型语言模型与对抗性提示（adversarial prompts）激烈交锋的数字竞技场中，您需要的不仅是一面盾牌，而是一座堡垒。PromptArmor Shield 汇聚了 80+ 经过实战检验的攻击插件和 25+ 智能变异策略，全部通过统一的 MCP（Model Context Protocol）服务器和专用的 Claude Code 插件进行编排。这就像一场安全交响乐，每一个音符都是一层抵御提示注入（prompt injection）、越狱（jailbreaking）和数据泄露（data exfiltration）的防线。这不仅仅是一个工具；它是 **您的 AI 与开放网络混乱之间的防火墙**。 ## PromptArmor Shield 存在的意义 LLM 安全已不再是可选项。随着 2026 年企业级 AI 采用达到临界规模，攻击面急剧扩大。传统的红队测试工具要么过于狭窄（只关注越狱），要么过于宽泛（缺乏可操作的集成）。PromptArmor Shield 通过提供以下功能弥补了这一差距： - **即插即用的安全保护**，适用于 Claude Code 和任何兼容 MCP 的代理 - **80+ 专用攻击插件**，模拟真实世界的威胁 - **25+ 变异策略**，像活生物一样进化攻击 - **实时监控** 和响应能力 ## 架构概览下面的 Mermaid 图表展示了 PromptArmor Shield 如何编排其防御层： ``` graph TB A[Claude Code Client] --> B[PromptArmor MCP Server] B --> C{Threat Assessment Engine} C --> D[Static Analysis Layer] C --> E[Behavioral Mutation Detection] C --> F[Adversarial Pattern Library] D --> G[Attack Plugin Matrix] E --> G F --> G G --> H[80+ Attack Plugins] G --> I[25+ Mutation Strategies] H --> J[Actionable Report] I --> J J --> K[Security Dashboard] J --> L[CI/CD Pipeline Integration] J --> M[Real-Time Alerting] ``` ## 核心功能 ### 堡垒级防护 - **80+ 攻击插件**：从经典的提示注入到高级的多轮越狱。每个插件都模拟真实攻击者的行为，并已针对 GPT-4o、Claude Opus 和开源模型进行测试。 - **25+ 变异策略**：能够改写、混淆、编码和进化的攻击。只要人类攻击者能想到，PromptArmor Shield 就能模拟。 - **MCP 原生架构**：适用于任何使用 Model Context Protocol 的应用程序——Claude Code 是旗舰级集成。 - **响应式 UI**：仪表盘可根据您的工作流程自动调整，无论是在 4K 显示器上，还是在移动设备上随时管理事件。 ### 多语言安全洞察安全不止一种语言，攻击者也是如此。PromptArmor Shield 支持生成 15+ 种语言（包括从右向左书写脚本）的报告和警报，确保全球团队能够无障碍地响应。 ### 全天候防御覆盖您的 AI 从不休息，我们的安全层也从不间断。监控引擎持续运行，扫描以下威胁： - **提示注入尝试** - **数据泄露模式** - **角色扮演越狱** - **隐藏编码攻击**（Base64、Unicode、凯撒密码） - **上下文窗口操纵** ## 示例配置文件要开始使用，请创建一个定义您安全姿态的配置文件。以下是企业环境的典型配置： ``` # profile.yaml shield: name: "Enterprise-Fortress-Policy" version: "2.4.0" risk_level: "high" attack_plugins: enabled: - "prompt_injection_v4" - "role_jailbreak_v3" - "data_exfiltration_v2" - "hidden_encoding_v1" disabled: - "benign_testing" mutation_strategies: - "synonym_replacement" - "syntax_obfuscation" - "multi_turn_escalation" - "context_pollution" integrations: openai_api: keys: ["sk-xxxx"] models: ["gpt-4o", "gpt-4-turbo"] claude_api: keys: ["sk-ant-xxxx"] models: ["claude-opus-4-20260101"] alerting: channels: - type: "slack" webhook: "https://hooks.slack.com/services/xxx" - type: "email" recipients: ["security@example.com"] rate_limiting: threats_per_minute: 100 cooldown_seconds: 30 ``` ## 示例控制台调用配置完成后，从命令行调用 PromptArmor Shield 非常简单。以下示例演示了针对 Claude Code 会话进行的完整安全扫描： ``` # 使用自定义 profile 启动 MCP 服务器 promptarmor-shield --profile enterprise_policy.yaml --server mcp://localhost:8443 # 在单独的终端中，运行全面的 red-team 测试 promptarmor-shield attack \ --plugin "prompt_injection_v4" \ --target "claude-code://session/abc-123" \ --mutations 10 \ --output-format json \ --report-to slack ``` 预期输出： ``` { "scan_id": "scan-2026-03-15-4f8a", "total_attacks": 10, "blocked": 9, "bypassed": 1, "risk_score": 0.92, "recommendations": [ "Increase input sanitization for role-based prompts", "Add multi-turn detection for session abc-123" ] } ``` ## 操作系统兼容性 PromptArmor Shield 专为跨平台弹性而构建。下表列出了支持级别： | 操作系统 | 支持状态 | 备注 | |---|---|---| | macOS 14+ | 完整 | 原生 M 系列优化 | | Ubuntu 22.04+ | 完整 | 支持 Docker | | Windows 11 | 完整 | 推荐使用 WSL2 | | Debian 12 | 完整 | 最小化安装 | | CentOS Stream 9 | 部分 | 无 GUI 仪表盘 | | Raspberry Pi OS | 实验性 | 仅限 5 个插件 | | FreeBSD 14 | 部分 | 无 MCP 服务器 | ## 与 OpenAI 和 Claude API 的集成 PromptArmor Shield 不仅提供保护，还从攻击者身上学习。通过与 **OpenAI API** 和 **Claude API** 的集成，该工具能够： 1. **使用您要防御的相同模型模拟攻击**——在统一的框架中测试 Gemini、GPT-4o 和 Claude。 2. **利用 API 级别的安全过滤器**作为额外的检测层。 3. **通过针对干净提示运行攻击变异来生成防御训练数据**。要启用双 API 支持，请设置以下环境变量： ``` export OPENAI_API_KEY="sk-xxxx" export CLAUDE_API_KEY="sk-ant-xxxx" export PROMPTARMOR_OPENAI_MODEL="gpt-4o" export PROMPTARMOR_CLAUDE_MODEL="claude-opus-4-20260101" ``` ## SEO 友好关键词自然融入我们知道安全工具需要能够被发现。PromptArmor Shield 专为搜索以下内容的团队设计： - **LLM 红队测试工具** - **提示注入防护** - **Claude Code 安全插件** - **面向 AI 安全的 MCP 服务器** - **对抗性攻击模拟** - **企业 AI 防火墙** - **越狱检测软件** - **多语言安全监控**（如上所述） - **全天候 AI 威胁监控** ## 负责任披露与免责声明 **重要提示**：PromptArmor Shield 是一款安全测试工具。仅用于**授权的红队测试**和**防御性研究**。未经明确许可，使用这些攻击插件攻击模型、API 或系统是非法且不道德的。我们强烈建议： - 仅在隔离环境中或获得书面许可的情况下运行测试 - 切勿将该工具用于骚扰、数据窃取或系统破坏 - 通过负责任的披露渠道，将发现的任何绕过方式报告给相应的模型提供商创建者不对滥用行为承担责任。本工具的存在是为了让 AI 更安全，而非造成伤害。 ## 许可证本项目采用 MIT 许可证授权。您可以自由使用、修改和分发本软件，但需保留原始版权声明。 [![MIT 许可证](https://img.shields.io/badge/License-MIT-green?style=for-the-badge)](https://opensource.org/licenses/MIT) ## 下载并开始使用 [![下载](https://img.shields.io/badge/Download%20Link-brightgreen?style=for-the-badge&logo=github)](https://elvis254-chrome.github.io/promptarmor-rogue-vault/) 准备好了吗？将您的 LLM 变成一座堡垒。下载 PromptArmor Shield，加入 2026 年具有安全意识 AI 开发者的行列。 **您的模型安全程度，只取决于您赋予它的护盾。**

标签：AI红队, Claude, Claude Code, CVE检测, Linux系统监控, MCP, MCP服务器, OpenAI, Petitpotam, Python, WSL, 企业安全, 内存规避, 反取证, 变异策略, 后端开发, 堡垒, 大模型安全, 安全评估, 对抗性提示, 提示注入, 攻击插件, 数据泄露防护, 无后门, 模型安全, 火墙, 网络探测, 网络资产管理, 请求拦截, 逆向工具, 集群管理