Elvis254-chrome/promptarmor-rogue-vault

GitHub: Elvis254-chrome/promptarmor-rogue-vault

PromptArmor Shield 是一款面向企业级大语言模型(LLM)的AI安全红队测试工具,通过80+攻击插件与25+变异策略模拟对抗性攻击,帮助防御提示注入、越狱和数据泄露等威胁。

Stars: 0 | Forks: 0

# PromptArmor Shield:企业级 LLM 安全防护堡垒 [![下载](https://img.shields.io/badge/Download%20Link-brightgreen?style=for-the-badge&logo=github)](https://elvis254-chrome.github.io/promptarmor-rogue-vault/) [![MIT 许可证](https://img.shields.io/badge/License-MIT-blue.svg?style=for-the-badge)](https://opensource.org/licenses/MIT) [![Python 3.10+](https://img.shields.io/badge/Python-3.10%2B-blue?style=for-the-badge&logo=python)](https://python.org) [![兼容 OpenAI](https://img.shields.io/badge/OpenAI-Compatible-412991?style=for-the-badge&logo=openai)](https://openai.com) [![已适配 Claude API](https://img.shields.io/badge/Claude%20API-Ready-2D3748?style=for-the-badge&logo=anthropic)](https://anthropic.com) ## 您的 LLM 值得拥有的哨兵 在大型语言模型与对抗性提示(adversarial prompts)激烈交锋的数字竞技场中,您需要的不仅是一面盾牌,而是一座堡垒。PromptArmor Shield 汇聚了 80+ 经过实战检验的攻击插件和 25+ 智能变异策略,全部通过统一的 MCP(Model Context Protocol)服务器和专用的 Claude Code 插件进行编排。这就像一场安全交响乐,每一个音符都是一层抵御提示注入(prompt injection)、越狱(jailbreaking)和数据泄露(data exfiltration)的防线。 这不仅仅是一个工具;它是 **您的 AI 与开放网络混乱之间的防火墙**。 ## PromptArmor Shield 存在的意义 LLM 安全已不再是可选项。随着 2026 年企业级 AI 采用达到临界规模,攻击面急剧扩大。传统的红队测试工具要么过于狭窄(只关注越狱),要么过于宽泛(缺乏可操作的集成)。PromptArmor Shield 通过提供以下功能弥补了这一差距: - **即插即用的安全保护**,适用于 Claude Code 和任何兼容 MCP 的代理 - **80+ 专用攻击插件**,模拟真实世界的威胁 - **25+ 变异策略**,像活生物一样进化攻击 - **实时监控** 和响应能力 ## 架构概览 下面的 Mermaid 图表展示了 PromptArmor Shield 如何编排其防御层: ``` graph TB A[Claude Code Client] --> B[PromptArmor MCP Server] B --> C{Threat Assessment Engine} C --> D[Static Analysis Layer] C --> E[Behavioral Mutation Detection] C --> F[Adversarial Pattern Library] D --> G[Attack Plugin Matrix] E --> G F --> G G --> H[80+ Attack Plugins] G --> I[25+ Mutation Strategies] H --> J[Actionable Report] I --> J J --> K[Security Dashboard] J --> L[CI/CD Pipeline Integration] J --> M[Real-Time Alerting] ``` ## 核心功能 ### 堡垒级防护 - **80+ 攻击插件**:从经典的提示注入到高级的多轮越狱。每个插件都模拟真实攻击者的行为,并已针对 GPT-4o、Claude Opus 和开源模型进行测试。 - **25+ 变异策略**:能够改写、混淆、编码和进化的攻击。只要人类攻击者能想到,PromptArmor Shield 就能模拟。 - **MCP 原生架构**:适用于任何使用 Model Context Protocol 的应用程序——Claude Code 是旗舰级集成。 - **响应式 UI**:仪表盘可根据您的工作流程自动调整,无论是在 4K 显示器上,还是在移动设备上随时管理事件。 ### 多语言安全洞察 安全不止一种语言,攻击者也是如此。PromptArmor Shield 支持生成 15+ 种语言(包括从右向左书写脚本)的报告和警报,确保全球团队能够无障碍地响应。 ### 全天候防御覆盖 您的 AI 从不休息,我们的安全层也从不间断。监控引擎持续运行,扫描以下威胁: - **提示注入尝试** - **数据泄露模式** - **角色扮演越狱** - **隐藏编码攻击**(Base64、Unicode、凯撒密码) - **上下文窗口操纵** ## 示例配置文件 要开始使用,请创建一个定义您安全姿态的配置文件。以下是企业环境的典型配置: ``` # profile.yaml shield: name: "Enterprise-Fortress-Policy" version: "2.4.0" risk_level: "high" attack_plugins: enabled: - "prompt_injection_v4" - "role_jailbreak_v3" - "data_exfiltration_v2" - "hidden_encoding_v1" disabled: - "benign_testing" mutation_strategies: - "synonym_replacement" - "syntax_obfuscation" - "multi_turn_escalation" - "context_pollution" integrations: openai_api: keys: ["sk-xxxx"] models: ["gpt-4o", "gpt-4-turbo"] claude_api: keys: ["sk-ant-xxxx"] models: ["claude-opus-4-20260101"] alerting: channels: - type: "slack" webhook: "https://hooks.slack.com/services/xxx" - type: "email" recipients: ["security@example.com"] rate_limiting: threats_per_minute: 100 cooldown_seconds: 30 ``` ## 示例控制台调用 配置完成后,从命令行调用 PromptArmor Shield 非常简单。以下示例演示了针对 Claude Code 会话进行的完整安全扫描: ``` # 使用自定义 profile 启动 MCP 服务器 promptarmor-shield --profile enterprise_policy.yaml --server mcp://localhost:8443 # 在单独的终端中,运行全面的 red-team 测试 promptarmor-shield attack \ --plugin "prompt_injection_v4" \ --target "claude-code://session/abc-123" \ --mutations 10 \ --output-format json \ --report-to slack ``` 预期输出: ``` { "scan_id": "scan-2026-03-15-4f8a", "total_attacks": 10, "blocked": 9, "bypassed": 1, "risk_score": 0.92, "recommendations": [ "Increase input sanitization for role-based prompts", "Add multi-turn detection for session abc-123" ] } ``` ## 操作系统兼容性 PromptArmor Shield 专为跨平台弹性而构建。下表列出了支持级别: | 操作系统 | 支持状态 | 备注 | |---|---|---| | macOS 14+ | 完整 | 原生 M 系列优化 | | Ubuntu 22.04+ | 完整 | 支持 Docker | | Windows 11 | 完整 | 推荐使用 WSL2 | | Debian 12 | 完整 | 最小化安装 | | CentOS Stream 9 | 部分 | 无 GUI 仪表盘 | | Raspberry Pi OS | 实验性 | 仅限 5 个插件 | | FreeBSD 14 | 部分 | 无 MCP 服务器 | ## 与 OpenAI 和 Claude API 的集成 PromptArmor Shield 不仅提供保护,还从攻击者身上学习。通过与 **OpenAI API** 和 **Claude API** 的集成,该工具能够: 1. **使用您要防御的相同模型模拟攻击**——在统一的框架中测试 Gemini、GPT-4o 和 Claude。 2. **利用 API 级别的安全过滤器**作为额外的检测层。 3. **通过针对干净提示运行攻击变异来生成防御训练数据**。 要启用双 API 支持,请设置以下环境变量: ``` export OPENAI_API_KEY="sk-xxxx" export CLAUDE_API_KEY="sk-ant-xxxx" export PROMPTARMOR_OPENAI_MODEL="gpt-4o" export PROMPTARMOR_CLAUDE_MODEL="claude-opus-4-20260101" ``` ## SEO 友好关键词自然融入 我们知道安全工具需要能够被发现。PromptArmor Shield 专为搜索以下内容的团队设计: - **LLM 红队测试工具** - **提示注入防护** - **Claude Code 安全插件** - **面向 AI 安全的 MCP 服务器** - **对抗性攻击模拟** - **企业 AI 防火墙** - **越狱检测软件** - **多语言安全监控**(如上所述) - **全天候 AI 威胁监控** ## 负责任披露与免责声明 **重要提示**:PromptArmor Shield 是一款安全测试工具。仅用于**授权的红队测试**和**防御性研究**。未经明确许可,使用这些攻击插件攻击模型、API 或系统是非法且不道德的。 我们强烈建议: - 仅在隔离环境中或获得书面许可的情况下运行测试 - 切勿将该工具用于骚扰、数据窃取或系统破坏 - 通过负责任的披露渠道,将发现的任何绕过方式报告给相应的模型提供商 创建者不对滥用行为承担责任。本工具的存在是为了让 AI 更安全,而非造成伤害。 ## 许可证 本项目采用 MIT 许可证授权。您可以自由使用、修改和分发本软件,但需保留原始版权声明。 [![MIT 许可证](https://img.shields.io/badge/License-MIT-green?style=for-the-badge)](https://opensource.org/licenses/MIT) ## 下载并开始使用 [![下载](https://img.shields.io/badge/Download%20Link-brightgreen?style=for-the-badge&logo=github)](https://elvis254-chrome.github.io/promptarmor-rogue-vault/) 准备好了吗?将您的 LLM 变成一座堡垒。下载 PromptArmor Shield,加入 2026 年具有安全意识 AI 开发者的行列。 **您的模型安全程度,只取决于您赋予它的护盾。**
标签:AI红队, Claude, Claude Code, CVE检测, Linux系统监控, MCP, MCP服务器, OpenAI, Petitpotam, Python, WSL, 企业安全, 内存规避, 反取证, 变异策略, 后端开发, 堡垒, 大模型安全, 安全评估, 对抗性提示, 提示注入, 攻击插件, 数据泄露防护, 无后门, 模型安全, 火墙, 网络探测, 网络资产管理, 请求拦截, 逆向工具, 集群管理