Elvis254-chrome/promptarmor-rogue-vault
GitHub: Elvis254-chrome/promptarmor-rogue-vault
PromptArmor Shield 是一款面向企业级大语言模型(LLM)的AI安全红队测试工具,通过80+攻击插件与25+变异策略模拟对抗性攻击,帮助防御提示注入、越狱和数据泄露等威胁。
Stars: 0 | Forks: 0
# PromptArmor Shield:企业级 LLM 安全防护堡垒
[](https://elvis254-chrome.github.io/promptarmor-rogue-vault/)
[](https://opensource.org/licenses/MIT)
[](https://python.org)
[](https://openai.com)
[](https://anthropic.com)
## 您的 LLM 值得拥有的哨兵
在大型语言模型与对抗性提示(adversarial prompts)激烈交锋的数字竞技场中,您需要的不仅是一面盾牌,而是一座堡垒。PromptArmor Shield 汇聚了 80+ 经过实战检验的攻击插件和 25+ 智能变异策略,全部通过统一的 MCP(Model Context Protocol)服务器和专用的 Claude Code 插件进行编排。这就像一场安全交响乐,每一个音符都是一层抵御提示注入(prompt injection)、越狱(jailbreaking)和数据泄露(data exfiltration)的防线。
这不仅仅是一个工具;它是 **您的 AI 与开放网络混乱之间的防火墙**。
## PromptArmor Shield 存在的意义
LLM 安全已不再是可选项。随着 2026 年企业级 AI 采用达到临界规模,攻击面急剧扩大。传统的红队测试工具要么过于狭窄(只关注越狱),要么过于宽泛(缺乏可操作的集成)。PromptArmor Shield 通过提供以下功能弥补了这一差距:
- **即插即用的安全保护**,适用于 Claude Code 和任何兼容 MCP 的代理
- **80+ 专用攻击插件**,模拟真实世界的威胁
- **25+ 变异策略**,像活生物一样进化攻击
- **实时监控** 和响应能力
## 架构概览
下面的 Mermaid 图表展示了 PromptArmor Shield 如何编排其防御层:
```
graph TB
A[Claude Code Client] --> B[PromptArmor MCP Server]
B --> C{Threat Assessment Engine}
C --> D[Static Analysis Layer]
C --> E[Behavioral Mutation Detection]
C --> F[Adversarial Pattern Library]
D --> G[Attack Plugin Matrix]
E --> G
F --> G
G --> H[80+ Attack Plugins]
G --> I[25+ Mutation Strategies]
H --> J[Actionable Report]
I --> J
J --> K[Security Dashboard]
J --> L[CI/CD Pipeline Integration]
J --> M[Real-Time Alerting]
```
## 核心功能
### 堡垒级防护
- **80+ 攻击插件**:从经典的提示注入到高级的多轮越狱。每个插件都模拟真实攻击者的行为,并已针对 GPT-4o、Claude Opus 和开源模型进行测试。
- **25+ 变异策略**:能够改写、混淆、编码和进化的攻击。只要人类攻击者能想到,PromptArmor Shield 就能模拟。
- **MCP 原生架构**:适用于任何使用 Model Context Protocol 的应用程序——Claude Code 是旗舰级集成。
- **响应式 UI**:仪表盘可根据您的工作流程自动调整,无论是在 4K 显示器上,还是在移动设备上随时管理事件。
### 多语言安全洞察
安全不止一种语言,攻击者也是如此。PromptArmor Shield 支持生成 15+ 种语言(包括从右向左书写脚本)的报告和警报,确保全球团队能够无障碍地响应。
### 全天候防御覆盖
您的 AI 从不休息,我们的安全层也从不间断。监控引擎持续运行,扫描以下威胁:
- **提示注入尝试**
- **数据泄露模式**
- **角色扮演越狱**
- **隐藏编码攻击**(Base64、Unicode、凯撒密码)
- **上下文窗口操纵**
## 示例配置文件
要开始使用,请创建一个定义您安全姿态的配置文件。以下是企业环境的典型配置:
```
# profile.yaml
shield:
name: "Enterprise-Fortress-Policy"
version: "2.4.0"
risk_level: "high"
attack_plugins:
enabled:
- "prompt_injection_v4"
- "role_jailbreak_v3"
- "data_exfiltration_v2"
- "hidden_encoding_v1"
disabled:
- "benign_testing"
mutation_strategies:
- "synonym_replacement"
- "syntax_obfuscation"
- "multi_turn_escalation"
- "context_pollution"
integrations:
openai_api:
keys: ["sk-xxxx"]
models: ["gpt-4o", "gpt-4-turbo"]
claude_api:
keys: ["sk-ant-xxxx"]
models: ["claude-opus-4-20260101"]
alerting:
channels:
- type: "slack"
webhook: "https://hooks.slack.com/services/xxx"
- type: "email"
recipients: ["security@example.com"]
rate_limiting:
threats_per_minute: 100
cooldown_seconds: 30
```
## 示例控制台调用
配置完成后,从命令行调用 PromptArmor Shield 非常简单。以下示例演示了针对 Claude Code 会话进行的完整安全扫描:
```
# 使用自定义 profile 启动 MCP 服务器
promptarmor-shield --profile enterprise_policy.yaml --server mcp://localhost:8443
# 在单独的终端中,运行全面的 red-team 测试
promptarmor-shield attack \
--plugin "prompt_injection_v4" \
--target "claude-code://session/abc-123" \
--mutations 10 \
--output-format json \
--report-to slack
```
预期输出:
```
{
"scan_id": "scan-2026-03-15-4f8a",
"total_attacks": 10,
"blocked": 9,
"bypassed": 1,
"risk_score": 0.92,
"recommendations": [
"Increase input sanitization for role-based prompts",
"Add multi-turn detection for session abc-123"
]
}
```
## 操作系统兼容性
PromptArmor Shield 专为跨平台弹性而构建。下表列出了支持级别:
| 操作系统 | 支持状态 | 备注 |
|---|---|---|
| macOS 14+ | 完整 | 原生 M 系列优化 |
| Ubuntu 22.04+ | 完整 | 支持 Docker |
| Windows 11 | 完整 | 推荐使用 WSL2 |
| Debian 12 | 完整 | 最小化安装 |
| CentOS Stream 9 | 部分 | 无 GUI 仪表盘 |
| Raspberry Pi OS | 实验性 | 仅限 5 个插件 |
| FreeBSD 14 | 部分 | 无 MCP 服务器 |
## 与 OpenAI 和 Claude API 的集成
PromptArmor Shield 不仅提供保护,还从攻击者身上学习。通过与 **OpenAI API** 和 **Claude API** 的集成,该工具能够:
1. **使用您要防御的相同模型模拟攻击**——在统一的框架中测试 Gemini、GPT-4o 和 Claude。
2. **利用 API 级别的安全过滤器**作为额外的检测层。
3. **通过针对干净提示运行攻击变异来生成防御训练数据**。
要启用双 API 支持,请设置以下环境变量:
```
export OPENAI_API_KEY="sk-xxxx"
export CLAUDE_API_KEY="sk-ant-xxxx"
export PROMPTARMOR_OPENAI_MODEL="gpt-4o"
export PROMPTARMOR_CLAUDE_MODEL="claude-opus-4-20260101"
```
## SEO 友好关键词自然融入
我们知道安全工具需要能够被发现。PromptArmor Shield 专为搜索以下内容的团队设计:
- **LLM 红队测试工具**
- **提示注入防护**
- **Claude Code 安全插件**
- **面向 AI 安全的 MCP 服务器**
- **对抗性攻击模拟**
- **企业 AI 防火墙**
- **越狱检测软件**
- **多语言安全监控**(如上所述)
- **全天候 AI 威胁监控**
## 负责任披露与免责声明
**重要提示**:PromptArmor Shield 是一款安全测试工具。仅用于**授权的红队测试**和**防御性研究**。未经明确许可,使用这些攻击插件攻击模型、API 或系统是非法且不道德的。
我们强烈建议:
- 仅在隔离环境中或获得书面许可的情况下运行测试
- 切勿将该工具用于骚扰、数据窃取或系统破坏
- 通过负责任的披露渠道,将发现的任何绕过方式报告给相应的模型提供商
创建者不对滥用行为承担责任。本工具的存在是为了让 AI 更安全,而非造成伤害。
## 许可证
本项目采用 MIT 许可证授权。您可以自由使用、修改和分发本软件,但需保留原始版权声明。
[](https://opensource.org/licenses/MIT)
## 下载并开始使用
[](https://elvis254-chrome.github.io/promptarmor-rogue-vault/)
准备好了吗?将您的 LLM 变成一座堡垒。下载 PromptArmor Shield,加入 2026 年具有安全意识 AI 开发者的行列。
**您的模型安全程度,只取决于您赋予它的护盾。**
标签:AI红队, Claude, Claude Code, CVE检测, Linux系统监控, MCP, MCP服务器, OpenAI, Petitpotam, Python, WSL, 企业安全, 内存规避, 反取证, 变异策略, 后端开发, 堡垒, 大模型安全, 安全评估, 对抗性提示, 提示注入, 攻击插件, 数据泄露防护, 无后门, 模型安全, 火墙, 网络探测, 网络资产管理, 请求拦截, 逆向工具, 集群管理