modelflytao/red-team-challenge
GitHub: modelflytao/red-team-challenge
Claude Code 的对抗式事实核查 skill,以「蓝军」角色对文档和想法进行多维度批判性评审,帮助用户发现事实错误和思维盲区。
Stars: 1 | Forks: 0
# 蓝军挑战 · red-team-challenge
**版本 v1.1.0** · Claude Code skill · 中文
## 这是什么
`red-team-challenge`(蓝军挑战)是一个 [Claude Code](https://claude.com/claude-code) skill,扮演一个**怀有敌意的资深评审**。默认立场:**你给的东西有问题,直到被证明无误。** 它不负责鼓励、不负责帮你润色措辞,只负责找茬、打假、挖盲区——并逼想法进化,而不是杀死它。
名字呼应华为"蓝军"机制:倡导自我批判,用一支专职唱反调的力量去攻击自己的方案。
## 它怎么打
**固定攻击优先级**:`A 事实核查 > D 盲区 > C 可行性 > B 逻辑`
**判定档**:
| 符号 | 含义 |
|---|---|
| 🟢 成立 | 有真实来源支撑 |
| 🟡 存疑 | 查无来源,既不能证实也不能证伪 |
| 🔴 证伪 | 找到明确反证(必过复核闸门) |
| 🔵 可优化 | 事实成立,但有更省/更快/更高杠杆的更优解 |
**两种模式(自动识别)**:
- **文档模式** — 逐条抽取事实性断言(数据/引用/案例/技术结论),派对抗子代理联网核查,逐条定级并给反哺动作。
- **想法模式** — 五步法:拆假设 → 三视角围攻(对手/用户/资源)→ 事前验尸(Pre-mortem)→ 对抗定级(标出"命门"假设)→ 反哺(为每条 🔴🟡 设计最便宜的验证实验或 Plan B)。
**开火前先锁定靶子(v1.1.0)** — 材料涉及某个决策、或有多种读法时,先一句话声明"挑战范围 + 对齐的决策 + 主攻轴",再立即开打(非阻塞),避免打错靶。
## 防"蓝军自己也编造"
对抗式评审最大的风险,是评审自己开始幻觉、为反对而反对。本 skill 用两道防线压制:
- **8 条铁律** — 来源必须真实可点开、区分"查无来源"与"证伪"、不杜撰原文、对事不对人、不许为反对而反对……
- **🔴 复核闸门** — 任何"证伪"写进报告前,必过 ① 反向复核子代理(立场反转,默认这是错杀)+ ② 主会话 WebFetch 来源抽查。任一不过,降级为 🟡。
## 怎么用
对 Claude Code 说:
- "用蓝军挑战这份文档 / 这个想法"
- "帮我反向挑战 / 找茬 / 唱反调"
- "审一下这个调研有没有编造 / 有没有 AI 幻觉"
- "这个想法有什么硬伤"
输入支持:本地文件路径、粘贴文本、飞书文档链接(经 lark-doc 拉取)。产出一份结构化挑战报告,落盘为 `<原名>-蓝军挑战-YYYY-MM-DD.md`。
**部署**:仓库 `skills/` 是唯一事实来源,`~/.claude/skills/` 只是部署产物。改完同步:
./scripts/deploy-skill.ps1
依赖:Claude Code(需 Agent 子代理 + WebSearch/WebFetch);可选 lark-doc(飞书链接)、Workflow(断言 >15 条时的并行彻查)。
## 看个真实例子
`samples/` 里有两份真实输出:
- **《生成式 AI 调研》** — 抓出"据 Gartner 2024,全球 92% 企业已在生产环境部署生成式 AI"系**编造**:真实 Gartner 数据为 29% 已部署,92% 疑为把"到 2026 年超 80%"的未来预测篡改成现状。
- **《比微信快 10 倍的国产 IM》** — 证伪"半年抢 1000 万用户"(来往、子弹短信、米聊的历史失败反复证伪),并指出攻击点选错了战场:壁垒是社交关系链,不是速度。
## 仓库结构
skills/red-team-challenge/ # skill 本体(唯一事实来源)
SKILL.md # 主指令:人格、攻击优先级、8 铁律、复核闸门、两模式
references/ # 子代理提示词、报告模板、Workflow 脚本模板
docs/superpowers/ # 设计文档、实现计划、自挑战复盘
samples/ # 两份真实挑战报告
scripts/deploy-skill.ps1 # 部署到 ~/.claude/skills/
## 它是怎么进化的
v1.1.0 的两个新能力(🔵可优化、锁定靶子)不是拍脑袋加的,而是把一份"升级建议"喂给这个 skill 自己跑(dogfood),让 4 个独立对抗子代理去打。结果 8 条建议里 6 条被否决或缩水——增子代理的"增效 pass"、死台账 + 采纳率 KPI、阻塞式前置契约、🟢 普查复核……只留下两条"便宜版"(复用已有机制、零额外子代理)。
全过程按 `superpowers:writing-skills` 的 RED→GREEN 纪律:先看现版在哪失败,再改,再复跑验证。复盘见 [`docs/superpowers/2026-06-20-蓝军自挑战-升级建议复盘.md`](docs/superpowers/2026-06-20-蓝军自挑战-升级建议复盘.md)。
## 变更记录
见 [`skills/red-team-challenge/SKILL.md`](skills/red-team-challenge/SKILL.md) 文末。
*这是一个个人 Claude Code skill 项目,部署脚本面向 Windows / PowerShell。*
标签:AI助手, AI合规, Claude Code, Libemu, 事实核查, 对抗性评审, 红蓝对抗思维