arthurzhuhan/az-delivery-team

GitHub: arthurzhuhan/az-delivery-team

一个基于 Claude Code 的自主多智能体交付系统，将设计文档自动转化为带对抗验证的端到端发布流程并输出 GO/NO-GO 报告。

Stars: 1 | Forks: 0

# 交付团队 ![Delivery Team](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/ed9470e024212300.webp) 一个用于 Claude Code 的自主多智能体交付系统。扔一份设计文档进去，去睡觉，醒来后看到 GO/NO-GO 报告。 ## 工作原理 ``` 设计文档 ──> delivery.sh | Phase 0: 交接检查 PO + 架构师审查设计文档 PO 将设计拆解为 Story 列表你审核 Story（或 --auto-approve-stories 跳过） | Phase 1: 实施（逐 Story 循环）每个 Story 一次 claude 调用（干净上下文） TDD：先写测试，再实现跨域并行，域内串行 | Phase 2: 验证（7 个 Agent 并行）冒烟测试 | API 测试 | 安全审计红队对抗 | UI/UX QA | 性能审计 | 上线就绪 | Phase 3: 终审综合 7 份报告，仲裁冲突 GO ──> 完成！ NO-GO ──> findings 变成 FIX Story ──> 回到 Phase 1 ``` ## 团队结构（3 层，10+N 角色） ### 第一层：定义（做什么） | 智能体 | 角色 | |-------|------| | product-owner | 守护核心目标，拆解设计为 Stories，记录所有变更 | | project-architect | 系统设计、领域边界、跨领域协调 | ### 第二层：实施（怎么做） | 智能体 | 角色 | |-------|------| | {domain}-engineer x N | 每个业务领域的全栈工程师（TDD 工作流） | ### 第三层：验证（对抗式交叉验证） | 智能体 | 角色 | |-------|------| | smoke-tester | 核心流程测试 + 截图证据 | | api-tester | API 契约 / 边界 / 错误码测试 | | security-auditor | OWASP Top 10 + 密钥扫描 + 依赖审计 | | red-team | 攻击 + 质疑任何智能体的 PASS | | uiux-qa | 布局 + 信息架构 + UX 审查 | | performance-auditor | 核心 Web 指标 + 包体积 + API 延迟 | | launch-readiness | SEO + 可访问性 + 合规 + HTTPS | | acceptance-reviewer | 综合 7 份报告，仲裁冲突并做出最终 GO/NO-GO 决策 | ## 快速开始 ### 1. 安装技能 ``` # 复制到你的 Claude Code 技能目录 cp -r . ~/.claude/skills/az-delivery-team/ ``` ### 2. 初始化项目在 Claude Code 中运行： ``` /az-delivery-team ``` 回答提示问题（项目信息、领域拆分）。该技能会在项目的 `.claude/agents/` 目录中创建智能体文件。 ### 3. 运行交付循环 ``` # 交互模式（在实施前回顾故事） ./delivery.sh # 全自动化模式 ./delivery.sh --auto-approve-stories # 自定义最大轮数 ./delivery.sh --max-rounds 3 ``` ## 关键概念 ### 每个 Story 独立上下文每个 Story 均由一个全新的 `claude` 调用执行，不携带上下文。记忆仅通过文件持久化： - `delivery.json` — 任务状态（哪些 Stories 通过/失败） - `progress.txt` — 累积的代码库知识（模式、注意事项） - `.claude/reports/` — 验证报告与问题跟踪 - Git 历史 — 代码变更 ### 对抗式验证七个验证智能体独立工作，其结论**可能互相矛盾**。红队智能体有权质疑其他智能体的 PASS。验收评审智能体负责仲裁并做出最终决策。 ### 自愈循环 NO-GO 结果会自动转化为新的 FIX Story。循环将持续进行，直到获得 GO 或达到最大轮次。失败 3 次以上的 Story 会被标记为 `blocked` 并需要人工干预。 ### Story 评审检查点在 Phase 0 之后，脚本会暂停，让你审阅 Story 列表后再开始实施。如需修改，可编辑 `delivery.json`，然后按回车。也可使用 `--auto-approve-stories` 跳过。 ## 状态文件：delivery.json ``` { "project": "MyProject", "designDocs": ["docs/design.md"], "maxRounds": 5, "currentPhase": "phase0", "round": 1, "stories": [ { "id": "US-001", "domain": "orders", "title": "Add order creation endpoint", "passes": false, "source": "prd", "failCount": 0, "blocked": false } ], "verification": { "reports": { "smoke-tester": null, ... }, "verdict": null } } ``` ## 安全特性 | 功能 | 说明 | |------|------| | 断点恢复 | `currentPhase` 保存在 JSON 中；重启后从上次位置继续 | | 停滞检测 | 连续 3 批无进展 → 强制进入验证阶段 | | 未收敛 | `failCount >= 3` → 标记 Story 为 `blocked` 并跳过 | | Git 回滚 | 每轮开始前打标签 `delivery-round-N-start`；全部失败时回滚代码（保留状态文件） | | 评审门控 | Phase 0 后暂停供人工审查（可用 `--auto-approve-stories` 跳过） | | 报告验证 | 仅当验证报告实际产生后，才进入 Phase 2 → Phase 3 | ## 项目结构 ``` az-delivery-team/ ├── SKILL.md # Skill definition (Claude Code reads this) ├── delivery.sh # The autonomous loop orchestrator ├── delivery.json.example # State file template ├── README.md # You are here └── templates/ # Agent prompt templates ├── product-owner.md ├── project-architect.md ├── domain-engineer.md # Instantiated N times (one per domain) ├── smoke-tester.md ├── api-tester.md ├── security-auditor.md ├── red-team.md ├── uiux-qa.md ├── performance-auditor.md ├── launch-readiness.md └── acceptance-reviewer.md ``` ## 要求 - [Claude Code](https://docs.anthropic.com/en/docs/claude-code)（`npm install -g @anthropic-ai/claude-code`） - `jq`（macOS 上使用 `brew install jq`） - 用于项目的 Git 仓库 ## 许可证 MIT

标签：AI工程化, API测试, Claude Code, GO/NO-GO决策, Homebrew安装, LNA, PyRIT, TDD测试驱动开发, UI/UX质量保证, Web Vitals, 上下文隔离, 依赖审计, 多智能体系统, 应用安全, 开源框架, 性能审计, 持续集成, 故事分解, 烟雾测试, 端到端交付流程, 网络安全研究, 自主代理, 自动化交付, 自动化回归, 自动化报告, 设计文档, 跨领域并行, 领域工程, 验收评审