arthurzhuhan/az-delivery-team
GitHub: arthurzhuhan/az-delivery-team
一个基于 Claude Code 的自主多智能体交付系统,将设计文档自动转化为带对抗验证的端到端发布流程并输出 GO/NO-GO 报告。
Stars: 1 | Forks: 0
# 交付团队

一个用于 Claude Code 的自主多智能体交付系统。扔一份设计文档进去,去睡觉,醒来后看到 GO/NO-GO 报告。
## 工作原理
```
设计文档 ──> delivery.sh
|
Phase 0: 交接检查
PO + 架构师审查设计文档
PO 将设计拆解为 Story 列表
你审核 Story(或 --auto-approve-stories 跳过)
|
Phase 1: 实施(逐 Story 循环)
每个 Story 一次 claude 调用(干净上下文)
TDD:先写测试,再实现
跨域并行,域内串行
|
Phase 2: 验证(7 个 Agent 并行)
冒烟测试 | API 测试 | 安全审计
红队对抗 | UI/UX QA | 性能审计 | 上线就绪
|
Phase 3: 终审
综合 7 份报告,仲裁冲突
GO ──> 完成!
NO-GO ──> findings 变成 FIX Story ──> 回到 Phase 1
```
## 团队结构(3 层,10+N 角色)
### 第一层:定义(做什么)
| 智能体 | 角色 |
|-------|------|
| product-owner | 守护核心目标,拆解设计为 Stories,记录所有变更 |
| project-architect | 系统设计、领域边界、跨领域协调 |
### 第二层:实施(怎么做)
| 智能体 | 角色 |
|-------|------|
| {domain}-engineer x N | 每个业务领域的全栈工程师(TDD 工作流) |
### 第三层:验证(对抗式交叉验证)
| 智能体 | 角色 |
|-------|------|
| smoke-tester | 核心流程测试 + 截图证据 |
| api-tester | API 契约 / 边界 / 错误码测试 |
| security-auditor | OWASP Top 10 + 密钥扫描 + 依赖审计 |
| red-team | 攻击 + 质疑任何智能体的 PASS |
| uiux-qa | 布局 + 信息架构 + UX 审查 |
| performance-auditor | 核心 Web 指标 + 包体积 + API 延迟 |
| launch-readiness | SEO + 可访问性 + 合规 + HTTPS |
| acceptance-reviewer | 综合 7 份报告,仲裁冲突并做出最终 GO/NO-GO 决策 |
## 快速开始
### 1. 安装技能
```
# 复制到你的 Claude Code 技能目录
cp -r . ~/.claude/skills/az-delivery-team/
```
### 2. 初始化项目
在 Claude Code 中运行:
```
/az-delivery-team
```
回答提示问题(项目信息、领域拆分)。该技能会在项目的 `.claude/agents/` 目录中创建智能体文件。
### 3. 运行交付循环
```
# 交互模式(在实施前回顾故事)
./delivery.sh
# 全自动化模式
./delivery.sh --auto-approve-stories
# 自定义最大轮数
./delivery.sh --max-rounds 3
```
## 关键概念
### 每个 Story 独立上下文
每个 Story 均由一个全新的 `claude` 调用执行,不携带上下文。记忆仅通过文件持久化:
- `delivery.json` — 任务状态(哪些 Stories 通过/失败)
- `progress.txt` — 累积的代码库知识(模式、注意事项)
- `.claude/reports/` — 验证报告与问题跟踪
- Git 历史 — 代码变更
### 对抗式验证
七个验证智能体独立工作,其结论**可能互相矛盾**。红队智能体有权质疑其他智能体的 PASS。验收评审智能体负责仲裁并做出最终决策。
### 自愈循环
NO-GO 结果会自动转化为新的 FIX Story。循环将持续进行,直到获得 GO 或达到最大轮次。失败 3 次以上的 Story 会被标记为 `blocked` 并需要人工干预。
### Story 评审检查点
在 Phase 0 之后,脚本会暂停,让你审阅 Story 列表后再开始实施。如需修改,可编辑 `delivery.json`,然后按回车。也可使用 `--auto-approve-stories` 跳过。
## 状态文件:delivery.json
```
{
"project": "MyProject",
"designDocs": ["docs/design.md"],
"maxRounds": 5,
"currentPhase": "phase0",
"round": 1,
"stories": [
{
"id": "US-001",
"domain": "orders",
"title": "Add order creation endpoint",
"passes": false,
"source": "prd",
"failCount": 0,
"blocked": false
}
],
"verification": {
"reports": { "smoke-tester": null, ... },
"verdict": null
}
}
```
## 安全特性
| 功能 | 说明 |
|------|------|
| 断点恢复 | `currentPhase` 保存在 JSON 中;重启后从上次位置继续 |
| 停滞检测 | 连续 3 批无进展 → 强制进入验证阶段 |
| 未收敛 | `failCount >= 3` → 标记 Story 为 `blocked` 并跳过 |
| Git 回滚 | 每轮开始前打标签 `delivery-round-N-start`;全部失败时回滚代码(保留状态文件) |
| 评审门控 | Phase 0 后暂停供人工审查(可用 `--auto-approve-stories` 跳过) |
| 报告验证 | 仅当验证报告实际产生后,才进入 Phase 2 → Phase 3 |
## 项目结构
```
az-delivery-team/
├── SKILL.md # Skill definition (Claude Code reads this)
├── delivery.sh # The autonomous loop orchestrator
├── delivery.json.example # State file template
├── README.md # You are here
└── templates/ # Agent prompt templates
├── product-owner.md
├── project-architect.md
├── domain-engineer.md # Instantiated N times (one per domain)
├── smoke-tester.md
├── api-tester.md
├── security-auditor.md
├── red-team.md
├── uiux-qa.md
├── performance-auditor.md
├── launch-readiness.md
└── acceptance-reviewer.md
```
## 要求
- [Claude Code](https://docs.anthropic.com/en/docs/claude-code)(`npm install -g @anthropic-ai/claude-code`)
- `jq`(macOS 上使用 `brew install jq`)
- 用于项目的 Git 仓库
## 许可证
MIT
标签:AI工程化, API测试, Claude Code, GO/NO-GO决策, Homebrew安装, LNA, PyRIT, TDD测试驱动开发, UI/UX质量保证, Web Vitals, 上下文隔离, 依赖审计, 多智能体系统, 应用安全, 开源框架, 性能审计, 持续集成, 故事分解, 烟雾测试, 端到端交付流程, 网络安全研究, 自主代理, 自动化交付, 自动化回归, 自动化报告, 设计文档, 跨领域并行, 领域工程, 验收评审