zelinewang/dev-orchestrator

GitHub: zelinewang/dev-orchestrator

一款 Claude Code 元编排插件，通过 10 阶段流水线和强制验证机制，将 AI 编程助手转变为可自我约束的完整开发团队。

Stars: 0 | Forks: 0

# /dev — AI 开发编排器 **一条命令。任意任务类型。自我强制执行。** `/dev` 将您的 AI 编码代理转变为完整的开发团队 —— 用于代码、研究和基础设施任务。用自然语言描述您的需求 —— 编排器会进行分类、调查、规划、执行、验证和交付。您只需审查两次：计划和交付物。其他一切都将自动化并强制执行。 ``` You: /dev "add user authentication with JWT and refresh tokens" AI: ┌─ P1: INVESTIGATE ─────────────────────── │ Status: DONE | Sources: 5 (memory, code, specs, git, web) │ Next: P2 CLASSIFY └───────────────────────────────────────── ┌─ P2: CLASSIFY ───────────────────────── │ Status: DONE │ Task: DEVELOP | Tier: STANDARD │ Next: P3 BRAINSTORM └───────────────────────────────────────── [Brainstorm → Specs → Plan...] 🛑 CHECKPOINT 1: Review specs? [looks good] You: looks good AI: [Worktree → TDD task 1/12 → ... → 12/12 ✓] [47/47 tests passing. 0 regressions.] [PR #142 created] 🛑 CHECKPOINT 2: Review PR? You: approved AI: ✓ Specs archived. Memory saved. Done. ``` ## v2 新增功能 v2 源于一次自我审计，该审计揭示了在真实会话中仅有 **16% 的协议合规性**。协议设计良好但缺乏自我强制执行能力 —— AI 可以在不产生任何后果的情况下静默跳过阶段。 ### 关键变更 | 功能 | v1 | v2 | |---------|----|----| | **任务类型** | 仅代码 | DEVELOP + RESEARCH + CICD | | **强制执行** | 文本建议 | 强制阶段状态块 | | **阶段跳过** | 静默（无痕迹） | SKIP 需记录原因 | | **头脑风暴** | “阶段 1 前”（可跳过） | P3：强制执行 | | **阶段命名** | 混乱（阶段 1 前，阶段 0） | 清晰的 P0-P10 | | **计划模式** | 工作流冲突 | /dev 优先 | | **验证** | 仅代码测试 | +研究覆盖率 +CICD 密钥扫描 | | **覆盖标志** | 4 个 | 6 个 (+--research/--cicd) | ## 问题如今的 AI 编码是“氛围编码” —— 您聊天，AI 写代码，但是： - **需求分散** 在聊天记录中，并在上下文填满时消失 - **无验证纪律** —— AI 说“完成了”，但测试实际上并没有通过 - **回归盲区** —— 修复一件事会静默破坏另一件事 - **工具过载** —— 有 40 多种技能/工具可用，但您必须记住何时调用哪个 - **跨会话失忆** —— 开始新聊天，丢失之前所有的上下文 - **不支持非代码任务** —— 研究、CICD 和文档任务被强行塞入代码工作流 ## 解决方案 `/dev` 是一个元编排器，它将您现有的工具通过结构化强制执行链接成一个端到端的流水线。它不替换您的工具 —— 而是像指挥乐团一样指挥它们。 ``` Developer: /dev "description" │ ▼ ┌── P1: INVESTIGATE (5 min, read-only) ───────────────────────┐ │ Search memory → Read code → Check specs → Web research │ │ → Evidence-based classification + tier recommendation │ └────────────┬────────────────────┬───────────────────────────┘ │ │ ┌────────▼─────────┐ ┌─────▼─────────────────────────────┐ │ P2: CLASSIFY │ │ Task Types │ │ DEVELOP/RESEARCH │ │ ┌─ DEVELOP: Full TDD + PR │ │ /CICD + Tier │ │ ├─ RESEARCH: Investigate + report │ │ │ │ └─ CICD: Dry-run + rollback verify │ └────────┬─────────┘ └───────────────────────────────────┘ │ ┌────────▼────────────────────────────────┐ │ QUICK STANDARD / DEEP │ │ │ │ Root cause 1. Brainstorm (mandatory) │ │ → TDD fix 2. Specs / proposal │ │ → Verify 3. Plan → you review │ │ → Commit 4. Setup (worktree/clone) │ │ → Memory 5. Execute (TDD/research) │ │ 6. Double-verify │ │ 7. Ship → you review │ │ 8. Archive + memory │ └─────────────────────────────────────────┘ ``` ### 三种任务类型（自动分类） | 类型 | 何时 | 关键差异 | |------|------|----------------| | **DEVELOP** | 需要更改代码（功能、错误、重构） | 完整 TDD + worktree + PR | | **RESEARCH** | 调查、记录、分析、学习 | 无 TDD/worktree，保留 brainstorm/verify/wrapup | | **CICD** | 流水线、基础设施、部署、配置更改 | 无 TDD，增加 dry-run + rollback 验证 | ### 三个层级（自动检测） | 层级 | 何时 | 发生什么 | 时间 | |------|------|--------------|------| | **QUICK** | 错误修复、小改动 | 根本原因 → TDD 修复 → 验证 → 提交 | 5-15 分钟 | | **STANDARD** | 新功能、行为变更 | 完整 P0-P10 阶段，所有关卡 | 30-120 分钟 | | **DEEP** | 架构、多模块、根本原因不明 | 完整阶段 + Agent Teams + CI 等待 + /wrapup | 2-8 小时 | **检测基于调查而非关键字。** 编排器在决定之前会花 5 分钟阅读您的代码库。 ## 自我强制执行每个阶段输出一个强制状态块 —— 不允许静默跳过： ``` ┌─ P: ──────────────────────────────── │ Status: DONE | SKIP | ADAPT │ Task: | Tier: │ Key actions: │ Next: P └──────────────────────────────────────────────── ``` 这是 v2 的核心创新：阶段在结构上可见，不可静默跳过。 ## 7 条验证规则内置於每个阶段，因此您永远不需要提醒 AI： 1. **双重验证** — 每一个“完成”都有带计数的新证据支持 2. **审计驱动** — 测试失败？首先检查测试是否错误 3. **根本原因** — 不要修补症状。找到设计层面的问题 4. **回归偏执** — 每次更改后运行完整测试套件 5. **CICD 意识** — “完成” = 本地通过且 CI 通过 6. **闭环** — 每个循环自行闭环 7. **跨会话** — 开始前搜索记忆，结束后保存知识 ## 需求 ### 必需 - [Claude Code](https://claude.ai/claude-code) v1.0.33+ - [superpowers](https://github.com/obra/superpowers) 插件 — TDD、调试、规划、验证、git 工作流 ### 推荐 - [OpenSpec](https://github.com/Fission-AI/OpenSpec) v1.2.0+ — 规范驱动开发 (`npm install -g @fission-ai/openspec@latest`) - [feature-dev](https://github.com/anthropics/claude-code-plugins) 插件 — code-explorer、code-architect、code-reviewer 代理 - [claudemem](https://github.com/zelinewang/claudemem) — 跨会话持久化内存 - [commit-commands](https://github.com/anthropics/claude-code-plugins) 插件 — git commit/push/PR 工作流 ### 可选 - Agent Teams 实验性功能（用于 DEEP 层级竞争假设调试） ## 安装 ### 选项 A：插件安装（推荐） ``` # 从 GitHub（发布时） claude plugins install dev-orchestrator # 或者从本地目录 claude --plugin-dir /path/to/dev-orchestrator ``` ### 选项 B：手动安装 ``` # 复制 skill + scripts mkdir -p ~/.claude/skills/dev-orchestrator ~/.claude/scripts cp skills/dev-orchestrator/SKILL.md ~/.claude/skills/dev-orchestrator/ cp scripts/verify-dev.sh ~/.claude/scripts/ chmod +x ~/.claude/scripts/verify-dev.sh # 复制命令 cp commands/dev.md ~/.claude/commands/ # 可选：启用 Agent Teams # 添加到 ~/.claude/settings.json 的 "env" 下： # "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" ``` 重启 Claude Code 以加载新技能。 ### 选项 C：按项目安装 ``` cd your-project mkdir -p .claude/skills/dev-orchestrator .claude/scripts cp skills/dev-orchestrator/SKILL.md .claude/skills/dev-orchestrator/ cp scripts/verify-dev.sh .claude/scripts/ cp commands/dev.md .claude/commands/ ``` ## 用法 ### 任意开发任务 ``` /dev "add dark mode with system preference detection" ``` ### 研究任务 ``` /dev --research "investigate how our auth system handles token rotation" ``` ### CICD 任务 ``` /dev --cicd "add staging environment to GitHub Actions pipeline" ``` ### 覆盖层级 ``` /dev --quick "fix typo in error message" /dev --deep "redesign payment processing pipeline" ``` ### 跳过规范或 PR ``` /dev --no-spec "refactor auth module to reduce duplication" /dev --no-pr "fix CSS alignment on login page" ``` ## 工作原理 ### 分阶段（所有任务类型共享相同结构） | 阶段 | DEVELOP | RESEARCH | CICD | |-------|---------|----------|------| | **P0 预检查** | Git + OpenSpec + CLAUDE.md | 仅 Git 警告 | Git + CI 配置 | | **P1 调查** | 内存 + 代码 + 文档 | 内存 + 网络 + 仓库 | 内存 + 流水线 | | **P2 分类** | → DEVELOP | → RESEARCH | → CICD | | **P3 头脑风暴** | 意图 + 设计权衡 | 交付物范围 | 影响 + 回滚 | | **P4 规范** | OpenSpec 规范 | 研究提案 | 变更规范 | | **P5 计划** | TDD 任务（每个 2-5 分钟） | 问题 + 来源 | 步骤 + dry-run | | **P6 设置** | Git worktree + 基线 | 如需要克隆仓库 | 备份配置 | | **P7 执行** | 按任务 TDD + 子代理 | 调查 + 笔记 | 实施 + dry-run | | **P8 验证** | 测试套件 + verify-dev.sh | 覆盖率检查 | 基础设施 + 回滚测试 | | **P9 交付** | 代码审查 + PR | 提交报告 + 笔记 | 应用 + 监控 | | **P10 归档** | OpenSpec 归档 + 内存 | claudemem + /wrapup | 笔记 + 运维手册 | ### 验证脚本阻止不良交付的自动化关卡： ``` # 用于代码任务 bash ~/.claude/scripts/verify-dev.sh # 用于研究任务 bash ~/.claude/scripts/verify-dev.sh --research "search-term" /path/to/report.md # 用于 CICD 任务（检查泄露的 secrets） bash ~/.claude/scripts/verify-dev.sh --cicd ``` ## 自定义 ### 适配您的技术栈编排器读取您项目的 `openspec/config.yaml` 以获取上下文： ``` schema: spec-driven context: | Tech stack: Python, FastAPI, PostgreSQL Testing: pytest + httpx Style: async by default rules: specs: - Use Given/When/Then format tasks: - Each task < 5 minutes ``` ### 适配您的工作流该技能通过名称调用其他技能来工作。编辑 SKILL.md 以引用您偏好的工具。 ## 路线图 - [x] v0.1.0 — 具备 3 个层级 + 7 条规则的核心编排器 - [x] v2.0.0 — TDD 协议 + verify-dev.sh 强制执行 - [x] **v2.1.0 — 任务路由 (DEVELOP/RESEARCH/CICD) + 阶段状态块 + 自我强制执行** - [ ] v2.2.0 — 合规性检查清单（如果状态块被证明不足） - [ ] v3.0.0 — Cursor/Windsurf 跨工具支持 - [ ] v4.0.0 — 稳定 API，提交至 Anthropic 市场 ## 许可证 MIT

标签：AI编程助手, Claude插件, LLM Agent, TDD, 代码审查, 代码生成, 开发流程编排, 智能体团队, 测试驱动开发, 渗透测试工具, 研发效能, 网络安全研究, 自动化开发, 自然语言编程, 规范驱动开发, 软件开发生命周期, 项目脚手架