cablate/claude-code-research

GitHub: cablate/claude-code-research

基于泄露源码和逆向工程的 Claude Code 内部机制研究报告,涵盖架构设计、安全机制、成本优化等 10 个领域的 75 份分析文档。

Stars: 98 | Forks: 39

# Claude Code 研究 [![欢迎贡献](https://img.shields.io/badge/contributions-welcome-brightgreen.svg)](./CONTRIBUTING.md) 关于 Claude Code 内部机制的独立研究。 ## 本仓库包含的内容 | 目录 | 内容 | 来源 | 数量 | |-----------|------|--------|-------| | [`source-code-analysis/`](./source-code-analysis/) | 完整架构逆向工程 | 泄露的 TypeScript 源码 (v2.1.88) | **75 份报告** | | [`reports/`](./reports/) | 面向问题的调查(缓存、成本、注入) | 混淆后的 npm 包 (`cli.js`) | **8 份报告** | ## 源码分析 (`source-code-analysis/`) 2026-03-31,Claude Code 的完整源码通过 npm registry 中的 sourcemap 文件被暴露([由 Chaofan Shou 发现](https://x.com/shoucccc),由 [Kuberwastaken](https://github.com/Kuberwastaken/claude-code) 和 [sanbuphy](https://github.com/sanbuphy/claude-code-source-code) 归档)。 我们进行了一项涵盖 10 个领域、75 份报告的分析——这是目前对生产级 AI 编程代理工作原理最详尽的公开解析。 **[浏览所有报告 →](./source-code-analysis/)** 交互式查看器——在浏览器中打开 `source-code-analysis/index.html`(内嵌了全部 75 份报告,无需服务器)。 ### 主要发现 | 领域 | 报告 | 亮点 | |--------|---------|------------| | [Harness 工程](./source-code-analysis/phase-09-harness-engineering/) ⭐ | 7 | Agent Loop 逆向工程,12 项可迁移的 harness 设计原则 | | [System Prompt](./source-code-analysis/phase-01-system-prompt/) ⭐ | 6 | 包含动态组装逻辑的完整 13 节 prompt,17 个 prompt 工程模式 | | [成本与配额](./source-code-analysis/phase-10-cost-quota/) ⭐ | 8 | 成本上限,prompt 缓存失效检测(12 种原因),Haiku→Opus 37.5 倍成本差距 | | [Tool 定义](./source-code-analysis/phase-02-tool-definitions/) | 8 | 全部 36 个 tool prompt,读/写并发分离,内部与公开 prompt 变体对比 | | [Agent 架构](./source-code-analysis/phase-03-agent-architecture/) | 7 | 6 个内置 agent,Coordinator 模式,Swarm 多 agent,50 条消息上限(源于 36.8GB 事故) | | [安全机制](./source-code-analysis/phase-06-security-permissions/) | 8 | 7 层深度防御,23 个 Bash 验证器,Parser Differential 威胁模型 | | [Skills 系统](./source-code-analysis/phase-04-skills-system/) | 5 | 16 个内置 skill,12 种设计模式 + 5 种反模式 | | [记忆与上下文](./source-code-analysis/phase-05-memory-context/) | 9 | 6 个记忆子系统,AutoDream 整合,Team Memory 双层安全机制 | | [API 与模型](./source-code-analysis/phase-07-api-model-architecture/) | 7 | 17 个 beta header,4 个提供商,模型选择 5 层优先级 | | [隐藏功能](./source-code-analysis/phase-08-special-features/) | 10 | 82 个 feature flag,KAIROS 主动模式,Buddy AI 宠物,UltraPlan,防蒸馏 | ## 行为报告 (`reports/`) 基于对 npm 中混淆后的 `cli.js` 逆向工程所进行的面向问题的调查。每份报告均包含中英文版本。 | # | 主题 | 内容摘要 | |---|-------|-------| | 1 | [Agent SDK 缓存失效](./reports/agent-sdk-cache-invalidation/) | SDK `query()` 的成本是 CLI 的 3–10 倍——每次调用独立进程会破坏 prompt cache | | 2 | [System-Reminder 注入](./reports/system-reminder-injection/) | 15+ 种隐藏的注入类型,4 个根本原因缺陷 | | 3 | [Prompt Cache 架构](./reports/prompt-cache-architecture/) | 静态/动态区域划分,滑动窗口,字节前缀匹配 | | 4 | [Tool 序列化与缓存稳定性](./reports/tool-serialization-cache-stability/) | Tool 缺少 `.sort()`,延迟加载导致对话中途缓存失效 | | 5 | [上下文生命周期管理](./reports/context-lifecycle-management/) | 5 个阈值常量,10 步压缩流程,连锁反应 | | 6 | [生产环境缓存优化](./reports/production-cache-optimization/) | 3 个具体的 cli.js 补丁 + 监控策略 | | 7 | [缓存失效验证](./reports/cache-invalidation-verification/) | `defer_loading` 将延迟加载的 tool 完全排除在缓存前缀之外 | | 8 | [Auto 模式分类器成本](./reports/auto-mode-classifier-cost/) | 每次执行有副作用的 tool 前都会进行一次隐藏的 Opus 级别调用 | ## 资源 - [CLI 逆向工程指南](./research/cli-reverse-engineering-guide.md) — 混淆 cli.js 的搜索模式与函数定位器 - [分析计划](./source-code-analysis/ANALYSIS-PLAN.md) — 10 阶段源码分析的方法论 ## 源码归档 本分析基于 Claude Code v2.1.88 的完整 TypeScript 源码。本仓库不包含源码本身。 - [chatgptprojects/claude-code](https://github.com/chatgptprojects/claude-code) — 完整源码 - [Kuberwastaken/claude-code](https://github.com/Kuberwastaken/claude-code) — 源码解析与分析 - [sanbuphy/claude-code-source-code](https://github.com/sanbuphy/claude-code-source-code) — 源码归档 ## 版本基线 | 范围 | 版本 | |-------|---------| | 源码分析 | v2.1.88 (sourcemap 泄露,2026-03-31) | | 行为报告 #1–2 | v2.1.71 | | 行为报告 #3–6 | Agent SDK v0.2.76 (构建于 2026-03-14) | | 行为报告 #7–8 | v2.1.85 / v2.1.88 | ## 引用方式 ``` CabLate, "Claude Code Research," GitHub, 2026. https://github.com/cablate/claude-code-research ``` ## 免责声明 这是一项独立研究,**未受 Anthropic 赞助或背书**。行为报告分析的对象是公开发布的 npm 包。源码分析基于通过 npm registry sourcemaps 暴露的代码。
标签:Agent SDK, AI代理, AI安全, AI编程助手, Anthropic, Chat Copilot, CIS基准, Claude, Claude Code, CVE检测, DLL 劫持, npm, TypeScript, 云资产清单, 人工智能, 后端开发, 多模态安全, 大语言模型, 安全插件, 工具链, 成本控制, 技术分析, 提示词工程, 暗色界面, 源码分析, 源码泄露, 用户模式Hook绕过, 策略决策点, 系统架构, 软件架构, 逆向工程, 防御加固