kaolegion/codebase-snapshot

GitHub: kaolegion/codebase-snapshot

将任意代码仓库转换为 AI 就绪的结构化快照，通过确定性规则分析项目架构、语义和依赖关系。

Stars: 0 | Forks: 0

# 代码库快照确定性的 Shell 优先工具，可将任何软件仓库转换为 **AI 就绪的结构化快照**。其目标是让人类和 AI 系统能够快速理解代码库，而无需浏览整个仓库。快照解释了： - 仓库中有什么 - 它是做什么用的 - 它的结构如何 - 执行从哪里开始 - 其主要模块和子系统是如何组织的 # 项目状态版本：**v0.4.0** 当前功能： - 确定性仓库扫描 - 仓库结构图 - 依赖提取 - 语义组件检测 - 仓库入口点检测 - 仓库用途推断 - 确定性仓库模块建模 - 确定性仓库子系统建模 - AI 就绪快照导出 - 确定性测试套件 # 快照产物每次快照都会生成一个描述仓库的结构化包。核心产物： PROJECT_TREE.txt INDEX.tsv DEPENDENCIES.tsv GRAPH.tsv SEMANTICS.tsv ENTRYPOINTS.tsv MODULES.tsv SUBSYSTEMS.tsv PURPOSE.md 人类可读产物： ARCHITECTURE.md DOCUMENTATION.md LANGUAGES.md COMPONENTS.md 上下文产物： MANIFEST.md AI_INGESTION_GUIDE.md 运行时产物： LOG.txt SNAPSHOT_META.json 结构化代码导出： CODEBASE/ # 仓库语义语义层使用确定性规则对仓库文件进行分类。每个文件接收四个语义信号： - component（组件） - group（分组） - role（角色） - rule（规则）组件代表高层级的仓库区域，例如： - cli - core - tests - docs - examples - tools - config - root - unknown 分组代表组件内部的功能子系统。角色描述文件的操作角色，例如入口点、引擎、指南、测试或工具。规则指示所使用的确定性检测信号。产物： SEMANTICS.tsv - 机器可读的语义映射 COMPONENTS.md - 人类可读的层级组件摘要 # 入口点检测入口点用于识别仓库中执行开始的位置。产物： ENTRYPOINTS.tsv 检测信号包括： - bin/* - cmd/* - main.* - app.* - server.* - Makefile - docker-compose.yml - 根目录 Shell 脚本 # 仓库结构建模结构建模层描述单个文件语义之上的仓库拓扑结构。产物： MODULES.tsv - 仓库到主要架构模块的确定性映射 SUBSYSTEMS.tsv - 这些模块内部稳定功能子系统的确定性映射该层帮助 AI 系统不仅理解仓库文件，还能理解引擎本身的架构组织。 # 仓库用途推断用途推断解释了 **仓库的用途是什么**。产物： PURPOSE.md 推断引擎检测： - 仓库分类 - 操作角色 - 执行配置文件 - 支持该解释的结构信号示例分类： - cli_tool - application - service - library - automation_toolkit - documentation_repository - configuration_repository - multi_purpose - unknown 该系统是确定性的且基于规则。 # CLI 使用基本用法： bin/snapshot --target --label 示例： bin/snapshot --target /opt/project --label initial_analysis 快照生成于： snapshots/YYYY-MM-DD/vX.Y.Z/_/ # 测试运行完整的确定性测试套件： tests/run_all.sh 测试验证： - 索引 - 依赖提取 - 图生成 - 语义 - 入口点 - 用途推断 - 结构建模 - CLI 行为 # 路线图当前里程碑：阶段 4.4 — 仓库结构建模当前增量：增量 2：SUBSYSTEMS 层下一个里程碑：阶段 4.5 — 结构渲染收敛参见： doc/ROADMAP.md

标签：AI SDK, AI上下文, Cutter, Homebrew安装, LLM工具, RAG预处理, Shell脚本, 云安全监控, 仓库分析, 代码库快照, 代码挖掘, 代码理解, 依赖提取, 入口点检测, 威胁情报, 开发者工具, 技术债管理, 知识提取, 确定性分析, 结构化数据, 自动化文档, 软件架构, 防御加固, 静态分析