squid-protocol/gitgalaxy
GitHub: squid-protocol/gitgalaxy
一个零信任的代码基因组分析平台,将代码库解析为 3D 星系以支持安全研究、可视化与威胁狩猎。
Stars: 8 | Forks: 0
# GitGalaxy
[](https://badge.fury.io/py/gitgalaxy)
[](https://www.python.org/downloads/)
[](https://polyformproject.org/licenses/noncommercial/1.0.0/)
[](#)
[](#)
[](#)
[](#)
[](#)
[](https://pypi.org/project/gitgalaxy/)
[](#)

代码即艺术。逻辑即艺术。系统工程即艺术。
GitGalaxy 是一个由通用 JSON 契约连接的两部分生态系统。它旨在提取大规模软件仓库的结构性 DNA,并将其非可视化架构渲染为可测量的、可探索的 3D 星系。
**1. blAST 引擎 - Galaxyscope(后端):** 一个超大规模、与语言无关的静态分析 CLI。基于 50 年的生物信息学和基因序列算法,它以约 100,000 行代码/秒的速度解析代码。它输出丰富的 JSON 遥测数据、SQLite 数据库以及为 AI 代理工作流优化的低标记量 Markdown 简报。
**2. Observatory(前端):** 将你的 galaxy.json 拖放到 [GitGalaxy.io](https://gitgalaxy.io/) 的免费查看器中,或使用本仓库的 airgap_observatory,这是一个独立的、零遥测的 WebGPU 视觉化工具。两者都读取 JSON 契约,并将整个代码库渲染为一个程序化的 3D 星系,其中文件是恒星,允许人类即时直观地映射规模和风险暴露。
**实时演示:** 在 [GitGalaxy.io](https://gitgalaxy.io/) 查看 Apollo-11、Linux、TensorFlow 等 3D 星系示例


## 快速开始
### 1. 安装
```
pip install gitgalaxy
```
### 2. 扫描仓库
将 GalaxyScope 指向任何本地仓库或 ZIP 归档文件。该引擎完全在本地运行——零数据传输。
```
galaxyscope /path/to/your/local/repo
```
### 3. 查看星系
GitGalaxy 提供两种方式来可视化你的 3D 架构,均基于严格的零信任隐私模型,你的代码永远不会离开你的机器。
**选项 A:Web 查看器(无摩擦)**
只需将生成的 "your_repo_galaxy.json" 文件(或原始仓库的 .zip)直接拖放到 GitGalaxy.io。所有渲染和扫描完全在浏览器的本地内存中完成。
**选项 B:本地服务器(企业级与离线)**
对于在严格合规规则下运行或位于企业防火墙后的团队,GitGalaxy 包含一个 100% 静态、零遥测的本地查看器,称为 Airgap Observatory。
没有后端,没有数据库,也没有外部 API 调用。这是一个完全封闭的系统,基于静态 HTML 和 JavaScript 构建,你只需要启动一个本地服务器即可查看。
进入可视化文件夹并启动 Python 内置的静态 Web 服务器:
```
git clone https://github.com/squid-protocol/gitgalaxy.git
cd gitgalaxy/airgap_observatory
python3 -m http.server 8000
```
打开你的浏览器并访问 http://localhost:8000。
将新生成的 _galaxy.json 文件拖放以即时渲染你的架构。

## 🧬 blAST 范式:测序软件的 DNA
传统计算机科学将软件视为刚性蓝图,使用缓慢的、特定语言的抽象语法树(AST)来分析代码。GitGalaxy 将代码视为待扫描的序列,然后使用 **blAST(Broad Lexical Abstract Syntax Tracker)** 引擎分析其模式和出现情况。
通过将生物序列比对原理应用于软件,blAST 在约 40 种语言和约 250 种文件扩展名中搜寻通用的结构标记。我们将这些遗传代码翻译为“表型”——可测量的风险暴露。
### 超大规模测序
通过放弃编译器瓶颈,blAST 实现了传统 AST 无法理解的处理速度。在对最大开源生态系统的实时遥测跟踪中,blAST 展示了其绝对的规模:
* **峰值速度:** 在 **0.28 秒** 内测序了原始的 **Apollo-11** 引导计算机汇编代码(**513,298 LOC/s** 的对齐速率)。
* **大型单体:** 仅用 **11.11 秒** 就处理完 **320 万行 OpenCV**(288,594 LOC/s)。
* **行星规模:** 在编译所需时间的一小部分内,轻松绘制了 **TensorFlow(780 万 LOC)**、**Kubernetes(550 万 LOC)** 和 **FreeBSD(2440 万 LOC)** 等行星级仓库的架构 DNA。
## 零信任架构
你的代码永远不会离开你的机器。GitGalaxy 在本地执行 100% 的扫描和向量化。
* **零数据传输:** 源代码永远不会传输到任何 API、云数据库或第三方服务。
* **临时内存处理:** 仓库被解压到易失性内存缓冲区(RAM)中,并在浏览器标签页关闭时自动清除。
* **设计即隐私:** 即使在使用基于 Web 的查看器时,数据也始终保留在用户的防火墙之后。
### 病毒式安全透镜:行为威胁狩猎
传统安全扫描器依赖僵化、过时的病毒特征码。blAST 的行为类似于免疫系统,搜寻威胁的 *行为遗传标记*。通过分析 I/O 命中、执行触发和安全绕过行为的结构密度,blAST 完美设计用于阻止现代攻击向量:
* **供应链投毒:** 立即标记看似无害但具有异常高网络 I/O 和动态执行(`eval`/`exec`)密度的设置脚本。
* **逻辑炸弹与破坏:** 识别设计用于破坏基础设施的代码,通过捕捉灾难性操作系统命令和原始硬件中断的密集集中。
* **隐写术与混淆恶意软件:** 数学上暴露规避技术,标记 Unicode 走私(同形异义导入)和亚原子自定义 XOR 解密循环。
* **凭证出血:** 作为无情的密钥扫描器,隔离隐藏在大型仓库深处的硬编码加密资产(`.pem`、`.pfx`、`.jks` 文件)。
## 许可与版权
版权所有 (c) 2026 Joe Esquibel
GitGalaxy 在 PolyForm Noncommercial License 1.0.0 下发布。它完全免费用于个人使用、研究、实验、测试和业余项目。教育或慈善组织的使用也获允许。
任何商业使用或集成到商业 SaaS 产品或企业 CI/CD 管道中需要单独的商业许可。请通过 gitgalaxy.io 联系以讨论商业集成。
标签:10万行/秒, 3D可视化, AI工作流, API安全, AST解析, Homebrew安装, JSONLines, JSON输出, Markdown, Python, SEO: 代码可视化, SEO: 代码审计工具, SEO: 多语言代码分析, SEO: 零依赖分析工具, SEO: 静态分析, SQLite, SQL查询, WebGPU, 云安全监控, 代码DNA, 代码分析, 代码可视化, 代码库结构, 凭证管理, 前端可视化, 可测量架构, 多语言支持, 安全测试框架, 无依赖, 无后门, 星系可视化, 架构分析, 生物信息学算法, 空气隔绝就绪, 自定义脚本, 语言无关, 超大规模分析, 逆向工具, 遗传算法, 零信任, 静态分析