BrianCLong/summit
GitHub: BrianCLong/summit
Summit 是一个基于知识图谱和多代理 AI 的开源 OSINT 平台,能将多源非结构化数据快速转化为可溯源的情报分析报告。
Stars: 5 | Forks: 0
# Summit - 自主智能系统
Summit 能在几分钟内将原始数据转化为可解释的情报。
它将情报分析、确定性图数据库以及基于 LLM 的上下文组装统一到一个单一的操作循环中。
<<<<<<< HEAD
## 核心循环
1. **摄取**:将原始 CSV 和非结构化文本转换为结构化的情报图谱节点。
2. **调查**:搜索目标,查看连接,并在不同身份之间进行跳转。
3. **GraphRAG**:直接从图谱中为 AI 代理提供精确、确定性的数据上下文。
4. **报告**:自动生成人类可读、可解释的情报报告。
# <<<<<<< HEAD
[](GA_CERTIFICATION_REPORT.md)
[](https://github.com/BrianCLong/summit/actions)
[](https://codecov.io/gh/BrianCLong/summit)
[](LICENSE)
## 🏆 GA MCP 试点状态
Summit 已成功通过**正式发布 (GA) 认证合同**。
- **发布版本**:`v1.5.0-ga-pilot`
- **完整性**:100% 可由机器验证
- **安全性**:零 P0/P1 问题,无敏感信息硬编码
- **合规性**:已发布 Evidence Bundle v1.5
运行权威的 GA 认证审计:
```
npm run ga:certify
```
## ✨ 功能特性
- **🤖 代理式 AI**:用于自主研究的多代理编排
- **🕸 知识图谱**:Neo4j + GraphRAG 实现互联情报
- **📡 实时摄取**:支持 CSV、S3、REST API 的流式连接器
- **🔍 向量搜索**:基于 embeddings 的语义检索
- **📈 CompanyOS SDK**:企业情报 API
- **🔒 安全加固**:生产级 CORS、Helmet 及可观测性
## ⚡ 观看实际演示(90 秒惊艳 Demo)
观看我如何在 47 秒内从零开始生成关于任何公司的完整 OSINT 报告——完全在本地运行,并保证来源可追溯。

### 在本地运行 Demo
```
pnpm demo:company
# Or directly: ./scripts/wow.sh
```
这条单条命令将:
1. 通过 Switchboard 自动摄取 MIT Sloan Startups 2026 数据集
2. 触发语义分块和 GraphRAG 多跳遍历
3. 部署 Maestro 集群(Jules + Codex + Observer)
4. 输出包含置信度分数和来源链接的完整溯源报告
## 🚀 快速入门
### 前置条件
- Node.js 18+
- Docker & Docker Compose
- Neo4j 5.x (通过 Docker)
### 安装与运行
=======
## 本地运行
在本地启动 Summit:
```
docker-compose up -d
<<<<<<< HEAD
# Run migrations
pnpm db:migrate
# Start dev server
pnpm dev
```
服务器运行在 `http://localhost:4000`
### 🌟 黄金路径(推荐)
用于确定且干净地启动本地开发环境:
```
# Automates: make clean -> make bootstrap -> make up
./scripts/golden-path.sh
```
或手动执行:
```
make clean # Clean build artifacts and docker system
make bootstrap # Install Python venv and Node dependencies
make up # Start all services via Docker Compose
```
有关常见问题(例如 Docker 速率限制),请参阅[黄金路径故障排除](docs/dev/golden-path-troubleshooting.md)。
### 首次查询
```
# GraphQL playground
curl -X POST http://localhost:4000/api/graphql \
-H "Content-Type: application/json" \
-d '{"query": "{ health { status version } }"}'
# Or use the web UI
open http://localhost:3000
```
## ⚖️ 治理与合规
Summit 专为高风险、受监管的环境而设计,在这些环境中,安全性、问责制和可解释性是不可妥协的。
- **[治理框架](GOVERNANCE.md):** 用于安全优先自主性和持续合规的端到端可执行架构。
- **[证据与审计](docs/governance/EVIDENCE.md):** 我们如何通过加密签名、溯源账本和自动化控制映射(SOC 2、NIST AI RMF)来证明合规性。
- **[Summit 宪章](docs/governance/CONSTITUTION.md):** 定义代理行动的绝对约束、人类主导地位以及平台目的的规范准则。
## 🏛 架构
Summit 遵循模块化微服务架构:
```
┌──────────────────────────────────┐
│ 👥 User Agents (Jules, Codex) │
└──────────┬───────────────────────┘
│
v
┌──────────┬────────────────────────┐
│ API Layer │ GraphQL + REST APIs │
└──────────┬────────────────────────┘
│
┌───────┼────────┐
│ │ │
v v v
┌────────┐ ┌────────┐ ┌────────┐
│ Ingest │ │GraphRAG│ │ Agents │
│ Engine │ │Pipeline│ │ Orchest│
└────┬───┘ └───┬────┘ └───┬────┘
│ │ │
v v v
┌─────────────────────────────────┐
│ 📊 Data Layer │
│ Neo4j | Postgres | Redis | Qdrant│
└─────────────────────────────────┘
```
## 🧩 核心组件
- **IntelGraph**:用于实体、关系、证据和溯源的中心图数据模型,以支持链接分析和多跳查询。
- **Maestro Conductor**:由 IntelGraph 状态驱动,用于作业 DAG、重试、策略执行、可观测性和 SLO 跟踪的工作流编排。
- **CompanyOS**:与图数据和编排工作流集成的知识、运行手册和业务逻辑 API。
- **Switchboard**:将事件进行摄取、规范化、去重、丰富和路由,传入平台的核心服务。
- **溯源账本**:用于整个平台可解释输出、血缘关系以及合规就绪报告的证据优先审计跟踪。
- **操作记忆系统**:持久化的操作情报,能够记忆、学习并复用执行经验(见下方的[Memory as the Moat](#-operational-memory-system-memory-as-the-moat))。
**深度剖析文档:**
- [📈 高管简报 (2026-01-31)](docs/executive/2026-01-31-summit-platform-briefing.md)
- [🏛 架构概览](docs/architecture/README.md)
- [🔌 数据摄取](docs/architecture/ingestion.md)
- [🤖 代理系统](docs/architecture/agents.md)
- [🕸 知识图谱](docs/architecture/knowledge-graph.md)
- [🔒 安全](docs/security/README.md)
- [💾 操作记忆系统](server/src/lib/README_MEMORY_MOAT.md)
## 💾 操作记忆系统 (Memory as the Moat)
Summit 实现了一个**持久化操作记忆基础设施**,将平台从无状态的执行引擎转变为一个随着时间推移不断积累智能的学习系统。
### 核心原则
```
decision = retrieval + adaptation (not pure generation)
```
该平台不是在每次执行时都从头开始生成决策,而是:
1. **检索**:从可验证转换账本 (VTL) 中检索相似的过往执行记录
2. **适应**:基于历史经验调整执行策略
3. **记录**:记录结果以扩展记忆壁垒
### 关键能力
- **可验证转换账本 (VTL)**:具有 Merkle 化验证的不可变执行历史存储
- **基于经验的执行**:随时间不断改进的检索 + 适应模式
- **CI 流水线学习**:将 CI/CD 从执行系统转变为优化测试优先级的学习系统
- **知识外化**:将运行手册、事后总结和隐性知识转换为机器可执行的记忆
- **壁垒指标**:跟踪累积的智能(总经验、成功轨迹、壁垒强度)
### 战略价值
**传统系统**以无状态方式生成决策,随时间推移没有改进。
**有记忆支持的系统**复用经过验证的策略并不断积累智能,从而建立起具有防御性的竞争优势。
**参见**:[Memory as the Moat - 实现指南](server/src/lib/README_MEMORY_MOAT.md)
## 📚 关键组件
### 连接器
从多个来源摄取数据:
- **REST API**:轮询外部服务
- **CSV/S3**:批量文件处理
- **Neo4j/Postgres**:数据库复制
- **Webhooks**:实时事件流
参见:[连接器文档](docs/connectors/README.md)
### GraphRAG
结合知识图谱的检索增强生成:
- 实体提取与链接
- 多跳图遍历
- 向量相似度搜索
- 基于 LLM 的综合分析
参见:[GraphRAG 指南](docs/graphrag/README.md)
### 代理
用于研究和分析的自主 AI 代理:
- **Jules**:PR 审查员,代码分析器
- **Codex**:任务简报生成器
- **Observer**:遥测与监控
参见:[代理开发](docs/agents/README.md)
## 📡 API 参考
- [GraphQL Schema](docs/api/graphql.md)
- [REST 端点](docs/api/rest.md)
- [CompanyOS SDK](docs/api/companyos.md)
### MVP GA 试点确定性检查
用于 PR2 试点就绪检查(server + apps/web),请使用:
```
pnpm gate:pilot
```
此命令等同于 CI 的试点关卡,将运行确定性的安装、构建、类型检查、代码检查以及试点关键测试。
## 🧪 测试
```
# Run all tests
pnpm test
# E2E tests
pnpm test:e2e
# Coverage report
pnpm test:coverage
```
## 🛡 安全
Summit 遵循安全最佳实践:
- Helmet.js 用于 HTTP 安全头
- 带有显式来源白名单的 CORS
- 速率限制和请求验证
- SQL 注入防御
- 依赖项扫描 (Dependabot)
参见:[安全策略](SECURITY.md)
## 🚀 部署
```
# Build for production
=======
pnpm install
>>>>>>> pr-21923
pnpm build
pnpm start
```
## Demo 流程
<<<<<<< HEAD
## MVP GA 试点控制平面
使用受试点治理的文档作为事实来源:
- 切割线:`docs/ga/mvp-ga-pilot-cutline.md`
- 补救计划:`docs/ga/mvp-ga-pilot-remediation-plan.md`
- 证据包:`docs/ga/mvp-ga-pilot-evidence-pack.md`
- 入门指南:`docs/GETTING_STARTED.md`
- 部署:`docs/DEPLOY.md`
- 故障排除:`docs/TROUBLESHOOTING.md`
## 🤝 贡献
=======
查看 [Demo 脚本](docs/demo.md) 以演练试点演示。
## 许可证
私有软件
标签:Agentic AI, BSD, C2, CompanyOS SDK, CSV处理, DLL 劫持, DNS枚举, ESC4, GitHub, GraphRAG, LLM, MITM代理, Neo4j, OSINT, REST API, S3连接器, Unmanaged PE, 代码示例, 关联分析, 向量化检索, 向量搜索, 图数据可视化, 多智能体编排, 大语言模型, 实时处理, 实时数据摄取, 实时数据流, 情报分析, 情报收集, 搜索引擎查询, 数据分析, 数据挖掘, 无线安全, 智能体AI, 测试用例, 漏洞研究, 网络安全, 网络安全工具, 网络诊断, 自主智能系统, 自动化报告, 自动化调查, 自定义脚本, 解释性人工智能, 语义搜索, 请求拦截, 身份追踪, 隐私保护, 非结构化数据