cognis-digital/seedforge

GitHub: cognis-digital/seedforge

一款具备引用完整性验证的确定性合成测试数据生成器,支持 CI 集成与 MCP 原生协议。

Stars: 0 | Forks: 0

SEEDFORGE # SEEDFORGE ### 具备引用完整性的合成测试数据生成器 [![PyPI](https://img.shields.io/pypi/v/cognis-seedforge.svg?color=6b46c1)](https://pypi.org/project/cognis-seedforge/) [![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/5fe5d79fba060213.svg)](https://github.com/cognis-digital/seedforge/actions) [![License: COCL 1.0](https://img.shields.io/badge/License-COCL%201.0-2b6cb0.svg)](LICENSE) [![Suite](https://img.shields.io/badge/Cognis-Neural%20Suite-6b46c1.svg)](https://github.com/cognis-digital) *数据与数据集 — 零配置的质量、血缘与治理。*
``` pip install cognis-seedforge seedforge scan . # → prioritized findings in seconds ``` ## 目录 - [为什么选择 seedforge?](#why) · [功能](#features) · [快速开始](#quick-start) · [示例](#example) · [架构](#architecture) · [AI 技术栈](#ai-stack) · [对比](#how-it-compares) · [集成](#integrations) · [随处安装](#install-anywhere) · [相关项目](#related) · [贡献](#contributing) ## 用法 — 分步指南 `seedforge` 根据 schema JSON 生成确定性的合成数据,并带有可选的引用完整性验证。当外键(FK)无法解析时,`verify` 会以退出码 `1` 退出。 1. **安装** pip install seedforge 2. **根据 schema 生成数据**(根据 `--seed` 确定,默认为 0): seedforge gen schema.json 3. **输出 JSON 并固定 seed** 以生成可复现的 fixture: seedforge --format json gen schema.json --seed 42 > fixtures.json 4. **验证引用完整性** — 生成数据,然后断言每个外键(FK)都能被解析: seedforge verify schema.json 5. **在 CI 中使用** — `verify` 在遇到断开的引用时会返回非零退出码,因此错误的 schema 会导致构建失败: seedforge --format json verify schema.json | jq '.broken_refs' seedforge verify schema.json || exit 1 ## 为什么选择 seedforge? 开发 + 数据跨界,病毒式传播 `seedforge` 是单一用途、可脚本化且可自托管的:将其指向目标,以您的工作流已使用的格式(表格 · JSON · SARIF)获取优先级排序的结果,以此控制 CI 流水线,并让 AI Agent 通过 MCP 驱动它。
↑ 回到顶部
## 功能 - ✅ 生成数据 - ✅ 验证完整性 - ✅ 运行于 Linux/macOS/Windows · Docker · devcontainer - ✅ 支持 Python、JavaScript、Go 和 Rust 版本 (`ports/`)
↑ 回到顶部
## 快速开始 ``` pip install cognis-seedforge seedforge --version seedforge scan . # scan current project seedforge scan . --format json # machine-readable seedforge scan . --fail-on high # CI gate (non-zero exit) ```
↑ 回到顶部
## 示例 ``` $ seedforge scan . [HIGH ] SEE-001 example finding (./src/app.py) [MEDIUM ] SEE-002 another signal (./config.yaml) 2 findings · risk score 5 · 38ms ```
↑ 回到顶部
## 架构 ``` flowchart LR IN[input] --> P[seedforge
analyze + score] P --> OUT[report] ```
↑ 回到顶部
## 从任何 AI 技术栈中使用 `seedforge` 可与所有流行的 AI 使用方式互操作: - **MCP server** — `seedforge mcp` (Claude Desktop, Cursor, Cognis.Studio, [uncensored-fleet](https://github.com/cognis-digital/uncensored-fleet)) - **兼容 OpenAI / JSON** — 将 `seedforge scan . --format json` 通过管道传递给任何 Agent 或 LLM - **LangChain · CrewAI · AutoGen · LlamaIndex** — 一行代码即可将 CLI/JSON 封装为工具 - **CI / 脚本** — 为非 AI 流水线提供退出码 + SARIF
↑ 回到顶部
## 对比 | | **Cognis seedforge** | Faker | |---|:---:|:---:| | 可自托管,无需账号 | ✅ | 视情况而定 | | 单一命令,零配置 | ✅ | ⚠️ | | 用于 CI 的 JSON + SARIF | ✅ | 视情况而定 | | 原生 MCP (AI Agent) | ✅ | ❌ | | 多语言端口 (JS/Go/Rust) | ✅ | ❌ | | 开源许可证 | ✅ COCL | 视情况而定 | *秉承 **Faker / Synth** 的精神,以 Cognis 的方式重新塑造。遗漏了致谢?欢迎提交 PR。*
↑ 回到顶部
## 集成 接入您的技术栈:用于代码扫描的 **SARIF**,用于任何场景的 **JSON**,用于 AI Agent 的 **MCP server** (`seedforge mcp`),以及用于 SIEM/Slack/Jira 的 webhook 转发器。详见 [`docs/INTEGRATIONS.md`](docs/INTEGRATIONS.md)。
↑ 回到顶部
## 安装 — 所有方式,所有平台 ``` pip install "git+https://github.com/cognis-digital/seedforge.git" # pip (works today) pipx install "git+https://github.com/cognis-digital/seedforge.git" # isolated CLI uv tool install "git+https://github.com/cognis-digital/seedforge.git" # uv pip install cognis-seedforge # PyPI (when published) docker run --rm ghcr.io/cognis-digital/seedforge:latest --help # Docker brew install cognis-digital/tap/seedforge # Homebrew tap curl -fsSL https://raw.githubusercontent.com/cognis-digital/seedforge/main/install.sh | sh ``` | Linux | macOS | Windows | Docker | Cloud | |---|---|---|---|---| | `scripts/setup-linux.sh` | `scripts/setup-macos.sh` | `scripts/setup-windows.ps1` | `docker run ghcr.io/cognis-digital/seedforge` | [DEPLOY.md](docs/DEPLOY.md) (AWS/Azure/GCP/k8s) |
↑ 回到顶部
## 相关的 Cognis 工具 - [`duckprobe`](https://github.com/cognis-digital/duckprobe) — 通过 DuckDB 对任何文件或数据仓库进行零设置的数据质量检查 - [`schemadrift`](https://github.com/cognis-digital/schemadrift) — Schema 变更检测器和数据契约测试 - [`csvlens`](https://github.com/cognis-digital/csvlens) — 用于分析和清理超大 CSV / Parquet 文件的快速 CLI - [`piiscan`](https://github.com/cognis-digital/piiscan) — 跨数据仓库和数据湖的 PII 发现(数据侧扫描器) - [`lineagemap`](https://github.com/cognis-digital/lineagemap) — 从 SQL 和 dbt 中提取列级血缘 - [`datasetcard`](https://github.com/cognis-digital/datasetcard) — 包含 Croissant + 血缘的自动 Dataset Cards / datasheets **探索全套工具 →** [🗂️ 全部 170+ 工具](https://github.com/cognis-digital/cognis-neural-suite) · [⭐ awesome-cognis](https://github.com/cognis-digital/awesome-cognis) · [🔗 cognis-sources](https://github.com/cognis-digital/cognis-sources) · [🤖 uncensored-fleet](https://github.com/cognis-digital/uncensored-fleet) · [🧠 engram](https://github.com/cognis-digital/engram)
↑ 回到顶部
## 互操作性 `{}` 与包含 300+ 工具的 Cognis 套件组合使用 — JSON 输入/输出以及共享的 兼容 OpenAI 的 `/v1` 主干网络。请参阅 **[INTEROP.md](INTEROP.md)** 了解 套件图谱、组合模式和参考技术栈。 ## 许可证 在 **Cognis Open Collaboration License (COCL) v1.0** 下提供源代码 — 免费用于个人、内部评估、研究和教育用途;**商业/生产用途需要获得许可证** (licensing@cognis.digital)。请参阅 [LICENSE](LICENSE)。
Cognis Digital · Cognis Neural Suite 中的 170+ 工具之一 · Making Tomorrow Better Today
标签:LNA, Python, Zenmap, 可视化界面, 数据可视化, 数据合成, 数据完整性, 数据治理, 数据质量, 无后门, 日志审计, 测试数据生成, 请求拦截, 逆向工具