cognis-digital/csvlens
GitHub: cognis-digital/csvlens
一款快速命令行工具,用于对海量 CSV/Parquet 文件进行数据探查、清洗和 CI 质量门控。
Stars: 0 | Forks: 0
analyze + score] P --> OUT[report] ``` ## 从任何 AI 技术栈中使用 `csvlens` 可以与所有流行的 AI 使用方式互操作: - **MCP server** — `csvlens mcp` (Claude Desktop, Cursor, Cognis.Studio, [uncensored-fleet](https://github.com/cognis-digital/uncensored-fleet)) - **兼容 OpenAI / JSON** — 将 `csvlens scan . --format json` 通过管道传递给任何 agent 或 LLM - **LangChain · CrewAI · AutoGen · LlamaIndex** — 一行代码即可将 CLI/JSON 封装为工具 - **CI / 脚本** — 为非 AI pipeline 提供 exit code 和 SARIF ## 对比 | | **Cognis csvlens** | xsv | |---|:---:|:---:| | 可自托管,无需账号 | ✅ | 视情况而定 | | 单一命令,零配置 | ✅ | ⚠️ | | 为 CI 提供 JSON 和 SARIF | ✅ | 视情况而定 | | MCP 原生支持 (AI agents) | ✅ | ❌ | | 多语言端口 (JS/Go/Rust) | ✅ | ❌ | | 开源许可 | ✅ COCL | 视情况而定 | *秉承 **xsv / qsv** 的精神,以 Cognis 的方式重新构建。遗漏了鸣谢?欢迎提交 PR。* ## 集成 接入您的技术栈:用于代码扫描的 **SARIF**,用于一切的 **JSON**,用于 AI agent 的 **MCP server** (`csvlens mcp`),以及用于 SIEM/Slack/Jira 的 webhook 转发器。详见 [`docs/INTEGRATIONS.md`](docs/INTEGRATIONS.md)。 ## 安装 — 各种方式,所有平台 ``` pip install "git+https://github.com/cognis-digital/csvlens.git" # pip (works today) pipx install "git+https://github.com/cognis-digital/csvlens.git" # isolated CLI uv tool install "git+https://github.com/cognis-digital/csvlens.git" # uv pip install cognis-csvlens # PyPI (when published) docker run --rm ghcr.io/cognis-digital/csvlens:latest --help # Docker brew install cognis-digital/tap/csvlens # Homebrew tap curl -fsSL https://raw.githubusercontent.com/cognis-digital/csvlens/main/install.sh | sh ``` | Linux | macOS | Windows | Docker | 云平台 | |---|---|---|---|---| | `scripts/setup-linux.sh` | `scripts/setup-macos.sh` | `scripts/setup-windows.ps1` | `docker run ghcr.io/cognis-digital/csvlens` | [DEPLOY.md](docs/DEPLOY.md) (AWS/Azure/GCP/k8s) | ## 相关 Cognis 工具 - [`duckprobe`](https://github.com/cognis-digital/duckprobe) — 通过 DuckDB 对任何文件或数据仓库进行零设置的数据质量检查 - [`schemadrift`](https://github.com/cognis-digital/schemadrift) — Schema 变更检测器和数据契约测试 - [`piiscan`](https://github.com/cognis-digital/piiscan) — 跨数据仓库和数据湖进行 PII 发现(数据侧扫描器) - [`lineagemap`](https://github.com/cognis-digital/lineagemap) — 从 SQL 和 dbt 中提取列级别的血缘 - [`datasetcard`](https://github.com/cognis-digital/datasetcard) — 带有 Croissant + 溯源的自动 Dataset Cards / datasheets - [`seedforge`](https://github.com/cognis-digital/seedforge) — 具有引用完整性的合成测试数据生成器 **探索套件 →** [🗂️ 所有 170+ 工具](https://github.com/cognis-digital/cognis-neural-suite) · [⭐ awesome-cognis](https://github.com/cognis-digital/awesome-cognis) · [🔗 cognis-sources](https://github.com/cognis-digital/cognis-sources) · [🤖 uncensored-fleet](https://github.com/cognis-digital/uncensored-fleet) · [🧠 engram](https://github.com/cognis-digital/engram) ## 互操作性 `{}` 与包含 300+ 工具的 Cognis 套件相组合 — JSON 输入/输出以及共享的 兼容 OpenAI 的 `/v1` 主干网络。有关套件映射、组合模式和参考技术栈,请参阅 **[INTEROP.md](INTEROP.md)**。 ## 许可证 在 **Cognis Open Collaboration License (COCL) v1.0** 下提供源代码 — 可免费用于个人、内部评估、研究和教育用途;**商业 / 生产环境使用需要获得许可** (licensing@cognis.digital)。请参阅 [LICENSE](LICENSE)。
Cognis Digital · Cognis Neural Suite 中的 170+ 工具之一 · 让明天在今天更美好
标签:Parquet, Python, 代码示例, 可视化界面, 数据分析, 数据可视化, 数据清洗, 无后门, 日志审计, 请求拦截, 逆向工具