cognis-digital/piiscan
GitHub: cognis-digital/piiscan
PIISCAN 是一款面向数据仓库和数据湖的 PII 扫描工具,帮助团队在数据流水线中自动发现和管理个人身份信息。
Stars: 0 | Forks: 0
checks + rules] P --> OUT[findings (JSON / SARIF)] ``` ## 从任何 AI 技术栈中使用 `piiscan` 可以与所有流行的 AI 使用方式互操作: - **MCP 服务器** — `piiscan mcp`(Claude Desktop、Cursor、Cognis.Studio、[uncensored-fleet](https://github.com/cognis-digital/uncensored-fleet)) - **兼容 OpenAI / JSON** — 将 `piiscan scan . --format json` 通过管道传递给任何 agent 或 LLM - **LangChain · CrewAI · AutoGen · LlamaIndex** — 一行代码将 CLI/JSON 封装为工具 - **CI / 脚本** — 为非 AI 流水线提供退出代码 + SARIF ## 对比分析 | | **Cognis piiscan** | Presidio | |---|:---:|:---:| | 可自托管,无需账户 | ✅ | 视情况而定 | | 单条命令,零配置 | ✅ | ⚠️ | | 用于 CI 的 JSON + SARIF | ✅ | 视情况而定 | | 原生 MCP(AI agent) | ✅ | ❌ | | 多语言移植(JS/Go/Rust) | ✅ | ❌ | | 开放许可证 | ✅ COCL | 视情况而定 | *本着 **Presidio** 的精神打造,以 Cognis 的方式重新构建。遗漏了致谢?欢迎提交 PR。* ## 集成 接入您的技术栈:用于代码扫描的 **SARIF**,用于任何场景的 **JSON**,用于 AI agent 的 **MCP 服务器**(`piiscan mcp`),以及用于 SIEM/Slack/Jira 的 webhook 转发器。参见 [`docs/INTEGRATIONS.md`](docs/INTEGRATIONS.md)。 ## 安装 —— 全方式,全平台 ``` pip install "git+https://github.com/cognis-digital/piiscan.git" # pip (works today) pipx install "git+https://github.com/cognis-digital/piiscan.git" # isolated CLI uv tool install "git+https://github.com/cognis-digital/piiscan.git" # uv pip install cognis-piiscan # PyPI (when published) docker run --rm ghcr.io/cognis-digital/piiscan:latest --help # Docker brew install cognis-digital/tap/piiscan # Homebrew tap curl -fsSL https://raw.githubusercontent.com/cognis-digital/piiscan/main/install.sh | sh ``` | Linux | macOS | Windows | Docker | Cloud | |---|---|---|---|---| | `scripts/setup-linux.sh` | `scripts/setup-macos.sh` | `scripts/setup-windows.ps1` | `docker run ghcr.io/cognis-digital/piiscan` | [DEPLOY.md](docs/DEPLOY.md) (AWS/Azure/GCP/k8s) | ## 相关 Cognis 工具 - [`duckprobe`](https://github.com/cognis-digital/duckprobe) — 通过 DuckDB 对任何文件或仓库进行零配置的数据质量检查 - [`schemadrift`](https://github.com/cognis-digital/schemadrift) — Schema 变更检测器和数据契约测试 - [`csvlens`](https://github.com/cognis-digital/csvlens) — 用于分析和清理超大 CSV / Parquet 文件的快速 CLI - [`lineagemap`](https://github.com/cognis-digital/lineagemap) — 从 SQL 和 dbt 提取的列级血缘 - [`datasetcard`](https://github.com/cognis-digital/datasetcard) — 自动生成带有 Croissant + 溯源的 Dataset Cards / datasheets - [`seedforge`](https://github.com/cognis-digital/seedforge) — 具有参照完整性的合成测试数据生成器 ## 互操作性 `{}` 与包含 300+ 工具的 Cognis 套件组合 —— JSON 输入/输出以及共享的 兼容 OpenAI 的 `/v1` 主干。有关套件图谱、组合模式和参考技术栈,请参见 **[INTEROP.md](INTEROP.md)**。 ## 许可证 在 **Cognis Open Collaboration License (COCL) v1.0** 下开源可见 —— 可免费用于个人、内部评估、研究和教育用途;**商业/生产用途需要许可证** (licensing@cognis.digital)。参见 [LICENSE](LICENSE)。
Cognis Digital · Cognis Neural Suite 中 170+ 工具之一 · 让明天在今天更美好
标签:PII扫描, Python, 可视化界面, 敏感数据发现, 数据可视化, 数据合规, 数据治理, 无后门, 日志审计, 请求拦截, 逆向工具