sgasser/pasteguard

GitHub: sgasser/pasteguard

PasteGuard 是一个开源的 LLM 隐私代理，在用户将内容发送给 AI 之前自动检测并掩码个人数据和机密信息，确保敏感数据不离开本地。

Stars: 658 | Forks: 31

AI 获取上下文，但不获取你的秘密。
在你向 AI 发送 prompt 之前，自动隐藏姓名、电子邮件和 API key。

PasteGuard — Without vs. With: masks names, emails, and API keys before they reach AI

支持检测多种语言的个人数据和机密信息。
你的数据永远不会离开你的本地机器。

## 无处不在 **[Chat](https://pasteguard.com/docs/use-cases/chat)** — 当你向 ChatGPT、Claude 和 Gemini 粘贴内容时，会自动掩码 PII 和机密信息。你看到的是原始内容，AI 看到的是占位符。 **[应用](https://pasteguard.com/docs/use-cases/apps)** — Open WebUI、LibreChat 或任何自托管的 AI 环境。可选择将敏感请求路由到本地模型。 **[编程工具](https://pasteguard.com/docs/use-cases/coding-tools)** — Cursor、Claude Code、Copilot、Windsurf — 你的代码库上下文会流向提供商。PasteGuard 会在它们离开之前掩码机密信息和 PII。 **[API 集成](https://pasteguard.com/docs/use-cases/api-integration)** — 运行在你的代码与 OpenAI 兼容或 Anthropic API 之间。只需更改一个 URL，即可保护你用户的数据。 ## 快速开始将 PasteGuard 作为本地代理运行： ``` docker run --rm -p 3000:3000 ghcr.io/sgasser/pasteguard:latest ``` 打开 [localhost:3000](http://localhost:3000) 访问仪表盘。将你的工具或应用指向 PasteGuard，而不是直接指向提供商： | 目标 | PasteGuard URL | 原始 URL | |----------|----------------|--------------| | OpenAI | `http://localhost:3000/openai/v1` | `https://api.openai.com/v1` | | Anthropic | `http://localhost:3000/anthropic` | `https://api.anthropic.com` | | Codex CLI | `http://localhost:3000/codex` | `https://chatgpt.com/backend-api/codex` | ``` # 一行代码保护您的数据 client = OpenAI(base_url="http://localhost:3000/openai/v1") ``` 开箱即支持多语言检测 — 无需针对特定语言的镜像或设置。如需自定义配置或持久化日志：**[阅读文档 →](https://pasteguard.com/docs/installation)**

路由模式

路由模式会将包含敏感数据的请求发送到本地 LLM（Ollama、vLLM、llama.cpp）。其他所有请求将发送到配置的云提供商。敏感数据会保留在你的网络中。 **[路由模式文档 →](https://pasteguard.com/docs/concepts/route-mode)**

## Chat 用于 ChatGPT、Claude 和 Gemini 的开源浏览器扩展。 - 粘贴客户数据 → 在到达 AI 之前被掩码 - AI 返回的占位符 → 你看到的是原始内容 - 使用与代理相同的检测引擎目前处于测试阶段。基于 Apache 2.0 协议。 **[加入测试 →](https://tally.so/r/J9pNLr)** · **[Chat 文档 →](https://pasteguard.com/docs/use-cases/chat)** ## 编程工具在使用 AI 编程助手时，保护你的代码库上下文和机密信息。 **Claude Code:** ``` ANTHROPIC_BASE_URL=http://localhost:3000/anthropic claude ``` **Cursor:** Settings → Models → Enable "Override OpenAI Base URL" → `http://localhost:3000/openai/v1` **Codex CLI:** 配置一个 `base_url = "http://127.0.0.1:3000/codex"` 的自定义 provider。完整代码片段请参阅编程工具文档。 **[编程工具文档 →](https://pasteguard.com/docs/use-cases/coding-tools)** ## 仪表盘每个请求都会被记录并附带掩码详细信息。你可以查看检测到了什么、掩码了什么，以及最终到达了提供商什么内容。 PasteGuard Dashboard

[localhost:3000](http://localhost:3000) ## 检测范围 **个人数据** — 姓名、位置、电子邮件、电话号码、信用卡、IBAN、IP 地址和欧盟增值税号。支持多种语言。 **机密信息** — API key（OpenAI、Anthropic、Stripe、AWS、GitHub）、SSH 和 PEM 私钥、JWT token、bearer token、密码、连接字符串。以上内容均可被实时检测和掩码，包括流式响应。 ## 检测原理检测功能作为一个独立的服务运行，PasteGuard 通过 HTTP 调用它，因此你可以将它部署在任何地方。它将精确校验（IBAN、信用卡、电子邮件、电话、IP）与一个小型 AI 模型（[GLiNER](https://github.com/urchade/GLiNER)，用于检测姓名和地点）相结合。它在任何语言下的工作方式都是一样的。默认情况下，电话号码仅支持国际格式；如果需要本地格式，请添加 `phone_regions`。代码、Docker 镜像和测试位于 [`detector/`](detector/) 中。 ## 技术栈 [Bun](https://bun.sh) · [Hono](https://hono.dev) · [GLiNER](https://github.com/urchade/GLiNER) + [python-stdnum](https://arthurdejong.org/python-stdnum/) ([`detector/`](detector/)) · SQLite ## 贡献请查看 [CONTRIBUTING.md](CONTRIBUTING.md) 了解如何参与贡献的指南。 ## 许可证 [Apache 2.0](LICENSE)

标签：内核驱动漏洞利用, 自动化攻击, 请求拦截, 逆向工具