sgasser/pasteguard
GitHub: sgasser/pasteguard
PasteGuard 是一个开源的 LLM 隐私代理,在用户将内容发送给 AI 之前自动检测并掩码个人数据和机密信息,确保敏感数据不离开本地。
Stars: 658 | Forks: 31
AI 获取上下文,但不获取你的秘密。
在你向 AI 发送 prompt 之前,自动隐藏姓名、电子邮件和 API key。
快速开始 ·
Chat ·
编程工具 ·
文档
支持检测多种语言的个人数据和机密信息。
你的数据永远不会离开你的本地机器。
## 无处不在
**[Chat](https://pasteguard.com/docs/use-cases/chat)** — 当你向 ChatGPT、Claude 和 Gemini 粘贴内容时,会自动掩码 PII 和机密信息。你看到的是原始内容,AI 看到的是占位符。
**[应用](https://pasteguard.com/docs/use-cases/apps)** — Open WebUI、LibreChat 或任何自托管的 AI 环境。可选择将敏感请求路由到本地模型。
**[编程工具](https://pasteguard.com/docs/use-cases/coding-tools)** — Cursor、Claude Code、Copilot、Windsurf — 你的代码库上下文会流向提供商。PasteGuard 会在它们离开之前掩码机密信息和 PII。
**[API 集成](https://pasteguard.com/docs/use-cases/api-integration)** — 运行在你的代码与 OpenAI 兼容或 Anthropic API 之间。只需更改一个 URL,即可保护你用户的数据。
## 快速开始
将 PasteGuard 作为本地代理运行:
```
docker run --rm -p 3000:3000 ghcr.io/sgasser/pasteguard:latest
```
打开 [localhost:3000](http://localhost:3000) 访问仪表盘。
将你的工具或应用指向 PasteGuard,而不是直接指向提供商:
| 目标 | PasteGuard URL | 原始 URL |
|----------|----------------|--------------|
| OpenAI | `http://localhost:3000/openai/v1` | `https://api.openai.com/v1` |
| Anthropic | `http://localhost:3000/anthropic` | `https://api.anthropic.com` |
| Codex CLI | `http://localhost:3000/codex` | `https://chatgpt.com/backend-api/codex` |
```
# 一行代码保护您的数据
client = OpenAI(base_url="http://localhost:3000/openai/v1")
```
开箱即支持多语言检测 — 无需针对特定语言的镜像或设置。如需自定义配置或持久化日志:**[阅读文档 →](https://pasteguard.com/docs/installation)**
路由模式
路由模式会将包含敏感数据的请求发送到本地 LLM(Ollama、vLLM、llama.cpp)。其他所有请求将发送到配置的云提供商。敏感数据会保留在你的网络中。
**[路由模式文档 →](https://pasteguard.com/docs/concepts/route-mode)**
## Chat
用于 ChatGPT、Claude 和 Gemini 的开源浏览器扩展。
- 粘贴客户数据 → 在到达 AI 之前被掩码
- AI 返回的占位符 → 你看到的是原始内容
- 使用与代理相同的检测引擎
目前处于测试阶段。基于 Apache 2.0 协议。
**[加入测试 →](https://tally.so/r/J9pNLr)** · **[Chat 文档 →](https://pasteguard.com/docs/use-cases/chat)**
## 编程工具
在使用 AI 编程助手时,保护你的代码库上下文和机密信息。
**Claude Code:**
```
ANTHROPIC_BASE_URL=http://localhost:3000/anthropic claude
```
**Cursor:** Settings → Models → Enable "Override OpenAI Base URL" → `http://localhost:3000/openai/v1`
**Codex CLI:** 配置一个 `base_url = "http://127.0.0.1:3000/codex"` 的自定义 provider。完整代码片段请参阅编程工具文档。
**[编程工具文档 →](https://pasteguard.com/docs/use-cases/coding-tools)**
## 仪表盘
每个请求都会被记录并附带掩码详细信息。你可以查看检测到了什么、掩码了什么,以及最终到达了提供商什么内容。

[localhost:3000](http://localhost:3000)
## 检测范围
**个人数据** — 姓名、位置、电子邮件、电话号码、信用卡、IBAN、IP 地址和欧盟增值税号。支持多种语言。
**机密信息** — API key(OpenAI、Anthropic、Stripe、AWS、GitHub)、SSH 和 PEM 私钥、JWT token、bearer token、密码、连接字符串。
以上内容均可被实时检测和掩码,包括流式响应。
## 检测原理
检测功能作为一个独立的服务运行,PasteGuard 通过 HTTP 调用它,因此你可以将它部署在任何地方。它将精确校验(IBAN、信用卡、电子邮件、电话、IP)与一个小型 AI 模型([GLiNER](https://github.com/urchade/GLiNER),用于检测姓名和地点)相结合。它在任何语言下的工作方式都是一样的。默认情况下,电话号码仅支持国际格式;如果需要本地格式,请添加 `phone_regions`。
代码、Docker 镜像和测试位于 [`detector/`](detector/) 中。
## 技术栈
[Bun](https://bun.sh) · [Hono](https://hono.dev) · [GLiNER](https://github.com/urchade/GLiNER) + [python-stdnum](https://arthurdejong.org/python-stdnum/) ([`detector/`](detector/)) · SQLite
## 贡献
请查看 [CONTRIBUTING.md](CONTRIBUTING.md) 了解如何参与贡献的指南。
## 许可证
[Apache 2.0](LICENSE)
标签:内核驱动漏洞利用, 自动化攻击, 请求拦截, 逆向工具