zeroc00I/DontFeedTheAI

GitHub: zeroc00I/DontFeedTheAI

一个用于Claude Code的反向代理，通过本地匿名化敏感数据来保护隐私。

Stars: 643 | Forks: 76

# 切勿投喂AI

一个透明代理，在每次请求到达AI之前剥离IP地址、凭证、主机名和个人身份信息，并在返回时将其恢复。 ``` flowchart TD shell["🖥️ Your Shell\nnmap -sV dc01.acmecorp.local"] proxy["🛡️ DontFeedTheAI\ndc01.acmecorp.local → srv-0042.pentest.local\n10.20.0.10 → 203.0.113.47\nAdmin@Acme2024! → [CRED_XK9A2B3C]"] api["☁️ Anthropic API\nsees only\nsrv-0042.pentest.local\n203.0.113.47"] shell -- "① real data" --> proxy proxy -- "② surrogates only" --> api api -- "③ response + surrogates" --> proxy proxy -- "④ real data restored" --> shell ``` | 层级 | 检测内容 | |---|---| | 🧠 **Ollama（本地大语言模型）** | 文本中的主机名、组织名称、凭证 | | 🔍 **正则表达式** | IP地址、哈希值、令牌、API密钥 | 两者均在本地机器上运行。敏感数据绝不跨越边界。 ### 云端匿名化API确实存在但那意味着另一份账单和另一个掌握您数据的第三方。您已经为Claude的推理能力付费。 AI实现这一功能并不需要您的真实数据——仅需您问题的结构和语义即可。 | 用户群体 | 帮助方式 | |-----|-------------| | **渗透测试人员** | 将nmap、mimikatz、bloodhound的输出传递给Claude分析，而无需暴露客户基础设施 | | **开发人员与SRE工程师** | 在受监管环境中使用生产数据或内部配置进行调试 | | **法律与咨询顾问** | 在AI辅助审查中匿名化客户合同、案件材料或专有知识产权 | | **财务与合规人员** | 分析报告或审计脚本，同时保护账户详情 | | **研究人员** | 基于机密数据集查询大语言模型 | ## 为何不直接使用Ollama或Claude？ **❌ 云端匿名化API + Claude** — 两份账单，两个第三方。您的敏感数据依然离开本地机器，只是经过更多环节。 ``` flowchart LR s0["🖥️ Your Shell\nreal data"] --> a0["☁️ Anonymization API\nsees everything\nbill #1"] a0 --> c0["☁️ Anthropic API\nbill #2"] ``` **❌ 仅使用Ollama** — 数据永不离开机器，但Ollama无法识别敏感信息。它会对您粘贴的任何内容进行推理：真实IP、真实凭证、真实主机名。 ``` flowchart LR s1["🖥️ Your Shell\nreal data"] --> o1["🧠 Ollama\nno interception\nreasons on real data"] ``` **❌ 直接使用Claude** — 推理质量最佳，但所有数据均流入Anthropic的基础设施。真实的客户IP、凭证、组织名称会出现在其API日志中——一次策略变更或数据泄露就可能引发问题。 ``` flowchart LR s2["🖥️ Your Shell\nreal data"] --> c1["☁️ Anthropic API\nsees everything\nlogs your real data"] ``` **✅ DontFeedTheAI** — 兼具Claude的推理能力与Ollama的本地检测，敏感数据绝不跨越边界。 ``` flowchart LR s3["🖥️ Your Shell\nreal data"] --> p["🛡️ DontFeedTheAI"] o2["🧠 Ollama\nlocal detector\nnever leaves machine"] --> p p --> c2["☁️ Anthropic API\nsees only surrogates"] ``` → 请查阅[docs/architecture.md](docs/architecture.md)了解完整技术细节。 ## 快速入门 ``` git clone https://github.com/zeroc00I/DontFeedTheAI cd DontFeedTheAI pip install -r requirements.txt python3 wizard.py ``` 安装向导将引导您完成所有设置——项目名称、运行位置、VPS地址、模型选择——然后自动部署、建立隧道连接，并启动带有代理功能的Claude。支持Windows、macOS和Linux系统。 ``` python3 wizard.py --help # all available commands ``` ## 文档 | 文档 | 内容说明 | |--|--| | [架构设计](docs/architecture.md) | 双层管道机制、匿名化与非匿名化内容说明、配置参考 | | [参与贡献](docs/contributing.md) | 如何添加测试用例、运行优化循环、待改进领域 | | [威胁模型](docs/threat-model.md) | 保护范围、局限性、开发路线图 | ## 验证覆盖范围与参与优化 DontFeedTheAI提供两个工具，帮助您验证覆盖范围并扩展功能。 **可视化审计** — 在代理运行时于浏览器中打开： ``` python3 wizard.py tunnel --audit ``` 显示会话期间记录的所有 `原始值 → 替代值` 映射关系，可按实体类型（域名、凭证、令牌、哈希值等）筛选，并提供每个请求的耗时分析。让您一目了然发现泄露点，无需手动检索日志。 ![审计面板](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/e879a602c7051914.png) **测试完整管道** — 需运行Ollama： ``` python3 wizard.py test --integration ``` 通过完整管道（大语言模型+正则表达式）运行全部53个测试用例，验证零泄露。不使用`--integration`参数时，大语言模型将被模拟，仅验证正则表达式层——适用于快速迭代，但不能替代完整测试。 **自动优化循环** — 仅正则表达式层，无需Ollama： ``` python3 wizard.py improve --cycles 3 ``` 通过正则表达式层运行所有测试用例，报告泄露和误报情况，并明确指出哪些字符串未被拦截。贡献流程为：为您实际使用的工具添加测试用例→运行优化循环→为每个泄露点添加正则表达式模式→重复此过程。详见[参与贡献](docs/contributing.md)。这两个命令相辅相成：`improve` 命令快速强化正则表达式基础防护；`test --integration` 命令验证完整管道的防护效果。 ## 作者说明 ## Star历史 [![Star历史图表](https://api.star-history.com/svg?repos=zeroc00I/DontFeedTheAI&type=Date)](https://star-history.com/#zeroc00I/DontFeedTheAI&Date) ## 许可证 [MIT](LICENSE)

标签：AI安全, AI风险缓解, Chat Copilot, FastAPI框架, IP匿名化, Ollama集成, PII匿名化, Python编程, 主机名替换, 云数据保护, 人工智能安全, 凭据保护, 匿名化, 双层检测, 反向代理, 反馈循环, 合规性, 工具开发, 敏感信息保护, 数据脱敏, 数据隐私, 本地语言模型, 网络安全, 逆向工具, 透明代理, 隐私保护