zeroc00I/DontFeedTheAI

GitHub: zeroc00I/DontFeedTheAI

一个用于Claude Code的反向代理,通过本地匿名化敏感数据来保护隐私。

Stars: 548 | Forks: 61

# 切勿投喂AI

License Python Ollama FastAPI Platform

一个透明代理,在每次请求到达AI之前剥离IP地址、凭证、主机名和个人身份信息,并在返回时将其恢复。 ``` flowchart TD shell["🖥️ Your Shell\nnmap -sV dc01.acmecorp.local"] proxy["🛡️ DontFeedTheAI\ndc01.acmecorp.local → srv-0042.pentest.local\n10.20.0.10 → 203.0.113.47\nAdmin@Acme2024! → [CRED_XK9A2B3C]"] api["☁️ Anthropic API\nsees only\nsrv-0042.pentest.local\n203.0.113.47"] shell -- "① real data" --> proxy proxy -- "② surrogates only" --> api api -- "③ response + surrogates" --> proxy proxy -- "④ real data restored" --> shell ``` | 层级 | 检测内容 | |---|---| | 🧠 **Ollama(本地大语言模型)** | 文本中的主机名、组织名称、凭证 | | 🔍 **正则表达式** | IP地址、哈希值、令牌、API密钥 | 两者均在本地机器上运行。敏感数据绝不跨越边界。 ### 云端匿名化API确实存在 但那意味着另一份账单和另一个掌握您数据的第三方。 您已经为Claude的推理能力付费。 AI实现这一功能并不需要您的真实数据——仅需您问题的结构和语义即可。 | 用户群体 | 帮助方式 | |-----|-------------| | **渗透测试人员** | 将nmap、mimikatz、bloodhound的输出传递给Claude分析,而无需暴露客户基础设施 | | **开发人员与SRE工程师** | 在受监管环境中使用生产数据或内部配置进行调试 | | **法律与咨询顾问** | 在AI辅助审查中匿名化客户合同、案件材料或专有知识产权 | | **财务与合规人员** | 分析报告或审计脚本,同时保护账户详情 | | **研究人员** | 基于机密数据集查询大语言模型 | ## 为何不直接使用Ollama或Claude? **❌ 云端匿名化API + Claude** — 两份账单,两个第三方。您的敏感数据依然离开本地机器,只是经过更多环节。 ``` flowchart LR s0["🖥️ Your Shell\nreal data"] --> a0["☁️ Anonymization API\nsees everything\nbill #1"] a0 --> c0["☁️ Anthropic API\nbill #2"] ``` **❌ 仅使用Ollama** — 数据永不离开机器,但Ollama无法识别敏感信息。 它会对您粘贴的任何内容进行推理:真实IP、真实凭证、真实主机名。 ``` flowchart LR s1["🖥️ Your Shell\nreal data"] --> o1["🧠 Ollama\nno interception\nreasons on real data"] ``` **❌ 直接使用Claude** — 推理质量最佳,但所有数据均流入Anthropic的基础设施。 真实的客户IP、凭证、组织名称会出现在其API日志中——一次策略变更或数据泄露就可能引发问题。 ``` flowchart LR s2["🖥️ Your Shell\nreal data"] --> c1["☁️ Anthropic API\nsees everything\nlogs your real data"] ``` **✅ DontFeedTheAI** — 兼具Claude的推理能力与Ollama的本地检测,敏感数据绝不跨越边界。 ``` flowchart LR s3["🖥️ Your Shell\nreal data"] --> p["🛡️ DontFeedTheAI"] o2["🧠 Ollama\nlocal detector\nnever leaves machine"] --> p p --> c2["☁️ Anthropic API\nsees only surrogates"] ``` → 请查阅[docs/architecture.md](docs/architecture.md)了解完整技术细节。 ## 快速入门 ``` git clone https://github.com/zeroc00I/DontFeedTheAI cd DontFeedTheAI pip install -r requirements.txt python3 wizard.py ``` 安装向导将引导您完成所有设置——项目名称、运行位置、VPS地址、模型选择——然后自动部署、建立隧道连接,并启动带有代理功能的Claude。支持Windows、macOS和Linux系统。 ``` python3 wizard.py --help # all available commands ``` ## 文档 | 文档 | 内容说明 | |--|--| | [架构设计](docs/architecture.md) | 双层管道机制、匿名化与非匿名化内容说明、配置参考 | | [参与贡献](docs/contributing.md) | 如何添加测试用例、运行优化循环、待改进领域 | | [威胁模型](docs/threat-model.md) | 保护范围、局限性、开发路线图 | ## 验证覆盖范围与参与优化 DontFeedTheAI提供两个工具,帮助您验证覆盖范围并扩展功能。 **可视化审计** — 在代理运行时于浏览器中打开: ``` python3 wizard.py tunnel --audit ``` 显示会话期间记录的所有 `原始值 → 替代值` 映射关系,可按实体类型(域名、凭证、令牌、哈希值等)筛选,并提供每个请求的耗时分析。让您一目了然发现泄露点,无需手动检索日志。 ![审计面板](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/e879a602c7051914.png) **测试完整管道** — 需运行Ollama: ``` python3 wizard.py test --integration ``` 通过完整管道(大语言模型+正则表达式)运行全部53个测试用例,验证零泄露。不使用`--integration`参数时,大语言模型将被模拟,仅验证正则表达式层——适用于快速迭代,但不能替代完整测试。 **自动优化循环** — 仅正则表达式层,无需Ollama: ``` python3 wizard.py improve --cycles 3 ``` 通过正则表达式层运行所有测试用例,报告泄露和误报情况,并明确指出哪些字符串未被拦截。贡献流程为:为您实际使用的工具添加测试用例→运行优化循环→为每个泄露点添加正则表达式模式→重复此过程。详见[参与贡献](docs/contributing.md)。 这两个命令相辅相成:`improve` 命令快速强化正则表达式基础防护;`test --integration` 命令验证完整管道的防护效果。 ## 作者说明 ## Star历史 [![Star历史图表](https://api.star-history.com/svg?repos=zeroc00I/DontFeedTheAI&type=Date)](https://star-history.com/#zeroc00I/DontFeedTheAI&Date) ## 许可证 [MIT](LICENSE)
标签:AI安全, AI风险缓解, Chat Copilot, FastAPI框架, IP匿名化, Ollama集成, PII匿名化, Python编程, 主机名替换, 云数据保护, 人工智能安全, 凭据保护, 匿名化, 双层检测, 反向代理, 反馈循环, 合规性, 工具开发, 敏感信息保护, 数据脱敏, 数据隐私, 本地语言模型, 网络安全, 逆向工具, 透明代理, 隐私保护