m3lixir/chumdump

GitHub: m3lixir/chumdump

一款防御性 AI 安全 CLI 工具，通过生成和部署受控诱饵来检测并记录 AI 爬虫、RAG 系统及 agent 的内容消费行为。

Stars: 1 | Forks: 0

# chumdump [![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/97132d993b210327.svg)](https://github.com/m3lixir/chumdump/actions/workflows/ci.yml) [![Release](https://img.shields.io/github/v/release/m3lixir/chumdump?include_prereleases&label=release)](https://github.com/m3lixir/chumdump/releases) `chumdump` 是一款用于防御的 CLI，用于检查 AI 可读环境，检测 chum 类内容，生成受控的 chumbait，并监控 AI 爬虫、agent 或检索系统是否消耗了它。使用它可以为爬虫、agent、模型和 RAG 系统创建受控诱饵，然后观察诱饵是否被访问、检索、复述、执行或泄露。 ## 目录 - [它的功能](#what-it-does) - [状态](#status) - [安装](#install) - [快速开始](#quickstart) - [证据模型](#evidence-model) - [工作流](#workflow) - [命令](#commands) - [安全性与适用范围](#safety-and-scope) ## 它的功能 - 生成 canary、爬虫诱饵、prompt 陷阱、RAG 诱饵、虚假的无害密钥、水印、设定种子和诱饵文档。 - 构建包含 manifest 和索引页面的可部署 chumdump bundle。 - 将 bundle 部署到自有的网站、仓库、文档或测试语料库中。 - 扫描路径以查找已知的诱饵标记。 - 解析访问日志并记录 bite 事件。 - 生成 Markdown、JSON、HTML 或 SARIF 风格的报告。 - 从已标记的目标位置清理已部署的诱饵文件。 ## 状态当前版本： [v0.1.0-alpha](https://github.com/m3lixir/chumdump/releases/tag/v0.1.0-alpha)。 `chumdump` 处于早期 alpha 阶段。核心的本地工作流尚可使用，但在发布稳定版之前，命令接口和报告 schema 可能会发生变更。 ## 安装从 GitHub 安装当前的 alpha 版本： ``` python3 -m pip install \ "git+https://github.com/m3lixir/chumdump.git@v0.1.0-alpha" ``` 通过本地代码库签出进行开发安装： ``` python3 -m pip install -e ".[dev]" ``` 然后检查 CLI： ``` chumdump --help ``` 你也可以直接从代码库签出运行 CLI： ``` PYTHONPATH=src python3 -m chumdump --help ``` ## 快速开始这将会创建一个本地项目，生成诱饵，部署一个小的 dump，模拟一条爬虫风格的访问日志条目，记录 bite，并打印报告。 ``` chumdump init ai-crawler-test cd ai-crawler-test chumdump bait create --type canary --name violet-harbor chumdump dump build --profile website --count 1 chumdump deploy ./public bait_file=$(basename "$(find public/bait -name '*.md' | head -n 1)") cat > access.log <create project"] bait["bait create/list
make controlled artifacts"] dump["dump build/create
bundle a corpus"] deploy["deploy
place in owned environment"] observe["AI-readable surface
website, docs, RAG, lab agent"] watch["watch
parse logs and telemetry"] bites["bites
review evidence events"] report["report
produce Markdown, JSON, HTML, or SARIF"] scan["scan
inspect existing corpus"] cleanup["cleanup
remove deployed bait"] init --> bait --> dump --> deploy --> observe --> watch --> bites --> report scan --> bait deploy --> cleanup observe -. "crawler, retrieval, echo, or action" .-> watch ``` 创建一个项目： ``` chumdump init ai-crawler-test cd ai-crawler-test ``` 创建 canary 和 prompt 陷阱诱饵： ``` chumdump bait create --type canary --name violet-harbor chumdump bait create --type prompt-trap --target agent ``` 构建并部署面向网站的 dump： ``` chumdump dump build --profile website --count 8 chumdump deploy ./public ``` 监控访问日志以获取 bite： ``` chumdump watch --logs ./access.log chumdump bites ``` 生成报告： ``` chumdump report --format markdown ``` ## 命令核心命令循环如下： - `chumdump init` - `chumdump bait create` - `chumdump bait list` - `chumdump dump build` - `chumdump deploy` - `chumdump scan` - `chumdump watch` - `chumdump bites` - `chumdump report` - `chumdump cleanup` 有关命令详情，请参阅 [docs/commands.md](docs/commands.md)。 ## 安全性与适用范围仅在你拥有或被授权测试的环境中使用 chumdump。合适的用途包括： - 测试你自己的网站。 - 测试你自己的文档。 - 测试内部的 RAG 语料库。 - 测试实验室 agent。 - 将 canary 部署到自有的基础设施。 - 监控你自己的日志。不合适的用途包括： - 未经许可在第三方系统上部署诱饵。 - 试图污染公开模型。 - 欺骗 agent 执行不安全的操作。 - 收集真实的凭证。 - 生成欺骗性的内容农场。 - 绕过访问控制。 Chumdump 是一款防御性研究工具。请保持诱饵的纯净。

标签：AI安全, AMSI绕过, Chat Copilot, CISA项目, Homebrew安装, RAG安全, Red Canary, 多模态安全, 威胁检测, 子域名变形, 文档结构分析, 聊天机器人, 蜜罐, 证书利用, 逆向工具, 配置审计, 防御加固