m3lixir/chumdump

GitHub: m3lixir/chumdump

一款防御性 AI 安全 CLI 工具,通过生成和部署受控诱饵来检测并记录 AI 爬虫、RAG 系统及 agent 的内容消费行为。

Stars: 1 | Forks: 0

# chumdump [![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/97132d993b210327.svg)](https://github.com/m3lixir/chumdump/actions/workflows/ci.yml) [![Release](https://img.shields.io/github/v/release/m3lixir/chumdump?include_prereleases&label=release)](https://github.com/m3lixir/chumdump/releases) `chumdump` 是一款用于防御的 CLI,用于检查 AI 可读环境, 检测 chum 类内容,生成受控的 chumbait, 并监控 AI 爬虫、agent 或检索系统是否消耗了它。 使用它可以为爬虫、agent、模型和 RAG 系统创建受控诱饵,然后观察诱饵是否被 访问、检索、复述、 执行或泄露。 ## 目录 - [它的功能](#what-it-does) - [状态](#status) - [安装](#install) - [快速开始](#quickstart) - [证据模型](#evidence-model) - [工作流](#workflow) - [命令](#commands) - [安全性与适用范围](#safety-and-scope) ## 它的功能 - 生成 canary、爬虫诱饵、prompt 陷阱、RAG 诱饵、虚假的 无害密钥、水印、设定种子和诱饵文档。 - 构建包含 manifest 和索引页面的可部署 chumdump bundle。 - 将 bundle 部署到自有的网站、仓库、文档或 测试语料库中。 - 扫描路径以查找已知的诱饵标记。 - 解析访问日志并记录 bite 事件。 - 生成 Markdown、JSON、HTML 或 SARIF 风格的报告。 - 从已标记的目标位置清理已部署的诱饵文件。 ## 状态 当前版本: [v0.1.0-alpha](https://github.com/m3lixir/chumdump/releases/tag/v0.1.0-alpha)。 `chumdump` 处于早期 alpha 阶段。核心的本地工作流 尚可使用,但在发布稳定版之前,命令接口和 报告 schema 可能会发生变更。 ## 安装 从 GitHub 安装当前的 alpha 版本: ``` python3 -m pip install \ "git+https://github.com/m3lixir/chumdump.git@v0.1.0-alpha" ``` 通过本地代码库签出进行开发安装: ``` python3 -m pip install -e ".[dev]" ``` 然后检查 CLI: ``` chumdump --help ``` 你也可以直接从代码库签出运行 CLI: ``` PYTHONPATH=src python3 -m chumdump --help ``` ## 快速开始 这将会创建一个本地项目,生成诱饵,部署一个小的 dump, 模拟一条爬虫风格的访问日志条目,记录 bite, 并打印报告。 ``` chumdump init ai-crawler-test cd ai-crawler-test chumdump bait create --type canary --name violet-harbor chumdump dump build --profile website --count 1 chumdump deploy ./public bait_file=$(basename "$(find public/bait -name '*.md' | head -n 1)") cat > access.log <create project"] bait["bait create/list
make controlled artifacts"] dump["dump build/create
bundle a corpus"] deploy["deploy
place in owned environment"] observe["AI-readable surface
website, docs, RAG, lab agent"] watch["watch
parse logs and telemetry"] bites["bites
review evidence events"] report["report
produce Markdown, JSON, HTML, or SARIF"] scan["scan
inspect existing corpus"] cleanup["cleanup
remove deployed bait"] init --> bait --> dump --> deploy --> observe --> watch --> bites --> report scan --> bait deploy --> cleanup observe -. "crawler, retrieval, echo, or action" .-> watch ``` 创建一个项目: ``` chumdump init ai-crawler-test cd ai-crawler-test ``` 创建 canary 和 prompt 陷阱诱饵: ``` chumdump bait create --type canary --name violet-harbor chumdump bait create --type prompt-trap --target agent ``` 构建并部署面向网站的 dump: ``` chumdump dump build --profile website --count 8 chumdump deploy ./public ``` 监控访问日志以获取 bite: ``` chumdump watch --logs ./access.log chumdump bites ``` 生成报告: ``` chumdump report --format markdown ``` ## 命令 核心命令循环如下: - `chumdump init` - `chumdump bait create` - `chumdump bait list` - `chumdump dump build` - `chumdump deploy` - `chumdump scan` - `chumdump watch` - `chumdump bites` - `chumdump report` - `chumdump cleanup` 有关命令详情,请参阅 [docs/commands.md](docs/commands.md)。 ## 安全性与适用范围 仅在你拥有或被授权测试的环境中使用 chumdump。 合适的用途包括: - 测试你自己的网站。 - 测试你自己的文档。 - 测试内部的 RAG 语料库。 - 测试实验室 agent。 - 将 canary 部署到自有的基础设施。 - 监控你自己的日志。 不合适的用途包括: - 未经许可在第三方系统上部署诱饵。 - 试图污染公开模型。 - 欺骗 agent 执行不安全的操作。 - 收集真实的凭证。 - 生成欺骗性的内容农场。 - 绕过访问控制。 Chumdump 是一款防御性研究工具。请保持诱饵的纯净。
标签:AI安全, AMSI绕过, Chat Copilot, CISA项目, Homebrew安装, RAG安全, Red Canary, 多模态安全, 威胁检测, 子域名变形, 文档结构分析, 聊天机器人, 蜜罐, 证书利用, 逆向工具, 配置审计, 防御加固