Heretek-RE/re-leak-scan
GitHub: Heretek-RE/re-leak-scan
一个基于纯 Python 的 MCP 服务器,用于检测二进制文件中泄露的遥测流水线信息和凭证密钥。
Stars: 0 | Forks: 0
# re-leak-scan
用于检测二进制制品中**发布者遥测流水线泄露**的 MCP server。扫描文件的字符串表以查找:
- **Sentry DSN**(包含内嵌的公开认证)—— 允许伪造崩溃报告提交
- **Logstash / 日志摄取 URL** —— 内部可观测性基础设施
- **Confluence wiki 页面链接** —— 通常是仅限工程团队的文档 / 机密
- **Google Drive 文档 URL** —— 发布者内部文档
- **AWS 访问密钥 ID** —— 长期有效的凭证
- **Slack token** —— 长期有效的 API 凭证
- **通用的高熵十六进制字符串** —— 可能是密钥 / 机密
输出是供应商中立的:模式类别描述了可观察到的字符串内容,而不是特定的发布者。
## 为什么
2026-06-05 的压力测试暴露了一类现有工具未覆盖的新的攻击面:
- **样本 A**(`GameAssembly.dll`):16,236 个 Google Drive URL 匹配项 —— 绝大多数是发布者内部的设计文档。
- **样本 B**(`CrimsonDesert.exe`):一个带有内嵌认证的 Sentry DSN、一个 Logstash 摄取 URL、一个内部开发服务器 URL,以及一个 Confluence wiki 页面链接 —— 全部为明文,均未受到加密虚拟机字节码防篡改机制的保护。
`re-leak-scan` 填补了这一空白。它是**纯 Python** 的(不依赖 .NET,不需要系统工具),适用于任何二进制文件,并且是 `re-leak-scan` 和 `re-telemetry-extract` 技能的 .re-leak-scan / .re-telemetry-extract 基础。
## 工具
| 工具 | 作用 |
|---|---|
| `check_leak_scan` | 健康检查 —— 返回模式目录 + `httpx` 可用性 |
| `extract_strings` | 遍历文件,提取 ASCII + UTF-16LE 可打印字符串 |
| `find_secrets` | 在二进制文件的字符串表上应用正则表达式目录 |
| `scan` | 完整流水线:提取 → 应用所有检测器 → 返回结果 |
| `verify_sentry_dsn` | 解析 Sentry DSN + 探测 `/api/0/projects/.../` 以确认其是否活跃 |
| `verify_confluence_url` | 探测 Confluence URL 以确认可达性 + 匿名访问权限 |
## 安装
RE-AI 插件的一部分;`./install.sh` 会安装该包。要独立安装:
```
pip install -e ./servers/re-leak-scan
# 可选:实时验证(Sentry / Confluence HTTP probes)
pip install -e './servers/re-leak-scan[verify]'
```
## 运行
```
re-leak-scan # stdio transport (default for MCP)
python -m re_leak_scan # equivalent
```
## 模式目录
这 7 种模式定义在 `src/re_leak_scan/patterns.py` 中。添加一个新模式只需要 6 行 dataclass 条目。这些模式都是**供应商中立的** —— 它们匹配公共基础设施(Sentry.io、Logstash、Atlassian Confluence、Google Docs)的 URL 方案,而不命名任何特定的发布者。
## 主动验证
`verify_sentry_dsn` 和 `verify_confluence_url` 会发起出站 HTTP 请求。默认情况下,它们是*被动*的 —— 它们只检查 endpoint 是否有响应。它们**不会**提交伪造的崩溃报告,不会进行认证,也不会渗漏已泄露的数据。
如果您在气隙环境中运行这些工具,验证器将返回 `verified: false, reason: "connection failed: ..."` —— 泄露检测本身不受影响。
标签:MCP服务, Python, StruQ, 二进制分析, 云安全运维, 敏感信息扫描, 无后门, 瑞士军刀, 网络安全审计, 运行时操纵, 逆向工具