bikemazzell/stealer-log-processor
GitHub: bikemazzell/stealer-log-processor
一个用于从信息窃取器日志文件夹中批量提取并结构化输出凭据和自动填充数据的 Python CLI 工具。
Stars: 2 | Forks: 1
# Stealer Log 处理器
一个用于从 stealer-log 文件夹中提取凭据和自动填充数据的 Python CLI。它被 `telegram-processor` 作为外部脚本使用,用于扫描工作目录并将 `credentials.csv` 和 `autofills.csv` 写回同一目录。
## 功能
- 从文件名包含 `password` 的文本、CSV 和 TSV 文件中提取密码记录
- 从 `autofill` 目录内的文件或文件名包含 `autofill` 的文件中提取自动填充数据
- 确定性、去重后的输出被写入 `credentials.csv` 和 `autofills.csv`
- UTF-8 解码,跳过无法解码的行而不是中止整个文件的处理
- 流式文件发现和有界并发解析,避免在超大目录树中构建庞大的内存工作队列
- 批处理使用时默认静默输出,通过 `--verbose` 启用每个文件的进度和解析器错误报告
- 轻量级 CLI 包装器,包含用于解析器和发现逻辑的小型内部包
- 测试覆盖了 CLI 契约、发现规则、解析、序列化和端到端输出生成
## 用法
```
python3 main.py [--verbose]
```
### 参数
- `root_folder_path`:包含 stealer 日志的根文件夹路径
- `--verbose`:(可选)启用详细的日志输出
## 数据处理详情
### 凭据提取
- 处理文件名中包含 `password` 且扩展名为 `.csv`、`.tsv` 或 `.txt` 的文件
- 以如下格式提取凭据:`URL`、`USERNAME`、`PASSWORD`
- 处理多种凭据格式:
- `url:`、`user:`、`pass:` 格式
- `url:`、`username:`、`password:` 格式
- `url:`、`login:`、`password:` 格式
- 以 `user,pass,url` 格式将去重后的凭据输出到 `credentials.csv`
- 仅将上述标记视为字段前缀,而非其他文本中的子字符串匹配
### 自动填充数据提取
- 处理 Autofill 文件夹中的文件或文件名中包含 `autofill` 的文件
- 提取表单字段名称及其对应的值
- 处理制表符分隔和逐行格式
- 支持多种字段名称格式:
- 用于字段名称的 `form:`、`name:`
- 用于字段值的 `value:`
- 以 `form:value` 格式将去重后的数据对输出到 `autofills.csv`
- 保留第一个分隔符之后的值内容,包括嵌入的 `:` 字符
## 开发
- 内部代码位于 `stealer_log_processor/` 目录下
- `main.py` 仍然是 `telegram-processor` 使用的兼容性入口点
- `processes/` 中的遗留模块仍作为新实现的包装器
- 运行时路径使用流式发现生成器和有界的待处理 future 队列,因此大型提取归档树不会为每个文件分配一个 future
- 运行测试:
```
PYTEST_DISABLE_PLUGIN_AUTOLOAD=1 pytest -q
```
## 错误处理
- 优雅地处理以下情况:
- Unicode 解码错误
- 文件访问问题
- 格式错误的条目
- 不完整的凭据集
- 即使单个文件处理失败也会继续处理
## 许可证
MIT License
Copyright (c) 2025
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.
标签:CSV生成, HTTP工具, meg, Python, Stealer Log, TSV解析, 信息安全, 凭据解析, 口令提取, 威胁情报, 密码处理, 开发者工具, 攻击路径可视化, 数字取证, 数据提取, 数据清洗, 文本解析, 文档结构分析, 无后门, 网络安全审计, 自动化脚本, 自动填充提取, 逆向工具, 黑客工具