fulvius31/vllm-binary-cache-unpacker
GitHub: fulvius31/vllm-binary-cache-unpacker
一款将 vLLM 的二进制编译缓存解包为可读目录结构的调试工具,便于开发者检查缓存内容、生成代码和元数据。
Stars: 2 | Forks: 0
# vLLM Binary Cache 解包器
vLLM 的编译缓存产物现在默认**保存为单个二进制文件**(standalone Inductor artifact)。该工具将**现有的 vLLM 二进制缓存产物**转换为**解压后的目录布局**,以便您**检查**其中的内容(缓存内容 / 生成的代码 / 元数据)而无需重新编译。
## 功能
- 输入:vLLM 二进制缓存产物文件(例如 `.../torch_compile_cache/.../artifact_compile_range_...`)
- 输出:一个包含恢复的缓存文件(以及可选的额外人类可读代码转储)的“unpacked”文件夹
## 用法
```
python vllm_binary_cache_unpack.py \
--input /path/to/vllm_binary_artifact \
--output ./artifact_unpacked \
--overwrite
```
可选(更快,跳过额外的代码转储):
```
python vllm_binary_cache_unpack.py \
--input /path/to/vllm_binary_artifact \
--output ./artifact_unpacked \
--overwrite \
--no-output-code
```
## 注意事项
* 请使用与生成缓存时**相同的 PyTorch 构建/版本**运行此工具,否则可能由于缓存键不匹配导致加载失败。
* 这旨在用于对现有缓存进行**检查/调试**;它不会创建新的编译产物。
标签:AI基础设施, DLL 劫持, Inductor, Python, PyTorch, vLLM, 二进制解包, 人工智能, 凭据扫描, 大语言模型, 威胁情报, 开发者工具, 性能优化, 文件解析, 无后门, 检测绕过, 模型推理, 深度学习, 用户模式Hook绕过, 缓存文件, 编译缓存, 逆向分析, 逆向工具