fulvius31/vllm-binary-cache-unpacker

GitHub: fulvius31/vllm-binary-cache-unpacker

一款将 vLLM 的二进制编译缓存解包为可读目录结构的调试工具,便于开发者检查缓存内容、生成代码和元数据。

Stars: 2 | Forks: 0

# vLLM Binary Cache 解包器 vLLM 的编译缓存产物现在默认**保存为单个二进制文件**(standalone Inductor artifact)。该工具将**现有的 vLLM 二进制缓存产物**转换为**解压后的目录布局**,以便您**检查**其中的内容(缓存内容 / 生成的代码 / 元数据)而无需重新编译。 ## 功能 - 输入:vLLM 二进制缓存产物文件(例如 `.../torch_compile_cache/.../artifact_compile_range_...`) - 输出:一个包含恢复的缓存文件(以及可选的额外人类可读代码转储)的“unpacked”文件夹 ## 用法 ``` python vllm_binary_cache_unpack.py \ --input /path/to/vllm_binary_artifact \ --output ./artifact_unpacked \ --overwrite ``` 可选(更快,跳过额外的代码转储): ``` python vllm_binary_cache_unpack.py \ --input /path/to/vllm_binary_artifact \ --output ./artifact_unpacked \ --overwrite \ --no-output-code ``` ## 注意事项 * 请使用与生成缓存时**相同的 PyTorch 构建/版本**运行此工具,否则可能由于缓存键不匹配导致加载失败。 * 这旨在用于对现有缓存进行**检查/调试**;它不会创建新的编译产物。
标签:AI基础设施, DLL 劫持, Inductor, Python, PyTorch, vLLM, 二进制解包, 人工智能, 凭据扫描, 大语言模型, 威胁情报, 开发者工具, 性能优化, 文件解析, 无后门, 检测绕过, 模型推理, 深度学习, 用户模式Hook绕过, 缓存文件, 编译缓存, 逆向分析, 逆向工具