AnonymousDoubleBlind123/Malware-Analysis-with-LLM

GitHub: AnonymousDoubleBlind123/Malware-Analysis-with-LLM

该仓库提供了评估 ChatGPT 和 Gemini 在 PE 文件恶意软件分类任务中表现的学术复现包，量化比较了多个 LLM 的判断准确性与一致性。

Stars: 0 | Forks: 0

## 使用大型语言模型进行恶意软件分析本仓库包含用于复现和理解以下实验的材料：论文：使用大型语言模型进行恶意软件分析作者：因双盲评审而匿名会议/期刊：EASE 2026，英国格拉斯哥 ## 摘要我们评估了大型语言模型 (LLM) 在使用跨样本的固定 prompt 提供 Portable Executable (PE) 文件分块表示时的响应。我们比较了以下模型的输出： - ChatGPT (4o/5.2 thinking) - Gemini (3 fast) 目标：量化和分析在给定部分 PE 内容的情况下，LLM 判断/解释的一致性、准确性和失败模式。 ## 工具 -IDA: https://hex-rays.com/ida-free + https://hex-rays.com/classroom -Ghidra: https://github.com/nationalsecurityagency/ghidra -Radare2 + r2dec: https://github.com/radareorg/radare2 ## PE 样本样本 - 良性 PE：https://github.com/iosifache/DikeDataset - 恶意 PE：https://bazaar.abuse.ch/ - 标签：{benign, malicious} 本仓库中的存储内容出于安全和政策合规考虑，本仓库不包含原始的恶意软件二进制文件。相反，我们提供： - 加密哈希值 - Prompt 如果您需要原始样本，请使用提供的哈希值从授权的恶意软件共享平台获取，并遵守其访问规则。 ## 提示我们对所有样本使用**固定 prompt**，以控制 prompt 变量。 - Prompt 文件：`Prompt.docx` - Temperature / decoding 设置：默认 - 输出格式约束：0/1 ## 模型查询 ChatGPT - 模型：4o - 访问方式：UI - 运行日期范围：2025 年 12 月至 2026 年 1 月 ChatGPT - 模型：5.2 Thinking - 访问方式：UI - 运行日期范围：2026 年 2 月 Gemini - 模型：3 fast - 访问方式：UI - 运行日期范围：2025 年 12 月至 2026 年 2 月 ## 评估我们报告： - 分类指标：准确率 (accuracy)、精确率 (precision)、召回率 (recall)、F1

标签：C2, DAST, DLL 劫持, PE文件分析, 云资产清单, 大语言模型, 学术研究, 恶意软件分析, 机器学习评估, 逆向工程