kakshaykumar/malware-progression-detection

GitHub: kakshaykumar/malware-progression-detection

这是一篇恶意软件演变与检测技术的研究文献综述，提出将签名、行为和机器学习检测分层结合的混合框架以应对现代高级威胁。

Stars: 0 | Forks: 0

# 恶意软件演变与检测探索 ## 概述本研究项目探讨了恶意软件在过去几十年中的演变——从简单的病毒到勒索软件、无文件恶意软件和高级持续性威胁 (APTs) 等复杂威胁——并提出了一个混合检测框架，旨在解决任何单一检测方法的局限性。本文的核心论点非常直接：没有单一的检测方法足以单独应对。基于签名的检测速度快，但对新变体视而不见。基于行为的检测能捕获 runtime 异常，但需要更多的计算资源。机器学习可以泛化到未知威胁，但需要高质量的训练数据。所提出的框架将这三者分层结合，让每种方法都能弥补其他方法的盲区。这不是一个动手实践的项目——这是一篇为研究生级别网络安全课程撰写的研究和文献综述论文。重点是了解威胁态势，批判性地评估现有检测策略，并基于当前的学术文献提出一个有理论依据的混合模型。 ## 研究方法本研究基于对恶意软件演变和检测技术现有研究的定性文献综述。通过分析学术论文、行业报告和网络安全出版物，来识别恶意软件发展和检测策略的趋势。根据相关性、可信度和时效性选择资料来源，重点关注同行评审的研究和知名的网络安全组织。该研究将检测技术分为基于签名、基于行为和基于机器学习的方法，并根据文献中报告的发现评估它们的有效性。本研究未生成原始实验数据；而是综合了现有知识，以提供对恶意软件演变和现代检测机制的结构化理解。 ## 仓库结构 ``` malware-progression-detection/ │ ├── README.md ← You are here │ ├── research-docs/ │ └── exploration_of_malware_progression_and_detection.pdf ← Full research paper (formatted) │ ├── notes/ │ └── references.md ← Key sources with summaries and relevance notes │ ├── research-notes/ │ ├── malware-taxonomy.md ← Breakdown of malware types covered │ └── detection-techniques-comparison.md ← Side-by-side comparison of detection methods │ ├── diagrams/ │ └── hybrid-detection-architecture.md ← Conceptual architecture of the proposed framework └── detection-rules/ └── malware_detection.yar ← YARA signature rules for ransomware, polymorphic, fileless, APT ``` ## 研究范围本项目是对恶意软件演变和检测策略的结构化文献分析。它综合了来自学术界和工业界的发现，以呈现对现代网络安全挑战和解决方案的整合视角。 ## 核心问题传统的杀毒工具严重依赖签名匹配——将文件与已知的恶意软件指纹数据库进行比较。这对于以前见过的威胁很有效，但在以下情况面前却完全失效： - **多态恶意软件** —— 每次复制时都会重写自己的代码 - **变形恶意软件** —— 在保持行为不变的同时，完全重构其逻辑 - **无文件恶意软件** —— 完全驻留在内存中，从不触碰磁盘，不留下任何可匹配的文件签名这些并非边缘情况。它们是现代恶意软件的主要形式。正是这些情况促使了向基于行为和机器学习驱动的检测方式的转变。 ## 提议的检测框架本文提出的混合模型将三种检测策略分层组合： | 层级 | 方法 | 最适用于 | 局限性 | |---|---|---|---| | 1 | 基于签名 | 已知恶意软件 —— 速度快，开销低 | 对多态/变形变体视而不见 | | 2 | 基于行为 | Runtime 异常，无文件恶意软件 | 计算成本较高，可能存在误报 | | 3 | 机器学习 | 未知/零日威胁 | 需要高质量的标注训练数据 | 每一层都弥补了其他层的弱点。该系统还设计为模块化——随着威胁情报的演变，每个组件都可以独立更新。 ``` flowchart TD A[🔍 File / Process Input] --> B subgraph L1 [Layer 1 — Signature-Based Detection] B[Match against known malware signatures] end B -->|Known threat| BLOCK1[🚫 Block & Alert] B -->|Unknown — escalate| C subgraph L2 [Layer 2 — Behavior-Based Detection] C[Monitor runtime behavior & anomalies] end C -->|Suspicious behavior| BLOCK2[🚫 Block & Alert] C -->|Uncertain — escalate| D subgraph L3 [Layer 3 — Machine Learning Detection] D[Classify using trained ML model] end D -->|Malicious| BLOCK3[🚫 Block & Alert] D -->|Benign| ALLOW[✅ Allow] style L1 fill:#e6f1fb,stroke:#185fa5,color:#042c53 style L2 fill:#faeeda,stroke:#ba7517,color:#412402 style L3 fill:#eaf3de,stroke:#3b6d11,color:#173404 style BLOCK1 fill:#fcebeb,stroke:#a32d2d,color:#501313 style BLOCK2 fill:#fcebeb,stroke:#a32d2d,color:#501313 style BLOCK3 fill:#fcebeb,stroke:#a32d2d,color:#501313 style ALLOW fill:#eaf3de,stroke:#3b6d11,color:#173404 ``` ## 来自文献的关键发现 - 单纯的基于签名的检测对在每个感染周期都会发生变异的多态恶意软件几乎没有效果 (Sharma & Sahay, 2015) - 基于行为的检测对无文件恶意软件特别有效——当没有文件特征可供扫描时，这是唯一可行的方法 (Debar et al., 2008) - 在对照研究中，与传统的随机森林和深度学习模型相比，其检测率明显更高，误报率更低 (Souri & Hosseini, 2018; Azeem, 2023) - 混合/集成方法在检测率和对未知威胁的泛化能力上，始终优于单一方法的系统 (Odii, 2021) ## 检测规则（实践部分）为了弥合研究发现与实际应用之间的差距，本仓库包含了一套 YARA 规则集，展示了所提出的混合框架中基于签名的检测层在实践中会是怎样的。共包含四个规则，针对本文分析的恶意软件类别：勒索软件字符串指示器、多态引擎模式、无文件 PowerShell 执行（MITRE ATT&CK T1059.001）以及 APT 横向移动工具（MITRE T1021）。请参阅 detection-rules/malware_detection.yar。 ## 展现的技能与概念 - 威胁建模和恶意软件生命周期分析 - 对检测方法（基于签名、基于行为、基于机器学习）的批判性评估 - 文献综述和学术研究方法 - 混合/集成系统设计思维 - 对对抗性规避技术（多态、变形、无文件执行）的理解 - 应用于现实世界威胁类别的网络安全基础知识 - 为基于签名的检测（勒索软件、多态、无文件、APT）编写 YARA 规则，以及“将 MITRE ATT&CK TTP 映射到检测逻辑” ## 如何浏览本仓库从 [`research-notes/malware-taxonomy.md`](research-notes/malware-taxonomy.md) 开始，快速了解威胁类别。然后阅读 [`research-notes/detection-techniques-comparison.md`](research-notes/detection-techniques-comparison.md)，获取对这三种检测方法的并排比较。[`diagrams/hybrid-detection-architecture.md`](diagrams/hybrid-detection-architecture.md) 提供了关于各层如何交互的直观感受。完整论文位于 [`research-docs/`](research-docs/) 中。 ## 局限性本研究基于二次研究，不包含原始的实验验证或真实的部署测试。研究结果取决于所选文献的准确性和范围，这可能无法完全代表所有新兴的恶意软件技术。此外，网络安全快速演变的特点意味着可能无法完全捕捉到新的恶意软件变体和检测策略。本研究侧重于总体趋势，而非针对具体实现性能指标，这可能限制了其在高度专业化环境中的适用性。 ## 参考文献完整的带注释参考书目位于 [`notes/references.md`](notes/references.md) 中。精选的关键资料来源： - Sharma, A., & Sahay, S. K. (2015). Evolution and detection of polymorphic and metamorphic malware. - Debar, H., et al. (2008). Behavioral detection of malware: From a survey towards an established taxonomy. - Souri, A., & Hosseini, R. (2018). A state-of-the-art survey of malware detection approaches using data mining techniques. - Azeem, M. (2023). Analyzing and comparing the effectiveness of malware detection: A study of machine learning approaches. - Odii, J. (2021). Comparative analysis of malware detection techniques using signature, behaviour, and heuristics. **状态：** 文献综述已完成。目前未积极维护。 **范围：** 二次研究综述。无原始实验数据。 **已知局限：** 威胁态势快速演变；可能无法涵盖新的变体。

标签：AMSI绕过, Apex, DAST, 威胁检测, 恶意软件分析, 文献综述, 机器学习, 防御加固