mechinmay21/A-Hybrid-Approach-to-Static-Malware-Analysis-Using-Machine-Learning-And-Threat-Intelligence

GitHub: mechinmay21/A-Hybrid-Approach-to-Static-Malware-Analysis-Using-Machine-Learning-And-Threat-Intelligence

该项目通过结合机器学习与威胁情报的静态分析方法，解决安全运营中心事件响应中的上下文碎片化和高延迟问题。

Stars: 0 | Forks: 0

# 静态恶意软件分析混合方法：结合机器学习与威胁情报关于静态恶意软件分析新项目的信息。内容包括仪表板图片、PDF格式的项目报告和PPTX格式的项目演示文稿。本仓库作为技术组合，提供全面的学术论文报告、高级系统架构以及运行部署的界面预览。 ## 项目概述本项目旨在解决安全运营中心（SOC）事件响应中的关键瓶颈——特别是上下文碎片化和动态沙箱分析的高延迟问题。通过用“向量化与推理”方法替代传统的“引爆观察”范式，本框架提供了一个本地化的高速分诊层。它成功地将高维静态机器学习推理与异步开源情报（OSINT）路由相结合，构建出“零转向”仪表板。 # 关键性能指标 * **准确性与有效性**：第1阶段二进制分诊准确率达到98.45%，AUC值为0.992。 * **延迟降低**：利用基于CPU的多进程处理，将平均上下文时间（MTTC）降至每个负载<4.5秒。 * **资源优化**：推理期间内存占用保持在<150 MB，完全在本地Python虚拟环境中运行，无需超级监控程序依赖。 # 核心架构与功能 ## 1. 高维特征向量化 * 使用EMBER 2024数据集训练双推理LightGBM引擎。 * 无需引爆负载，即可提取结构异常和字节级统计信息（例如，2D滚动香农熵）。 * 实现MurmuHash3算法，将可变长度导入地址表（IAT）压缩为严格的数值向量空间。 ## 2. 自动化OSINT聚合 * 设计异步API路由，全局丰富本地机器学习概率。 * 聚合来自VirusTotal和Abuse.ch（ThreatFox, MalwareBazaar, YARAify）的JSON遥测数据，即时检索C2基础设施、检测率和YARA触发器。 ## 3. 零信任遏制与解除威胁 * 使用`pyzipper`构建递归提取引擎，安全解包深度混淆/密码保护的嵌套存档。 * 通过`.mdat`解除威胁协议实现自动化隔离，该协议在结构上剥离文件扩展名，为一级分析师中和负载执行风险。 # 技术与框架 * **语言**：Python 3.10 * **机器学习**：LightGBM, Scikit-Learn * **数据处理**：NumPy, Pandas, JSON * **前端**：Streamlit, CSS * **二进制反汇编与提取**：pefile, pyzipper, py7zr, tarfile

标签：Apex, DAST, EMBER数据集, Kubernetes, LightGBM, Python开发, SOC优化, 云安全监控, 低延迟, 哈希算法, 威胁情报, 安全运营中心, 开发者工具, 异步API, 恶意软件分析, 情报聚合, 机器学习, 特征工程, 网络安全, 网络映射, 自动化威胁检测, 逆向工具, 隐私保护, 静态分析, 高性能计算