mechinmay21/A-Hybrid-Approach-to-Static-Malware-Analysis-Using-Machine-Learning-And-Threat-Intelligence
GitHub: mechinmay21/A-Hybrid-Approach-to-Static-Malware-Analysis-Using-Machine-Learning-And-Threat-Intelligence
该项目通过结合机器学习与威胁情报的静态分析方法,解决安全运营中心事件响应中的上下文碎片化和高延迟问题。
Stars: 0 | Forks: 0
# 静态恶意软件分析混合方法:结合机器学习与威胁情报
关于静态恶意软件分析新项目的信息。内容包括仪表板图片、PDF格式的项目报告和PPTX格式的项目演示文稿。
本仓库作为技术组合,提供全面的学术论文报告、高级系统架构以及运行部署的界面预览。
## 项目概述
本项目旨在解决安全运营中心(SOC)事件响应中的关键瓶颈——特别是上下文碎片化和动态沙箱分析的高延迟问题。
通过用“向量化与推理”方法替代传统的“引爆观察”范式,本框架提供了一个本地化的高速分诊层。它成功地将高维静态机器学习推理与异步开源情报(OSINT)路由相结合,构建出“零转向”仪表板。
# 关键性能指标
* **准确性与有效性**:第1阶段二进制分诊准确率达到98.45%,AUC值为0.992。
* **延迟降低**:利用基于CPU的多进程处理,将平均上下文时间(MTTC)降至每个负载<4.5秒。
* **资源优化**:推理期间内存占用保持在<150 MB,完全在本地Python虚拟环境中运行,无需超级监控程序依赖。
# 核心架构与功能
## 1. 高维特征向量化
* 使用EMBER 2024数据集训练双推理LightGBM引擎。
* 无需引爆负载,即可提取结构异常和字节级统计信息(例如,2D滚动香农熵)。
* 实现MurmuHash3算法,将可变长度导入地址表(IAT)压缩为严格的数值向量空间。
## 2. 自动化OSINT聚合
* 设计异步API路由,全局丰富本地机器学习概率。
* 聚合来自VirusTotal和Abuse.ch(ThreatFox, MalwareBazaar, YARAify)的JSON遥测数据,即时检索C2基础设施、检测率和YARA触发器。
## 3. 零信任遏制与解除威胁
* 使用`pyzipper`构建递归提取引擎,安全解包深度混淆/密码保护的嵌套存档。
* 通过`.mdat`解除威胁协议实现自动化隔离,该协议在结构上剥离文件扩展名,为一级分析师中和负载执行风险。
# 技术与框架
* **语言**:Python 3.10
* **机器学习**:LightGBM, Scikit-Learn
* **数据处理**:NumPy, Pandas, JSON
* **前端**:Streamlit, CSS
* **二进制反汇编与提取**:pefile, pyzipper, py7zr, tarfile
标签:Apex, DAST, EMBER数据集, Kubernetes, LightGBM, Python开发, SOC优化, 云安全监控, 低延迟, 哈希算法, 威胁情报, 安全运营中心, 开发者工具, 异步API, 恶意软件分析, 情报聚合, 机器学习, 特征工程, 网络安全, 网络映射, 自动化威胁检测, 逆向工具, 隐私保护, 静态分析, 高性能计算