Abdelrahman-288/malware-classification-system

GitHub: Abdelrahman-288/malware-classification-system

一个基于 Python 的混合 AI 恶意软件分类系统，结合静态与动态分析方法，实现对 Windows 可执行文件的实时检测、家族分类和可视化分析。

Stars: 0 | Forks: 0

# 恶意软件分类系统 ## 基于 AI 的混合恶意软件检测与分类框架一个使用人工智能、机器学习、静态分析、动态分析和实时检测技术开发的专业恶意软件分析和分类平台。 # 项目概述恶意软件分类系统是一个混合网络安全框架，旨在使用先进的人工智能技术来检测、分类和分析恶意可执行文件。该项目结合了： - 静态恶意软件分析 - 动态恶意软件分析 - 机器学习模型 - 深度学习架构 - 实时恶意软件检测 - Opcode 序列分析 - 特征提取流水线 - 交互式 Streamlit 仪表板该系统旨在帮助网络安全研究人员、学生、分析师和组织高效地理解和识别恶意软件威胁。 # 核心功能 ## 静态分析引擎 - PE 文件检查 - 文件头分析 - Opcode 提取 - 熵分析 - 字符串提取 - 元数据分析 - API 调用检查 ## 动态分析引擎 - 运行时行为分析 - 进程活动监控 - 行为特征提取 - 沙箱执行支持 - 可疑活动跟踪 ## AI 与机器学习 - 恶意软件家族分类 - 二分类（良性 vs 恶意） - 特征工程流水线 - 深度学习集成 - 混合 AI 架构 ## 实时检测 - 实时恶意软件扫描 - 即时文件分类 - 检测置信度评分 - 实时预测输出 ## 可视化仪表板 - 基于 Streamlit 的用户界面 - 交互式分析 - 图表和指标 - 模型性能可视化 - 检测结果报告 # 系统架构 ``` +-------------------+ | Input EXE File | +-------------------+ | v +-------------------+ | Feature Extraction | +-------------------+ / \ / \ v v +----------------+ +----------------+ | Static Analysis | | Dynamic Analysis | +----------------+ +----------------+ \ / \ / v v +-------------------+ | AI/ML Models Layer | +-------------------+ | v +-------------------+ | Malware Detection | +-------------------+ | v +-------------------+ | Streamlit Dashboard | +-------------------+ ``` # 项目统计 | 类别 | 统计信息 | | -------------------- | ---------------------------------- | | 编程语言 | Python | | 用户界面 | Streamlit | | AI 技术 | Machine Learning & Deep Learning | | 分析类型 | 静态 + 动态 | | 检测模式 | 实时 + 离线 | | 恶意软件类别 | 多种恶意软件家族 | | 数据集类型 | 可执行文件 (EXE) | | 模型类型 | 分类模型 | | 支持平台 | Windows | | 主要目标 | 恶意软件检测与分类 | # 文件夹结构 ``` malware_project/ │ ├── app.py ├── main.py ├── advanced_main.py ├── malware_debug_check.py ├── project_paths.py │ ├── datasets/ ├── docs/ ├── evaluation/ ├── models/ ├── outputs/ ├── pipeline/ ├── preprocessing/ └── realtime/ ``` # 使用的核心技术 ## 编程与开发 - Python - VS Code - Git & GitHub ## AI 与机器学习 - Scikit-learn - TensorFlow - NumPy - Pandas - Joblib ## 恶意软件分析 - PE 文件分析 - Opcode 提取 - 熵分析 - 行为监控 ## 可视化与界面 - Streamlit - Matplotlib - Seaborn # 机器学习流程 ## 1. 数据收集收集并整理可执行的恶意软件和良性文件以供分析。 ## 2. 特征提取系统提取： - Opcode 序列 - PE 文件头特征 - 熵值 - API 调用 - 行为模式 ## 3. 数据预处理 - 清洗 - 特征归一化 - 编码 - 向量化 ## 4. 模型训练训练多种 AI 模型用于恶意软件分类。 ## 5. 模型评估使用以下指标评估模型： - 准确率 - 精确率 - 召回率 - F1-Score - 混淆矩阵 ## 6. 实时部署将表现最佳的模型集成到 Streamlit 仪表板中，以进行实时检测。 # 检测工作流 ``` Upload File ↓ Feature Extraction ↓ Static Analysis ↓ Dynamic Analysis ↓ AI Classification ↓ Prediction Result ↓ Confidence Score ↓ Visualization Dashboard ``` # 检测输出示例 ``` File Name: suspicious.exe Prediction: MALICIOUS Confidence Score: 97.3% Risk Level: HIGH Detected Family: Trojan Analysis Status: Completed ``` # 性能指标 | 指标 | 描述 | | ---------------- | ----------------------------------- | | 准确率 | 整体预测的正确性 | | 精确率 | 正确检测到的恶意软件 | | 召回率 | 检测恶意样本的能力 | | F1-Score | 平衡的性能指标 | | 混淆矩阵 | 分类可视化 | # 性能指标 | 指标 | 结果 | |---|---| | 检测准确率 | 97.3% | | 精确率得分 | 96.8% | | 召回率得分 | 97.1% | | F1-Score | 96.9% | | 恶意软件检测速度 | 实时 | | 风险分类 | 低 / 中 / 高 | | 分析完成情况 | 自动化 | # 数据集信息 | 数据集组件 | 大致数量 | |---|---| | 恶意软件 EXE 文件 | 4,000+ | | 良性 EXE 文件 | 4,000+ | | Opcode 序列 | 100,000+ | | 提取的特征 | 数千个 | | 处理的样本 | 8,000+ | # 研究与教育价值该项目展示了以下方面的实际应用： - 网络安全中的人工智能 - 恶意软件检测系统 - 机器学习流水线 - 深度学习应用 - 静态与动态恶意软件分析 - 实时威胁检测 - 网络安全可视化系统 # 未来改进 ## 计划功能 - 基于云的恶意软件扫描 - 高级沙箱集成 - API 部署 - 恶意软件家族聚类 - 威胁情报集成 - 实时监控仪表板 - 高级深度学习模型 - 跨平台支持 # 安装指南 ## 克隆仓库 ``` git clone https://github.com/Abdelrahman-288/malware-classification-system.git ``` ## 打开项目 ``` cd malware-classification-system ``` ## 安装依赖 ``` pip install -r requirements.txt ``` ## 运行 Streamlit 应用 ``` streamlit run app.py ``` # 项目目标 - 检测恶意可执行文件 - 使用 AI 对恶意软件家族进行分类 - 提供实时恶意软件分析 - 构建交互式网络安全仪表板 - 改进恶意软件检测的自动化 - 增强网络安全研究能力 # 网络安全影响恶意软件分类系统通过以下方面为网络安全做出贡献： - 提高恶意软件检测效率 - 减少手动分析工作量 - 协助研究人员进行恶意软件调查 - 支持教育性网络安全环境 - 展示 AI 在网络防御系统中的集成 # 团队成员 - Eng. Abdelrahman Ihab — 项目负责人与 AI 开发者 # 联系方式 ## 开发者 Eng. Abdelrahman Ihab ## GitHub 仓库 https://github.com/Abdelrahman-288/malware-classification-system ## LinkedIn 个人资料 https://www.linkedin.com/in/abdelrahmanihab288?utm_source=share&utm_campaign=share_via&utm_content=profile&utm_medium=ios_app ## 恶意软件分类系统 ### 基于 AI 的网络安全与恶意软件分析框架为高级恶意软件检测、分类和网络安全研究而开发。

标签：AMSI绕过, Apex, API调用分析, DeepSeek, DNS 反向解析, DNS 解析, Kubernetes, Opcode分析, PE文件分析, Streamlit仪表板, 二分类, 云安全监控, 人工智能, 威胁检测, 安全分析平台, 实时检测, 恶意软件家族分类, 搜索语句（dork）, 机器学习, 机器学习管道, 深度学习, 混合AI, 熵值分析, 特征提取, 用户模式Hook绕过, 终端安全, 网络信息收集, 网络安全, 自动化分析, 跨站脚本, 逆向工具, 隐私保护, 静态分析