daniyal3029/Network-Intrusion-Detection-UNSW-NB15-Ensemble

GitHub: daniyal3029/Network-Intrusion-Detection-UNSW-NB15-Ensemble

基于UNSW-NB15数据集,利用集成堆叠学习和贝叶斯优化技术构建的高性能网络入侵检测系统,在学术论文基线上实现了显著性能提升。

Stars: 0 | Forks: 0

# 🚀 UNSW-NB15 入侵检测系统 (IDS) — 通过集成与堆叠进行改进 ### 👨‍💻 作者: Daniyal Hyder ### 📊 项目类型: Data Science / Machine Learning ### 🎯 任务: 研究论文改进 (2025–2026) # 📌 概述 本项目基于以下研究论文,实现并**显著改进**了一个基于机器学习的入侵检测系统 (IDS): 🔗 [Frontiers in Computer Science (2025)](https://www.frontiersin.org/journals/computer-science/articles/10.3389/fcomp.2025.1520741/full) 使用的 **UNSW-NB15 dataset**: 🔗 [UNSW-NB15 数据集](https://research.unsw.edu.au/projects/unsw-nb15-dataset) # 🎯 目标 ✔ 复现论文中的基线 IDS ✔ 识别独立模型的局限性 ✔ 应用 **Advanced Ensemble Stacking** 与 **Bayesian Optimization** ✔ 实现 **90.10% 的准确率**(比基线提高了 +3%) # 🏗️ 系统工作流 我们改进的流水线采用多层堆叠架构,将原始网络数据转化为高精度的安全警报。 ![System Workflow](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/04923927a6132119.png) # 📈 最终结果对比 | 指标 | 基线论文 | 本项目 | 提升 | | :--- | :---: | :---: | :---: | | **Accuracy** | ~87.0% | **90.10%** | 🟢 **+3.10%** | | **F1-Score** | ~0.896 | **0.915** | 🟢 **+0.019** | | **ROC-AUC** | ~0.900 | **0.983** | 🟢 **+0.083** | # 📁 项目文档 如需深入了解技术细节和性能分析,请参阅以下文档: 1. 📄 **[差异日志](difference_log.md)**:基线与我们改进方案的详细对比,包含逐步的消融研究。 2. 📄 **[IEEE 格式报告](report/IEEE_Report.md)**:一份遵循 IEEE 标准的完整研究报告,包含 SHAP/LIME 分析。 # 📁 项目结构 ``` ├── Improved_IDS_UNSW_NB15.ipynb # Main Research Notebook ├── README.md # Project Overview ├── difference_log.md # Performance Comparison & Workflow └── report/ ├── IEEE_Report.md # Professional IEEE Report └── images/ # Extracted Plots & Diagrams ├── workflow_diagram.png # System Architecture ├── ablation_study_bars.png # Improvement Stages ├── roc_pr_comparison.png # Performance Curves ├── shap_importance.png # Global Interpretability └── lime_explanation.png # Local Interpretability ``` # ⚙️ 使用的技术 * **Python 3.12** * **集成模型**: XGBoost, LightGBM, CatBoost * **优化**: Optuna (贝叶斯优化) * **平衡**: SMOTETomek * **XAI**: SHAP, LIME # 🎓 结论 本项目证明了适当的工程改进——特别是 **Ensemble Stacking** 和 **Decision Threshold Optimization** ——可以显著提升机器学习系统在网络安全环境中的可靠性。 # 🚀 最终声明 **这项工作利用实用的数据科学技术,将一个基础的 IDS 转化为了一个高性能、可投入生产的系统。** # ⭐ 如果您喜欢这个项目,请考虑为本仓库加星!
标签:AMSI绕过, Apex, BSD, F1-Score, LIME分析, Python, ROC-AUC, SHAP分析, Stacking, UNSW-NB15数据集, 入侵检测系统, 准确率提升, 分类算法, 堆叠模型, 威胁检测, 安全数据湖, 异常检测, 数据挖掘, 数据科学, 无后门, 机器学习, 模型优化, 深度学习, 特征工程, 科研复现, 网络安全, 网络流量分析, 贝叶斯优化, 资源验证, 逆向工具, 隐私保护, 集成学习