koustub1412/xai-powered-ensemble-ids

GitHub: koustub1412/xai-powered-ensemble-ids

基于堆叠集成学习和SHAP可解释AI的物联网入侵检测系统,解决传统IDS缺乏可解释性和误报率高的问题。

Stars: 0 | Forks: 0

# 🔐 基于 XAI 的 IoT 集成式入侵检测系统 ## 📌 概述 **物联网** 的快速增长已将数十亿智能设备连接到医疗保健、工业、交通运输和智慧城市中。虽然这种连接性提高了自动化和效率,但也显著增加了遭受网络攻击的风险。 本项目提出了一种**用于 IoT 入侵检测的可解释集成机器学习框架**,结合了: - 🧠 堆叠集成学习 - 🔎 基于 SHAP 的可解释人工智能 - 🌐 多数据集评估 - 💻 全栈部署 (FastAPI + React) 该系统不仅能检测入侵,还能解释*为什么*将某个网络实例归类为恶意行为。 ## 🚨 问题陈述 传统的入侵检测系统 (IDS): - ❌ 无法检测零日攻击 (基于签名的 IDS) - ❌ 产生大量误报 (基于异常的 IDS) - ❌ 缺乏可解释性 (黑盒 ML 模型) - ❌ 受到偏差-方差问题的困扰 (单一分类器) 我们需要一个: ✔ 鲁棒性强 ✔ 准确率高 ✔ 可解释 ✔ 兼容 IoT 的入侵检测框架。 ## 🧠 提出的架构 ### 🔹 Level-1 (基学习器) - K-近邻算法 - 决策树 - 逻辑回归 - 随机森林 ### 🔹 Level-2 (元学习器) - 多层感知机 这种**堆叠集成架构**提高了: - 检测准确率 - 模型稳定性 - 跨数据集的泛化能力 ## 🔍 可解释人工智能 为了消除黑盒行为,集成了基于 SHAP 的可解释性: - 特征贡献分析 - 人类可读的取证报告 - 类别概率细分 - 风险等级分类 系统会解释: - 检测到了什么攻击 - 为什么检测到它 - 哪些特征影响了决策 ## 📊 使用的数据集 该系统在基准入侵数据集上进行了评估: - **NSL-KDD** - **ToN-IoT** - **BoT-IoT** 它还支持上传 CSV 文件以进行自定义数据集测试。 ## 📈 性能亮点 集成模型实现了: - ~98%+ 准确率 (NSL-KDD 基准参考) - 高 MCC 分数 - 高 F1-score 稳定性 - 低 Log Loss - 减少了误报 堆叠集成优于单个 ML 分类器。 ## 🖥️ 系统功能 ### 🔹 功能特性 - 上传 IoT 数据集 (CSV) - 实时流量注入模拟 - 多类别攻击检测 - 风险分类 (低 / 中 / 高 / 严重) - 基于 SHAP 的可解释性 - SOC 风格仪表板可视化 - 历史流量日志存储 ### 🔹 非功能特性 - 可扩展的后端架构 - 模块化 ML 设计 - 轻量级推理 - 兼容 IoT 的处理能力 - 研究可扩展性 ## 🏗️ 技术栈 ### 后端 - Python - FastAPI - Scikit-learn - SHAP - NumPy / Pandas ### 前端 - React (Vite) - Chart.js / Recharts - 现代 SOC 风格 UI ### 数据库 - MongoDB (流量日志和历史存储) ## 📂 项目结构 ``` xai-powered-ensemble-ids/ │ ├── backend/ │ ├── app.py │ ├── model_loader.py │ ├── requirements.txt │ ├── frontend/ │ ├── src/ │ ├── package.json │ ├── README.md └── .gitignore ``` ## 🚀 如何运行 ### 1️⃣ 后端 ``` cd backend pip install -r requirements.txt uvicorn app:app --reload ``` 后端运行于: http://127.0.0.1:8000 ### 2️⃣ 前端 ``` cd frontend npm install npm run dev ``` 前端运行于:http://localhost:5173 ## 🎯 应用场景 - 智能家居安全 - 工业 IoT 防护 - 医疗物联网 - 智慧城市基础设施 - IoT 边缘部署 - 网络安全研究 ## 🧪 研究贡献 本项目的贡献在于: - 集成堆叠集成 + 可解释人工智能 - 支持多种 IoT 数据集 - 提供可部署的架构 - 提供透明的取证见解 - 在保持高准确率的同时减少误报 ## 👨‍💻 作者 - Koustub Maktal - Rigved Katukam - Ladella Sirivalli
标签:Apex, AV绕过, Beacon Object File, BoT-IoT, CISA项目, FastAPI, forensic reports, MLP多层感知机, NSL-KDD, React, SHAP值分析, Syscalls, ToN-IoT, 入侵检测系统, 医疗物联网安全, 可解释人工智能, 域名收集, 堆叠集成学习, 安全数据湖, 密码管理, 工业物联网, 异常检测, 恶意攻击识别, 插件系统, 智慧城市安全, 机器学习, 深度学习, 物联网安全, 网络安全, 网络流量分析, 逆向工具, 随机森林, 隐私保护, 零日攻击检测