koustub1412/xai-powered-ensemble-ids
GitHub: koustub1412/xai-powered-ensemble-ids
基于堆叠集成学习和SHAP可解释AI的物联网入侵检测系统,解决传统IDS缺乏可解释性和误报率高的问题。
Stars: 0 | Forks: 0
# 🔐 基于 XAI 的 IoT 集成式入侵检测系统
## 📌 概述
**物联网** 的快速增长已将数十亿智能设备连接到医疗保健、工业、交通运输和智慧城市中。虽然这种连接性提高了自动化和效率,但也显著增加了遭受网络攻击的风险。
本项目提出了一种**用于 IoT 入侵检测的可解释集成机器学习框架**,结合了:
- 🧠 堆叠集成学习
- 🔎 基于 SHAP 的可解释人工智能
- 🌐 多数据集评估
- 💻 全栈部署 (FastAPI + React)
该系统不仅能检测入侵,还能解释*为什么*将某个网络实例归类为恶意行为。
## 🚨 问题陈述
传统的入侵检测系统 (IDS):
- ❌ 无法检测零日攻击 (基于签名的 IDS)
- ❌ 产生大量误报 (基于异常的 IDS)
- ❌ 缺乏可解释性 (黑盒 ML 模型)
- ❌ 受到偏差-方差问题的困扰 (单一分类器)
我们需要一个:
✔ 鲁棒性强
✔ 准确率高
✔ 可解释
✔ 兼容 IoT
的入侵检测框架。
## 🧠 提出的架构
### 🔹 Level-1 (基学习器)
- K-近邻算法
- 决策树
- 逻辑回归
- 随机森林
### 🔹 Level-2 (元学习器)
- 多层感知机
这种**堆叠集成架构**提高了:
- 检测准确率
- 模型稳定性
- 跨数据集的泛化能力
## 🔍 可解释人工智能
为了消除黑盒行为,集成了基于 SHAP 的可解释性:
- 特征贡献分析
- 人类可读的取证报告
- 类别概率细分
- 风险等级分类
系统会解释:
- 检测到了什么攻击
- 为什么检测到它
- 哪些特征影响了决策
## 📊 使用的数据集
该系统在基准入侵数据集上进行了评估:
- **NSL-KDD**
- **ToN-IoT**
- **BoT-IoT**
它还支持上传 CSV 文件以进行自定义数据集测试。
## 📈 性能亮点
集成模型实现了:
- ~98%+ 准确率 (NSL-KDD 基准参考)
- 高 MCC 分数
- 高 F1-score 稳定性
- 低 Log Loss
- 减少了误报
堆叠集成优于单个 ML 分类器。
## 🖥️ 系统功能
### 🔹 功能特性
- 上传 IoT 数据集 (CSV)
- 实时流量注入模拟
- 多类别攻击检测
- 风险分类 (低 / 中 / 高 / 严重)
- 基于 SHAP 的可解释性
- SOC 风格仪表板可视化
- 历史流量日志存储
### 🔹 非功能特性
- 可扩展的后端架构
- 模块化 ML 设计
- 轻量级推理
- 兼容 IoT 的处理能力
- 研究可扩展性
## 🏗️ 技术栈
### 后端
- Python
- FastAPI
- Scikit-learn
- SHAP
- NumPy / Pandas
### 前端
- React (Vite)
- Chart.js / Recharts
- 现代 SOC 风格 UI
### 数据库
- MongoDB (流量日志和历史存储)
## 📂 项目结构
```
xai-powered-ensemble-ids/
│
├── backend/
│ ├── app.py
│ ├── model_loader.py
│ ├── requirements.txt
│
├── frontend/
│ ├── src/
│ ├── package.json
│
├── README.md
└── .gitignore
```
## 🚀 如何运行
### 1️⃣ 后端
```
cd backend
pip install -r requirements.txt
uvicorn app:app --reload
```
后端运行于: http://127.0.0.1:8000
### 2️⃣ 前端
```
cd frontend
npm install
npm run dev
```
前端运行于:http://localhost:5173
## 🎯 应用场景
- 智能家居安全
- 工业 IoT 防护
- 医疗物联网
- 智慧城市基础设施
- IoT 边缘部署
- 网络安全研究
## 🧪 研究贡献
本项目的贡献在于:
- 集成堆叠集成 + 可解释人工智能
- 支持多种 IoT 数据集
- 提供可部署的架构
- 提供透明的取证见解
- 在保持高准确率的同时减少误报
## 👨💻 作者
- Koustub Maktal
- Rigved Katukam
- Ladella Sirivalli
标签:Apex, AV绕过, Beacon Object File, BoT-IoT, CISA项目, FastAPI, forensic reports, MLP多层感知机, NSL-KDD, React, SHAP值分析, Syscalls, ToN-IoT, 入侵检测系统, 医疗物联网安全, 可解释人工智能, 域名收集, 堆叠集成学习, 安全数据湖, 密码管理, 工业物联网, 异常检测, 恶意攻击识别, 插件系统, 智慧城市安全, 机器学习, 深度学习, 物联网安全, 网络安全, 网络流量分析, 逆向工具, 随机森林, 隐私保护, 零日攻击检测