nikky-001/AI-System-Health-Analyzer
GitHub: nikky-001/AI-System-Health-Analyzer
基于机器学习的系统健康监测与评分预测工具,融合实时监控与可视化分析。
Stars: 1 | Forks: 0
# 🖥️ AI 系统健康分析器
## 📌 概述
AI 系统健康分析器是一个基于机器学习(ML)的系统,用于监控系统性能指标并预测整体**健康评分(0–100)**。
它通过分析 CPU 使用率、内存使用率、温度、运行时长和网络活动等参数,实时判断系统健康状况。
## 🚀 功能特性
* 📊 实时系统监控
* 🤖 基于机器学习的健康预测
* 📈 使用 Streamlit 的交互式仪表板
* ⚠️ 错误追踪与异常洞察
* 📉 趋势分析(CPU、内存、健康评分)
* ⚡ 支持跨平台部署的 ONNX 模型
## 🧠 模型输入
模型使用以下特征:
1. CPU 使用率(%)
2. 内存使用率(%)
3. 温度(°C)
4. 运行时长(秒)
5. 上传速度(字节/秒)
6. 下载速度(字节/秒)
7. 错误计数
## 📤 输出结果
* **健康评分(0–100)**
### 📊 健康等级分类:
* **90 – 100 → 健康 ✅**
* **65 – 89 → 良好 👍**
* **40 – 64 → 降级 ⚠️**
* **低于 40 → 严重 ❌**
## ⚙️ 安装步骤
### 第一步:获取项目
您可以选择克隆仓库或直接下载 ZIP 包:
```
git clone
cd ai-system-health-analyzer
```
### 第二步:安装依赖
请确保当前位于 **项目根目录**,然后运行:
```
pip install -r requirements.txt
```
## ▶️ 使用方法
### 🔹 1. 生成数据集(仅首次需要)
```
python -m scripts.generate_dataset
```
### 🔹 2. 清洗数据
```
python -m scripts.data_cleaning
```
### 🔹 3. 训练模型
```
python -m scripts.train_model
```
### 🔹 4. 运行预测(命令行)
```
python main.py
```
### 🔹 5. 运行 UI 应用程序(弹窗)
```
python scripts/ui_app.py
```
### 🔹 6. 运行仪表板
```
streamlit run dashboard/app.py
```
## 📊 仪表板功能
* 关键性能指标(KPI):CPU、内存、健康评分
* 基于时间过滤(分钟级)
* 趋势可视化
* 网络流量图表
* 错误分布分析
## 🏗️ 项目结构
```
ai-system-health-analyzer/
│
├── scripts/
│ ├── collector.py
│ ├── scorer.py
│ ├── generate_dataset.py
│ ├── data_cleaning.py
│ ├── train_model.py
│ ├── predict.py
│ └── ui_app.py
│
├── utils/
│ └── metrics.py
│
├── dashboard/
│ └── app.py
│
├── data/
│ ├── system_data.csv
│ └── clean_system_data.csv
│
├── models/
| ├── health_model.onnx
│ ├── health_model.pkl
│ └── scaler.pkl
|
├── main.py
├── convert_to_onnx.py
├── .gitignore
├── requirements.txt
├── PROJECT_OVERVIEW.md
└── README.md
```
## 🔄 工作流程
1. 收集系统指标
2. 生成数据集
3. 清洗数据
4. 训练模型
5. 预测健康评分
6. 使用仪表板可视化
## 📦 部署使用
本项目提供一个可直接部署的版本:
👉 https://github.com/nikky-001/AI-System-Health-Analyzer-Runtime
该版本在原有项目基础上扩展了以下功能:
* 实时健康监控
* 基于趋势的分析
* 智能告警生成
* 系统级集成支持
无需重新训练即可直接用于 PC、路由器及嵌入式系统。
请参考其官方文档获取安装与集成说明。
## ⚠️ 注意事项
* 数据集生成仅在首次需要
* 添加新数据后应重新训练模型
* 预测时需确保特征一致性
* 错误计数与网络速度为派生特征
## 🧪 后续改进计划
* 引入时间序列预测模型以提升未来预测能力
* 增强特征工程,提高模型准确性
* 实现自动模型重训练(基于新数据)
* 支持更多系统指标(磁盘 I/O 等)
* 改进数据预处理与噪声处理
* 优化大规模与高频率数据处理性能
标签:AI系统健康监控, CNCF毕业项目, CPU监控, KPI指标, Kubernetes, ONNX模型, Streamlit仪表盘, 云安全, 健康评分, 内存监控, 动态可视化, 异常检测, 性能指标, 数据清洗, 数据生成, 时间序列分析, 机器学习预测, 模型训练, 模型部署, 温度监控, 特征工程, 端到端, 系统健康度评分, 系统性能, 网络活动监控, 趋势分析, 跨平台部署, 逆向工具, 错误跟踪