nikky-001/AI-System-Health-Analyzer

GitHub: nikky-001/AI-System-Health-Analyzer

基于机器学习的系统健康监测与评分预测工具,融合实时监控与可视化分析。

Stars: 1 | Forks: 0

# 🖥️ AI 系统健康分析器 ## 📌 概述 AI 系统健康分析器是一个基于机器学习(ML)的系统,用于监控系统性能指标并预测整体**健康评分(0–100)**。 它通过分析 CPU 使用率、内存使用率、温度、运行时长和网络活动等参数,实时判断系统健康状况。 ## 🚀 功能特性 * 📊 实时系统监控 * 🤖 基于机器学习的健康预测 * 📈 使用 Streamlit 的交互式仪表板 * ⚠️ 错误追踪与异常洞察 * 📉 趋势分析(CPU、内存、健康评分) * ⚡ 支持跨平台部署的 ONNX 模型 ## 🧠 模型输入 模型使用以下特征: 1. CPU 使用率(%) 2. 内存使用率(%) 3. 温度(°C) 4. 运行时长(秒) 5. 上传速度(字节/秒) 6. 下载速度(字节/秒) 7. 错误计数 ## 📤 输出结果 * **健康评分(0–100)** ### 📊 健康等级分类: * **90 – 100 → 健康 ✅** * **65 – 89 → 良好 👍** * **40 – 64 → 降级 ⚠️** * **低于 40 → 严重 ❌** ## ⚙️ 安装步骤 ### 第一步:获取项目 您可以选择克隆仓库或直接下载 ZIP 包: ``` git clone cd ai-system-health-analyzer ``` ### 第二步:安装依赖 请确保当前位于 **项目根目录**,然后运行: ``` pip install -r requirements.txt ``` ## ▶️ 使用方法 ### 🔹 1. 生成数据集(仅首次需要) ``` python -m scripts.generate_dataset ``` ### 🔹 2. 清洗数据 ``` python -m scripts.data_cleaning ``` ### 🔹 3. 训练模型 ``` python -m scripts.train_model ``` ### 🔹 4. 运行预测(命令行) ``` python main.py ``` ### 🔹 5. 运行 UI 应用程序(弹窗) ``` python scripts/ui_app.py ``` ### 🔹 6. 运行仪表板 ``` streamlit run dashboard/app.py ``` ## 📊 仪表板功能 * 关键性能指标(KPI):CPU、内存、健康评分 * 基于时间过滤(分钟级) * 趋势可视化 * 网络流量图表 * 错误分布分析 ## 🏗️ 项目结构 ``` ai-system-health-analyzer/ │ ├── scripts/ │ ├── collector.py │ ├── scorer.py │ ├── generate_dataset.py │ ├── data_cleaning.py │ ├── train_model.py │ ├── predict.py │ └── ui_app.py │ ├── utils/ │ └── metrics.py │ ├── dashboard/ │ └── app.py │ ├── data/ │ ├── system_data.csv │ └── clean_system_data.csv │ ├── models/ | ├── health_model.onnx │ ├── health_model.pkl │ └── scaler.pkl | ├── main.py ├── convert_to_onnx.py ├── .gitignore ├── requirements.txt ├── PROJECT_OVERVIEW.md └── README.md ``` ## 🔄 工作流程 1. 收集系统指标 2. 生成数据集 3. 清洗数据 4. 训练模型 5. 预测健康评分 6. 使用仪表板可视化 ## 📦 部署使用 本项目提供一个可直接部署的版本: 👉 https://github.com/nikky-001/AI-System-Health-Analyzer-Runtime 该版本在原有项目基础上扩展了以下功能: * 实时健康监控 * 基于趋势的分析 * 智能告警生成 * 系统级集成支持 无需重新训练即可直接用于 PC、路由器及嵌入式系统。 请参考其官方文档获取安装与集成说明。 ## ⚠️ 注意事项 * 数据集生成仅在首次需要 * 添加新数据后应重新训练模型 * 预测时需确保特征一致性 * 错误计数与网络速度为派生特征 ## 🧪 后续改进计划 * 引入时间序列预测模型以提升未来预测能力 * 增强特征工程,提高模型准确性 * 实现自动模型重训练(基于新数据) * 支持更多系统指标(磁盘 I/O 等) * 改进数据预处理与噪声处理 * 优化大规模与高频率数据处理性能
标签:AI系统健康监控, CNCF毕业项目, CPU监控, KPI指标, Kubernetes, ONNX模型, Streamlit仪表盘, 云安全, 健康评分, 内存监控, 动态可视化, 异常检测, 性能指标, 数据清洗, 数据生成, 时间序列分析, 机器学习预测, 模型训练, 模型部署, 温度监控, 特征工程, 端到端, 系统健康度评分, 系统性能, 网络活动监控, 趋势分析, 跨平台部署, 逆向工具, 错误跟踪