AIML-Engineering-Lab/007_anomaly_detection_dimensionality
GitHub: AIML-Engineering-Lab/007_anomaly_detection_dimensionality
一个演示 t-SNE、UMAP 降维与 Isolation Forest 异常检测的教学项目,应用于工业传感器数据的故障检测场景。
Stars: 0 | Forks: 0
# 文章 007 — 异常检测与降维:t-SNE, UMAP, Isolation Forest
**AI Engineering Lab 系列** | 时代 1:经典机器学习
## 概述
本项目演示了用于异常检测和高级降维的 t-SNE、UMAP 和 Isolation Forest —— 应用于两个真实的故障检测问题,这些场景中的异常罕见且未标记。
| 概念 | 描述 |
|---|---|
| **t-SNE** | 保留局部邻域结构的非线性降维方法 |
| **Perplexity** | t-SNE 超参数:控制局部结构与全局结构之间的平衡 |
| **UMAP** | 比 t-SNE 更快的替代方案,同时保留全局拓扑结构 |
| **Isolation Forest** | 通过随机划分隔离离群点来进行异常检测 |
| **Contamination** | Isolation Forest 参数:数据中异常值的预期比例 |
| **Anomaly Score** | 分数越高 = 越孤立 = 越异常 |
## 数据集
### 数据集 A:喷气引擎传感器异常检测
- **行数:** 4,650 | **异常率:** 3.2% | **特征:** 8 个传感器读数
- **异常类型:** 涡轮过热、油压损失、扇叶不平衡
### 数据集 B:硅片热点检测(后硅验证)
- **行数:** 9,300 | **异常率:** 3.2% | **特征:** 8 个热/电指标
- **异常类型:** 热失控、IR 压降热点、漏电尖峰
## 快速开始
```
git clone https://github.com/AIML-Engineering-Lab/007_anomaly_detection_dimensionality.git
cd 007_anomaly_detection_dimensionality
pip install -r requirements.txt
python src/data_generator.py
jupyter notebook notebooks/
```
*属于 [AI Engineering Lab](https://github.com/AIML-Engineering-Lab) 系列。*
标签:Apex, impacket, Isolation Forest, NoSQL, Python, Scikit-learn, t-SNE, UMAP, 人工智能, 传感器数据分析, 孤立森林, 工业互联网, 异常检测, 故障检测, 数据科学, 数据预处理, 无后门, 无监督学习, 机器学习, 热点检测, 特征工程, 用户模式Hook绕过, 经典机器学习, 航空发动机, 资源验证, 逆向工具, 降维, 预测性维护