TTOD-SOL/precise-anomaly-detection-v01
GitHub: TTOD-SOL/precise-anomaly-detection-v01
一个面向工业传感器数据、以精准度优先为核心设计理念的异常检测系统,通过鲁棒统计和规则堆叠最小化误报,解决运维中告警疲劳问题。
Stars: 0 | Forks: 0
# 精准异常检测 — 精准度优先告警
一个针对一件事进行优化的多变量传感器异常检测器:**不误报。**
在生产维护环境中,低精度的告警系统往往会被无视——而被无视的告警意味着错失真正的故障。本系统利用鲁棒统计学和规则堆叠,结合精度门槛,提供技术人员真正信赖的告警。
## 工程权衡
异常检测模型通常使用 F1 进行评估——即精度和召回率的调和平均数。但对于生产维护告警而言,F1 是一个错误的指标。
考虑两个监控 12,000 个每小时传感器读数的系统:
| | 召回率优先 | **精准度优先(本系统)** |
|---|---|---|
| 捕获到的真实异常 | 80% | 3.5% |
| 每周的误报数 | ~150 | **~1** |
| 一个月后的技术人员信任度 | 零 | 高 |
| 因告警被无视而错失的真实故障 | 许多 | 极少 |
召回率优先的系统具有更好的 F1 分数。而精准度优先的系统才是实际会被使用的系统。
本项目针对的是第二列进行了优化。
## 工作原理
检测器在发出告警前需要**多个独立条件同时满足**:
1. 每个传感器通道(振动、温度、电流)上的鲁棒统计阈值
2. 多信号一致性门槛(例如:振动异常 *且* 电流异常)
3. 规则堆叠 — 每条告警都带有一个可解释的原因代码,而不是黑盒评分
当告警触发时,技术人员能看到*原因*:哪些通道触发了,严重程度如何,以及原因。没有神秘莫测的异常评分。
## 快速开始
```
pip install -r requirements.txt
python src/generate_sensor_data.py # synthesize 12,000 multivariate samples with injected faults
python src/detect_anomalies.py # run the precision-first detector
python src/evaluate.py # compute confusion matrix and metrics
```
## 结果(示例运行)
- **合成数据集:** 12,000 行多变量传感器数据
- **注入的真实异常:** 2,600 个
- **发出的告警数:** 27 条
- **精准度:0.989** — 27 条告警中有 26 条是真实的
- **召回率:0.035** — 按照设计,大多数微妙的异常被过滤掉了
- **告警构成:** 每条告警均由多信号一致性触发(例如:振动 + 电流)
### 如何解读这些数字
此配置针对曲线的高精度端进行了优化。`src/detect_anomalies.py` 中的阈值参数暴露了精准度/召回率调节开关——将其反方向调整,同一引擎即可生成一个召回率优先的检测器。本项目的重点在于告警的*可配置性*和*触发告警的可解释性*,而不是在合成数据上的原始 F1 分数。
在实际部署中,阈值将进行调整,以匹配特定设施中误报与漏报故障的成本——并且将根据技术人员对每条告警的确认结果进行持续再训练。
## 告警输出格式
每条告警包括:
- `timestamp`
- `vibration_g`, `temp_c`, `current_a` (传感器读数)
- `anomaly_score` (严重程度)
- `reason` (可解释代码,例如,`VIB+AMPS` 代表振动 + 电流一致性)
此格式旨在直接导入维护工单系统,无需进一步解释。
## 相关工作
- [maintenance-intelligence-system](https://github.com/TTOD-SOL/maintenance-intelligence-system) — 包含故障分类和技术人员反馈学习的完整预测性维护技术栈
- [downtime-analytics-pipeline-V01](https://github.com/TTOD-SOL/downtime-analytics-pipeline-V01) — 可靠性 KPI 流水线 (MTBF/MTTR)
## 关于
由 Onoray Davis III 构建。美国空军退伍军人(战术飞机维护),FedEx Ground 维护技师,以及 AI/ML 工程师,致力于构建监控我曾经维护过的设备的系统。
联系方式:trusiv1@gmail.com
标签:Apex, Python, 传感器数据融合, 假阳率控制, 可解释性, 合成数据, 告警疲劳, 多变量传感器数据, 工业物联网, 异常检测, 振动分析, 故障检测, 数据科学, 无后门, 机器学习, 混淆矩阵, 温度监控, 生产维护, 电流监控, 精准报警, 规则叠加, 资源验证, 逆向工具, 降低误报, 预测性维护, 鲁棒统计