TTOD-SOL/precise-anomaly-detection-v01

GitHub: TTOD-SOL/precise-anomaly-detection-v01

一个面向工业传感器数据、以精准度优先为核心设计理念的异常检测系统,通过鲁棒统计和规则堆叠最小化误报,解决运维中告警疲劳问题。

Stars: 0 | Forks: 0

# 精准异常检测 — 精准度优先告警 一个针对一件事进行优化的多变量传感器异常检测器:**不误报。** 在生产维护环境中,低精度的告警系统往往会被无视——而被无视的告警意味着错失真正的故障。本系统利用鲁棒统计学和规则堆叠,结合精度门槛,提供技术人员真正信赖的告警。 ## 工程权衡 异常检测模型通常使用 F1 进行评估——即精度和召回率的调和平均数。但对于生产维护告警而言,F1 是一个错误的指标。 考虑两个监控 12,000 个每小时传感器读数的系统: | | 召回率优先 | **精准度优先(本系统)** | |---|---|---| | 捕获到的真实异常 | 80% | 3.5% | | 每周的误报数 | ~150 | **~1** | | 一个月后的技术人员信任度 | 零 | 高 | | 因告警被无视而错失的真实故障 | 许多 | 极少 | 召回率优先的系统具有更好的 F1 分数。而精准度优先的系统才是实际会被使用的系统。 本项目针对的是第二列进行了优化。 ## 工作原理 检测器在发出告警前需要**多个独立条件同时满足**: 1. 每个传感器通道(振动、温度、电流)上的鲁棒统计阈值 2. 多信号一致性门槛(例如:振动异常 *且* 电流异常) 3. 规则堆叠 — 每条告警都带有一个可解释的原因代码,而不是黑盒评分 当告警触发时,技术人员能看到*原因*:哪些通道触发了,严重程度如何,以及原因。没有神秘莫测的异常评分。 ## 快速开始 ``` pip install -r requirements.txt python src/generate_sensor_data.py # synthesize 12,000 multivariate samples with injected faults python src/detect_anomalies.py # run the precision-first detector python src/evaluate.py # compute confusion matrix and metrics ``` ## 结果(示例运行) - **合成数据集:** 12,000 行多变量传感器数据 - **注入的真实异常:** 2,600 个 - **发出的告警数:** 27 条 - **精准度:0.989** — 27 条告警中有 26 条是真实的 - **召回率:0.035** — 按照设计,大多数微妙的异常被过滤掉了 - **告警构成:** 每条告警均由多信号一致性触发(例如:振动 + 电流) ### 如何解读这些数字 此配置针对曲线的高精度端进行了优化。`src/detect_anomalies.py` 中的阈值参数暴露了精准度/召回率调节开关——将其反方向调整,同一引擎即可生成一个召回率优先的检测器。本项目的重点在于告警的*可配置性*和*触发告警的可解释性*,而不是在合成数据上的原始 F1 分数。 在实际部署中,阈值将进行调整,以匹配特定设施中误报与漏报故障的成本——并且将根据技术人员对每条告警的确认结果进行持续再训练。 ## 告警输出格式 每条告警包括: - `timestamp` - `vibration_g`, `temp_c`, `current_a` (传感器读数) - `anomaly_score` (严重程度) - `reason` (可解释代码,例如,`VIB+AMPS` 代表振动 + 电流一致性) 此格式旨在直接导入维护工单系统,无需进一步解释。 ## 相关工作 - [maintenance-intelligence-system](https://github.com/TTOD-SOL/maintenance-intelligence-system) — 包含故障分类和技术人员反馈学习的完整预测性维护技术栈 - [downtime-analytics-pipeline-V01](https://github.com/TTOD-SOL/downtime-analytics-pipeline-V01) — 可靠性 KPI 流水线 (MTBF/MTTR) ## 关于 由 Onoray Davis III 构建。美国空军退伍军人(战术飞机维护),FedEx Ground 维护技师,以及 AI/ML 工程师,致力于构建监控我曾经维护过的设备的系统。 联系方式:trusiv1@gmail.com
标签:Apex, Python, 传感器数据融合, 假阳率控制, 可解释性, 合成数据, 告警疲劳, 多变量传感器数据, 工业物联网, 异常检测, 振动分析, 故障检测, 数据科学, 无后门, 机器学习, 混淆矩阵, 温度监控, 生产维护, 电流监控, 精准报警, 规则叠加, 资源验证, 逆向工具, 降低误报, 预测性维护, 鲁棒统计