fingercd/SafeCommunity-AI
GitHub: fingercd/SafeCommunity-AI
Moniter是一个多模态AI智能视频监控系统,通过目标检测、异常识别和大模型审查,实现主动视频分析与报警。
Stars: 6 | Forks: 0
# Moniter — 多模态AI智能视频监控系统
[](https://www.python.org/)
[](https://pytorch.org/)
[](https://flask.palletsprojects.com)
[](LICENSE)
**YOLO检测 · ViT异常识别 · VLM语义审查**
[中文介绍](README-CN.md)
## Moniter是什么?
**Moniter**是一个多模态AI驱动的智能视频监控系统,它将 **YOLO目标检测**、**ViT视频异常识别**和**VLM视觉语言模型审查**这三级推理串联成一个统一的实时监控流水线。
与传统仅被动录像的系统不同,Moniter能够“理解”视频:
1. **感知层** — YOLOv8实时检测物体(人员、车辆、火、烟)。
2. **认知层** — VideoMAE v2 + MIL分析连续视频片段以识别异常行为。
3. **理解层** — Qwen-VL为异常事件生成语义描述(例如“打架”、“火灾”)。
目标用户:安防操作员、AI研究人员,以及任何需要自动化视频分析的人员。
## ✨ 核心亮点
- 🎥 **多源视频** — 支持RTSP流和本地文件,通过Web UI动态管理。
- 🧠 **三级AI流水线** — 检测 → 异常识别 → 语义审查,逐级精细化。
- 🌐 **优雅的Web仪表盘** — 毛玻璃风格UI,包含MJPEG流、状态面板和ROI绘制。
- 📊 **灵活的规则引擎** — ROI入侵、滞留时间、违禁物品、车辆超时报警。
- 🚀 **一键启动** — `python launch.py` 即可启动后端并打开浏览器。
## 🚀 快速开始
### 系统要求
- Python >= 3.10
- CUDA >= 11.8(推荐使用GPU,显存 >= 12 GB)
- Windows / Linux
### 安装
```
git clone RTSP / Local"] --> B["OpenCV Capture"] B --> C["YOLO + ByteTrack"] C --> D["Rule Engine
ROI / Dwell / Vehicle"] D --> E{"ViT Anomaly"} E -->|Normal| F["Frame Cache"] E -->|Anomaly| G["VLM Review
Qwen-VL"] G --> F F --> H["Flask API"] H --> I["Web Dashboard"] H --> J["Alert Push"] ``` ### 流水线详情 | 层级 | 输入 | 模型 | 输出 | |-------|-------|-------|--------| | **L1 YOLO** | 帧 (640×640) | YOLOv8-L | 边界框,82类,置信度 | | **L2 ViT** | 16帧片段 (224×224) | VideoMAE v2-Base + MIL | 异常概率 + 标签 | | **L3 VLM** | 触发的片段帧 | Qwen-VL(基础或微调版) | JSON: `{"classification":"...", "reason":"..."}` | ## 📁 项目结构 ``` moniter/ ├── launch.py # One-click launcher ├── predict.py # CLI real-time entry ├── config.yaml # Unified config │ ├── yolo/ # Object detection ├── Vit/ # Anomaly detection (VideoMAE v2 + MIL) ├── vlm/ # Vision-language review (Qwen-VL) └── web/ # Flask dashboard ``` ## ⚙️ 配置说明 `config.yaml` 中的关键字段: | 节 | 字段 | 默认值 | 说明 | |---------|-------|---------|-------------| | `sources` | `uri`, `type` | — | 视频源(文件 / rtsp) | | `streams` | `rois` | `[]` | ROI多边形 | | `yolo` | `confidence` | `0.3` | 检测阈值 | | `vit` | `known_checkpoint` | — | ViT检查点路径 | | `vit` | `clip_len` | `16` | 每个片段的帧数 | | `system` | `alarm_cooldown_sec` | `30` | 报警冷却时间 | | `system` | `vit_anomaly_threshold` | `0.55` | ViT触发阈值 | Web控制台支持按流进行独立配置。 ## 📡 API 端点 | 方法 | 端点 | 描述 | |--------|----------|-------------| | `GET` | `/api/streams` | 列出所有流 + 模型状态 | | `POST` | `/api/streams` | 添加一个流 | | `DELETE` | `/api/streams/
**⭐ 如果这个项目对您有帮助,请给它一个Star! ⭐**
标签:AI安防系统, AI管道, ByteTrack视频跟踪, CUDA加速, Flask Web框架, MJPEG流显示, Python开发, PyTorch框架, Qwen-VL大模型审查, ROI入侵检测, VideoMAE异常识别, Web仪表板, YOLO目标检测, 停留时间警报, 凭据扫描, 多模态AI, 多源视频支持, 安全操作, 安防技术, 异常行为识别, 智能检测, 智能视频监控, 深度学习, 禁止物体识别, 自动化监控, 规则引擎报警, 视觉语言模型, 视频分析, 视频流处理, 计算机视觉, 语义描述生成, 车辆超时监控, 逆向工具