DAVIDML2005/Project-Traffic-Infraction-Forecasting
GitHub: DAVIDML2005/Project-Traffic-Infraction-Forecasting
巴兰基亚市交通违规预测与分析系统
Stars: 0 | Forks: 0
# 巴兰基亚市电子罚单分析和预测建模
## 描述
本项目开发了一个综合分析和预测建模系统,用于研究哥伦比亚巴兰基亚市注册的电子罚单,利用数据探索分析、地理编码、时间序列和机器学习技术。
研究涉及通过光检测系统捕获的交通违规现象,旨在识别空间和时间模式,比较预测模型,并为2026年生成预测。
该项目是在**北方大学**的**研究研讨会**课程中开发的。
## 合作者
* David Ricardo Marquez Luna (https://github.com/DAVIDML2005)
* Cristian Camilo Linero Cantillo (https://github.com/cristianclc)
## 目标
### 总体目标
开发一个综合分析和预测模型,以预测巴兰基亚市通过光检测系统记录的交通违规行为。
### 具体目标
* 描述违规的空间和时间分布
* 分析时间序列中的趋势和季节性模式
* 实施经典统计模型和机器学习模型
* 系统比较模型的预测性能
* 为每种违规选择最佳模型
* 为2026年生成预测
## 数据集
### 数据来源
数据来自**哥伦比亚政府开放数据门户**,对应于2018年至2025年在巴兰基亚发行的电子罚单记录。
* **主要数据集**:https://www.datos.gov.co/Transporte/Comparendos-Electr-nicos-Control-y-Regulaci-n-Barr/ps7z-yks5/about_data
* **次要数据集**:https://www.datos.gov.co/Transporte/Fotodetecci-n-en-Barranquilla/cpp6-je64/about_data
### 数据集特征
* 超过340,000条记录
* 大约50个光检测摄像头
* 详细的时间和地理信息
* 与以下变量相关的信息:
* 日期
* 地理位置信息
* 违规类型
* 车辆类别
* 车辆服务
## 分析的违规
研究集中在五个最具代表性的违规:
| 代码 | 描述 |
| ------ | --------------------------------------------- |
| C29 | 超速 |
| C02 | 在禁止停车的地点停车 |
| C03 | 阻塞车道或交叉口 |
| D04 | 在红灯或黄灯前不停车 |
| C32 | 不尊重行人过街信号 |
## 方法论
项目在多个方法论阶段进行:
### 数据探索分析 (EDA)
* 单变量分析
* 双变量分析
* 描述性统计
* 分布和频率
* 模式识别
### 地理编码和空间分析
使用巴兰基亚的Shapefile文件:
* 地理定位摄像头
* 可视化空间分布
* 识别关键区域
* 分析领土覆盖
### 时间分解
应用了以下技术:
* STL(使用Loess的季节性-趋势分解)
* MSTL(多重季节性-趋势分解)
## 实施的模型
### 经典统计模型
* Holt-Winters
* ARIMA
* SARIMA
* 动态优化Theta (DOT)
### 正则化回归模型
* 岭回归
* Lasso回归
### 机器学习模型
* 随机森林
* XGBoost
* LightGBM
* K-最近邻(KNN)
## 时间序列转换
通过以下方式将机器学习模型适应时间序列问题:
* 滑动窗口
* 滞后变量(lags)
* 趋势变量
* 季节性变量
这使时间序列问题转化为监督学习问题。
## 评估指标
使用以下指标评估模型:
* MSE(均方误差)
* RMSE(均方根误差)
* MAE(平均绝对误差)
* MAPE(平均绝对百分比误差)
* SMAPE(对称平均绝对百分比误差)
## 2026年预测
一旦为每种违规选择了最佳模型,就为2026年生成预测,目的是:
* 预测未来趋势
* 识别关键时期
* 支持城市交通决策
* 优化交通控制策略
## 项目影响
本项目旨在:
* 提高交通安全
* 优化公共资源
* 加强城市交通政策
* 支持基于证据的决策
* 将数据科学应用于哥伦比亚城市环境
## 学术贡献
该研究填补了国内文献中存在的空白:
* 哥伦比亚电子罚单预测
* 多个预测模型的系统比较
* 将机器学习应用于巴兰基亚城市交通
标签:Apex, BSD, 交通执法, 交通违规分析, 哥伦比亚, 地理信息系统, 城市交通, 大学项目, 季节性分析, 学术研究, 巴兰基亚, 开放数据, 数据挖掘, 数据科学, 时间序列预测, 机器学习, 模型比较, 电子罚单, 空间分析, 统计模型, 资源验证, 趋势分析, 逆向工具, 道路安全, 预测2026, 预测分析, 预测模型