DAVIDML2005/Project-Traffic-Infraction-Forecasting

GitHub: DAVIDML2005/Project-Traffic-Infraction-Forecasting

巴兰基亚市交通违规预测与分析系统

Stars: 0 | Forks: 0

# 巴兰基亚市电子罚单分析和预测建模 ## 描述 本项目开发了一个综合分析和预测建模系统,用于研究哥伦比亚巴兰基亚市注册的电子罚单,利用数据探索分析、地理编码、时间序列和机器学习技术。 研究涉及通过光检测系统捕获的交通违规现象,旨在识别空间和时间模式,比较预测模型,并为2026年生成预测。 该项目是在**北方大学**的**研究研讨会**课程中开发的。 ## 合作者 * David Ricardo Marquez Luna (https://github.com/DAVIDML2005) * Cristian Camilo Linero Cantillo (https://github.com/cristianclc) ## 目标 ### 总体目标 开发一个综合分析和预测模型,以预测巴兰基亚市通过光检测系统记录的交通违规行为。 ### 具体目标 * 描述违规的空间和时间分布 * 分析时间序列中的趋势和季节性模式 * 实施经典统计模型和机器学习模型 * 系统比较模型的预测性能 * 为每种违规选择最佳模型 * 为2026年生成预测 ## 数据集 ### 数据来源 数据来自**哥伦比亚政府开放数据门户**,对应于2018年至2025年在巴兰基亚发行的电子罚单记录。 * **主要数据集**:https://www.datos.gov.co/Transporte/Comparendos-Electr-nicos-Control-y-Regulaci-n-Barr/ps7z-yks5/about_data * **次要数据集**:https://www.datos.gov.co/Transporte/Fotodetecci-n-en-Barranquilla/cpp6-je64/about_data ### 数据集特征 * 超过340,000条记录 * 大约50个光检测摄像头 * 详细的时间和地理信息 * 与以下变量相关的信息: * 日期 * 地理位置信息 * 违规类型 * 车辆类别 * 车辆服务 ## 分析的违规 研究集中在五个最具代表性的违规: | 代码 | 描述 | | ------ | --------------------------------------------- | | C29 | 超速 | | C02 | 在禁止停车的地点停车 | | C03 | 阻塞车道或交叉口 | | D04 | 在红灯或黄灯前不停车 | | C32 | 不尊重行人过街信号 | ## 方法论 项目在多个方法论阶段进行: ### 数据探索分析 (EDA) * 单变量分析 * 双变量分析 * 描述性统计 * 分布和频率 * 模式识别 ### 地理编码和空间分析 使用巴兰基亚的Shapefile文件: * 地理定位摄像头 * 可视化空间分布 * 识别关键区域 * 分析领土覆盖 ### 时间分解 应用了以下技术: * STL(使用Loess的季节性-趋势分解) * MSTL(多重季节性-趋势分解) ## 实施的模型 ### 经典统计模型 * Holt-Winters * ARIMA * SARIMA * 动态优化Theta (DOT) ### 正则化回归模型 * 岭回归 * Lasso回归 ### 机器学习模型 * 随机森林 * XGBoost * LightGBM * K-最近邻(KNN) ## 时间序列转换 通过以下方式将机器学习模型适应时间序列问题: * 滑动窗口 * 滞后变量(lags) * 趋势变量 * 季节性变量 这使时间序列问题转化为监督学习问题。 ## 评估指标 使用以下指标评估模型: * MSE(均方误差) * RMSE(均方根误差) * MAE(平均绝对误差) * MAPE(平均绝对百分比误差) * SMAPE(对称平均绝对百分比误差) ## 2026年预测 一旦为每种违规选择了最佳模型,就为2026年生成预测,目的是: * 预测未来趋势 * 识别关键时期 * 支持城市交通决策 * 优化交通控制策略 ## 项目影响 本项目旨在: * 提高交通安全 * 优化公共资源 * 加强城市交通政策 * 支持基于证据的决策 * 将数据科学应用于哥伦比亚城市环境 ## 学术贡献 该研究填补了国内文献中存在的空白: * 哥伦比亚电子罚单预测 * 多个预测模型的系统比较 * 将机器学习应用于巴兰基亚城市交通
标签:Apex, BSD, 交通执法, 交通违规分析, 哥伦比亚, 地理信息系统, 城市交通, 大学项目, 季节性分析, 学术研究, 巴兰基亚, 开放数据, 数据挖掘, 数据科学, 时间序列预测, 机器学习, 模型比较, 电子罚单, 空间分析, 统计模型, 资源验证, 趋势分析, 逆向工具, 道路安全, 预测2026, 预测分析, 预测模型