卡塔尔交通审计,2015–2026
一份包含六个数据源的、关于多哈道路基础设施、车辆进口和拥堵结果的可复现审计报告 —— 整合了应官方数据请求(NPC #318)由卡塔尔国家规划委员会提供的 PSA Foreign Trade 微观数据。
摘要 ·
动机 ·
发现 ·
方法论 ·
数据源 ·
可复现性 ·
文档 ·
引用
## 执行摘要
在 2014–2021 年世界杯时代的快速路项目中,卡塔尔对道路基础设施投入巨资,然而规划和统计局(PSA)发布的官方“道路长度”系列数据在 2019 年后便停止更新——导致公共记录中 2021 年后的结果期缺乏度量。**本次审计从六个独立的公共来源重构了多哈 2015–2026 年的需求-供给-结果链**,每一项数值主张均可追溯至包含 `source_url` 和 `retrieved_date` 列的 CSV 文件,每一项源自 PDF 的数据均经过 SHA1 缓存和新闻交叉验证,并且同一贸易流的双边与多边申报在价值对账上的误差控制在 0.1% 以内。
除了填补道路公里数的空白外,本次审计还揭示了任何单一公共记录来源都无法产生的两项发现:
- **2025 年乘用车进口加速增长至 113,816 辆(同比增长 37.8%)** —— 这是自 2015 年以来的最高年度数值。
- **供应商组成的结构性转变,从日本主导转向中国主导**(中国来源的 HS8703 份额:2018 年低于 5% → 2025 年达到 44–46%)。
## 研究动机
公共记录中的三个独立空白促成了本次审计:
1. **度量空白。** PSA 交通章节的“道路长度”系列在 2019 年终止;data.gov.qa 重新发布的“年度完成”系列在 2021 年终止。任何询问“卡塔尔在世界杯后是否继续修建道路?”的人都无法得到公开的答案。
2. **对账空白。** 卡塔尔的车辆进口由卡塔尔 PSA 以 QAR(卡塔尔里亚尔)申报,并由伙伴国家以 USD(美元)向 UN Comtrade 申报。这两份申报是否一致,以及它们各自的 HS 分类版本如何协调,在公开文献中并无记录。
3. **结果归因空白。** TomTom、INRIX 和 QMIC 发布了多哈 2022 年后的拥堵数据。这些系列都没有在公开层面与供给侧的度量建立联系,因此“2021 年后拥堵加剧是否与道路供给放缓相一致?”这个问题无法从任何单一来源得出答案。
本次审计在一个单一的集成数据集中弥补了所有三个空白,并将本次审计的贡献定位为**通过官方渠道的数据请求来弥补公共记录的空白** —— 而非通过抓取、泄露或合成数据。
## 研究问题
| | 问题 | 解决位置 |
|---|---|---|
| **Q1** | 在 2015 年至 2015 年期间,卡塔尔的道路网络扩张在多大程度上与机动化趋势保持一致?在这个时期的哪个节点可以识别出转变? | §4.1–§4.4, §4.6 |
| **Q2** | OpenStreetMap 的历史快照能否为快速发展城市的路网增长提供可靠的独立度量? | §3.3, §3.6 |
| **Q3** | 2021 年后的供给轨迹与观测到的拥堵结果是如何同时发生的? | §4.5, §4.6, §4.7, §4.7.b |
## 主要发现
- **供给放缓。** 基于累积增长率,在多哈边界框内由 OSM 度量的等级公路增长在 2018–2021 年区间(+33.2%)和 2022–2025 年区间(+4.4%)之间放缓了**约七倍**。通过二元分段法检测到其在 2022 年出现结构性变化;由于仅有 n = 11 个同比观测值,Chow F 检验未达到 0.05 的显著性水平(p = 0.14)。不同备选基数的范围:5.4 倍至 7.6 倍。
- **需求加速。** 年度乘用车(HS8703)进口量从 2024 年的 82,605 辆增至 **2025 年的 113,816 辆(同比增长 37.8%)** —— 为 2015 年以来的最高值。2025 年的实际数值大幅高于 2022–2024 年趋势的任何延续情况(残差自助法 P ≤ 0.0001)。
- **指示性密度。** 每公里等级公路的车辆数(全卡塔尔车队除以多哈边界框内的道路——这是一个指示性密度指标,而非字面意义上的负载度量)从 2017 年约 1,017 的最高点回落至 2022 年的约 787,基本与 2015 年约 788 的基准线持平。
- **中日供应商地位逆转。** 中国来源的 HS8703 份额从 2018 年的 5% 以下上升至 **2025 年的 44–46%**,并在 2020 年(微弱优势)和 2022 年(决定性优势)超越了日本(2020 年 Chow F = 99.5,2022 年 F = 44.6,两者均 p < 0.0001)。
- **验证链。** PSA Foreign Trade 微观数据和 UN Comtrade 的价值申报在每一个重叠年份(2010–2024)误差均在 0.1% 以内;数量上的差异在 §3.7 中被解释为 HS 分类版本的聚合问题,而非度量分歧。
- **拥堵结果。** 在同等口径的 2024 至 2025 年单步对比中,TomTom 多哈都市圈的拥堵上升了 9.4 个百分点;QMIC 的 *Qatar Traffic Report* 独立报告了 2021 年后拥堵加剧的情况(仅作方向性佐证,属于不同的指数族)。
本次审计报告的是**共存关系,而非因果关系**。三个信号——供给放缓、需求加速、拥堵加剧——在同一个时间窗口内在方向上保持一致;其他替代性解释(行为转变、赛事后的交通模式、多哈地铁的替代效应、度量方法的变化)同样符合这些证据。完整的叙述详见 [`docs/findings.md`](docs/findings.md)。
## 方法论
端到端的研究工作流:
```
flowchart LR
A[Research questions
§1.4] --> B[Data sourcing
6 independent sources]
B --> C[Four-tier verification
§3.2]
C --> D[Reconciliation &
analysis tables]
D --> E[Statistical analysis
PELT · BinSeg · Chow · Bootstrap]
D --> F[Figure generation
5 publication figures]
E --> G[Manuscript]
F --> G
G --> H[Zenodo deposit
DOI 10.5281/zenodo.20739091]
G --> I[GitHub replication package]
```
### 四级验证
每一个数值都至少经过一级独立验证:
```
flowchart LR
T1["Tier 1
SHA1 bit-identity
cached PDF vs Wayback"] --> OUT["Published value"]
T2["Tier 2
Two-source exact match
PSA PDF vs data.gov.qa"] --> OUT
T3["Tier 3
News cross-citation
QMS extraction vs press"] --> OUT
T4["Tier 4
Bilateral vs multilateral
PSA vs Comtrade within 0.1%"] --> OUT
style OUT fill:#0c2340,stroke:#0c2340,color:#fff
```
完整的图表和分析流程位于 [`docs/diagrams/`](docs/diagrams/) 中。完整的方法论详见 [`docs/methodology.md`](docs/methodology.md)。
## 数据源
六个独立的公共数据源构成了一个包含五个节点的需求-供给-结果链。各数据集的来源及列级字典详见 [`docs/data_sources.md`](docs/data_sources.md)。
| # | 来源 | 作用 | 覆盖范围 | 主要文件 |
|---|---|---|---|---|
| 1 | 规划和统计局 (PSA),Wayback 存档 | 人口、道路公里数(至 2019 年)、QMS 公报 | 2010–2024(人口);2014–2019(道路公里数);2023 年 1 月 – 2024 年 6 月 (QMS) | `data/raw/qatar_population_yearly.csv`, `data/raw/qatar_road_infrastructure_yearly.csv`, `data/raw/qatar_monthly_vehicle_registrations.csv` |
| 2 | data.gov.qa 开放数据门户 (OpenDataSoft API) | 车队保有量、年度完成的道路公里数 | 2011–2022(保有量);2014–2021(完成的道路) | `data/raw/qatar_vehicle_registrations_yearly.csv`, `data/raw/qatar_roads_annual_completed_extended.csv` |
| 3 | **PSA Foreign Trade 微观数据 (NPC Request #318)** | 车辆进口 HS8703 + HS8704,HS12 × 伙伴国分辨率 | 2010 – 2026 年 4 月 | `data/raw/psa_foreign_trade_microdata_npc_request_318.xlsx`, `data/analysis/qatar_imports_psa_official_yearly.csv`, `data/analysis/qatar_imports_psa_top_origins.csv` |
| 4 | UN Comtrade 公共预览 API | 进口交叉验证(双边对比多边) | 2010–2024 (HS8703) | `data/raw/qatar_vehicle_imports_yearly_with_psa.csv`, `data/analysis/qatar_imports_psa_vs_comtrade_verification.csv` |
| 5 | OpenStreetMap 历史数据,通过 Overpass-API 获取 | 等级公路公里数(供给) | 2015–2026 年的 12 张年度快照,多哈边界框 | `data/raw/qatar_road_km_osm.csv` |
| 6 | TomTom 交通指数 (Wayback 存档) | 拥堵结果 | 2022–2025(多哈) | `data/raw/tomtom_doha_yearly.csv` |
## 结果
Figure 3. Population, fleet stock, OSM classified-road km, and 2015 = 100 indexed series, 2015–2026.
Figure 4. HS8703 (passenger cars) and HS8704 (goods vehicles) annual imports, 2010–2026 (April).
Figure 5. Japan and China shares of HS8703 imports, 2010–2026 — two crossover events (2020, 2022).
Figures 1 & 2. Six-source data architecture and Doha bounding box [51.30, 25.10, 51.70, 25.55].
每张图表的独立 PNG 文件以及手稿预览位于 [`docs/screenshots/`](docs/screenshots/) 中。
## 仓库结构
```
qatar-transport-audit-2026/
├── README.md ← this file
├── LICENSE ← CC-BY-4.0 (data) + MIT (code)
├── CITATION.cff ← machine-readable citation metadata
├── CHANGELOG.md
├── CONTRIBUTING.md
├── .gitignore
├── .github/
│ ├── social-preview.png ← GitHub social card (1280×640)
│ └── ISSUE_TEMPLATE/
│ ├── reproduction_issue.md
│ └── data_question.md
├── paper/
│ ├── manuscript.pdf ← v2 with DOI substituted (36 pp)
│ ├── manuscript.md
│ └── references.md
├── images/ ← publication figures + repo banner
├── docs/
│ ├── README.md ← documentation index
│ ├── methodology.md ← full methodology, 8 sections
│ ├── findings.md ← narrative findings, 9 sections
│ ├── data_sources.md ← per-source provenance + data dictionary
│ ├── diagrams/ ← 4 Mermaid diagrams (research workflow, pipelines)
│ └── screenshots/ ← standalone PNGs of figures + manuscript previews
├── code/ ← 18 Python scripts (extraction → analysis → figures)
└── data/
├── raw/ ← 16 CSVs + 5 verification MDs + NPC microdata XLSX
└── analysis/ ← 7 derived CSVs + summary MD
```
`.graphml` OSM 快照(12 个年度快照,约 120 MB)未打包在此仓库中,以保持克隆体积小巧;它们属于 Zenodo 存档的一部分,位于 `data/historical_library/graphs/`。
## 可复现性
### 软件要求
- Python 3.11 或更高版本
- `pandas` 2.x, `numpy` 1.26+, `matplotlib` 3.8+
- `pdfplumber` 0.10+, `openpyxl` 3.1+
- `osmnx` 2.1, `networkx` 3.6(仅限 OSM 供给端)
- `ruptures` 1.1.9, `scipy` 1.11+(统计分析)
- `requests` 2.31+
```
pip install pandas numpy matplotlib openpyxl pdfplumber osmnx networkx ruptures scipy requests
```
### 通过六个步骤进行复现
```
git clone https://github.com/arasghorbani9090-web/qatar-transport-audit-2026.git
cd qatar-transport-audit-2026
# 导入 (PSA × Comtrade 对账)
python code/extract_psa_8703.py
python code/build_qatar_imports_with_psa.py
# 供给 (OSM .graphml -> 公路公里数; 来自 Zenodo 的 .graphml 快照)
python code/build_osm_road_km.py
# 需求 (QMS 公报提取)
python code/extract_qms_vehicles.py
python code/aggregate_qms_yearly.py
# 统一年度表
python code/eda_story.py
# 图表
python code/build_figure_1_data_architecture.py
python code/build_figure_2_bbox_map.py
python code/build_master_chart_v3.py
python code/build_figure_4_imports.py
python code/build_figure_5_japan_china_share.py
# Manuscript PDF (包含内嵌图表)
python code/build_manuscript_pdf.py
```
文章中的每一个数值主张都映射到 `data/` 中的一个 CSV 文件;来源 URL 和检索日期被记录为列。依赖关系图请参见 [`docs/diagrams/04_analysis_pipeline.md`](docs/diagrams/04_analysis_pipeline.md)。
## 文档
| 文档 | 用途 |
|---|---|
| [`docs/methodology.md`](docs/methodology.md) | 完整方法论:8 个章节,包含手稿交叉引用 |
| [`docs/findings.md`](docs/findings.md) | 叙述性发现:9 个章节,§4.1–§5.3 |
| [`docs/data_sources.md`](docs/data_sources.md) | 各来源出处及列级数据字典 |
| [`docs/diagrams/01_research_workflow.md`](docs/diagrams/01_research_workflow.md) | 端到端的研究工作流 |
| [`docs/diagrams/02_data_collection_pipeline.md`](docs/diagrams/02_data_collection_pipeline.md) | 数据源 → 提取 → 原始 CSV (Mermaid) |
| [`docs/diagrams/03_validation_process.md`](docs/diagrams/03_validation_process.md) | 四级验证流程 (Mermaid) |
| [`docs/diagrams/04_analysis_pipeline.md`](docs/diagrams/04_analysis_pipeline.md) | 原始数据 → 分析 → 统计 → 手稿 (Mermaid) |
| [`docs/screenshots/`](docs/screenshots/) | 图表的独立 PNG 文件和手稿预览 |
| [`CONTRIBUTING.md`](CONTRIBUTING.md) | 贡献的范围内外界定,以及 issue 和 PR 约定 |
| [`CHANGELOG.md`](CHANGELOG.md) | 各版本变更记录 |
## 关于作者
**Aras Ghorbani** 是一位居住在卡塔尔多哈的独立研究员。本项目展示了涵盖以下领域的端到端研究能力:
- **研究设计** —— 识别公共记录中的空白,提出三个可证伪的研究问题,规划六源验证架构。
- **数据获取** —— 对 18 份 PSA Qatar Monthly Statistics 公报进行 Wayback Machine 考古,针对 12 个年度快照执行 OpenStreetMap 历史 Overpass 查询,向卡塔尔国家规划委员会提出正式数据请求(请求编号 #318,于 202605-13 收到),以及提取 UN Comtrade 公共预览 API 数据。
- **数据验证** —— 四级验证(SHA1 位一致性、双源精确匹配、新闻交叉引用、双边与多边申报对账),对于差异情况(不同 HS 分类版本下的 PSA × Comtrade 数量比率)以书面形式进行对账,绝不掩盖。
- **地理空间分析** —— 使用 `osmnx`/`networkx` 进行 12 年的道路网络纵向重建,包含已记录的志愿者地图绘制伪影处理和经过重新计数验证的公里数度量。
- **统计分析** —— PELT 和 Binary Segmentation 变点检测(`ruptures`),Chow F 检验、Welch t 检验,以及残差/百分位自助法置信区间(10,000–20,000 次重采样),并坚持诚实报告原则,同时披露非显著结果和显著结果。
- **科学写作** —— 为向 Cambridge *Data & Policy* 投稿准备了 36 页的手稿,包含完整的 APA-7 参考文献列表,以及向相关卡塔尔机构提出的六项政策建议。
- **面向可复现性的软件工程** —— 单命令复现流程,每一个数值都可追溯至带有 `source_url` 和 `retrieved_date` 列的 CSV 文件,GitHub 仓库基于 CC-BY-4.0(数据)+ MIT(代码)许可证构建。
- **开放研究实践** —— 包含预留 DOI 的 Zenodo 存档、完整的复现包、公开的 GitHub 发布版本,以及机器可读的 `CITATION.cff` 元数据。
本仓库既作为手稿的复现包,也作为该方法论的作品集展示。
## 引用
请引用 Zenodo 存档:
BibTeX:
```
@dataset{ghorbani_2026_qatar_transport_audit,
author = {Ghorbani, Aras},
title = {Closing a data gap with an official-channel data request:
a six-source audit of Qatar's road infrastructure,
vehicle imports, and congestion outcomes, 2015--2026},
year = {2026},
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.20739091},
url = {https://doi.org/10.5281/zenodo.20739091}
}
```
机器可读的元数据:[`CITATION.cff`](CITATION.cff)。
## 许可证
- **数据** —— 知识共享署名 4.0 国际许可。适用于 `data/` 中的所有文件、`images/` 中的所有图表以及手稿 PDF。
- **代码** —— MIT 许可证。适用于 `code/` 中的所有脚本。
全文见 [`LICENSE`](LICENSE)。PSA Foreign Trade 微观数据的聚合发布已获得国家规划委员会的同意;对原始微观数据 Excel 文件的任何进一步重新分发,应保留对卡塔尔国国家规划委员会作为原始来源的署名。
## 致谢
- 感谢**卡塔尔国国家规划委员会**满足数据请求 #318(于 2026-05-13 收到)。
- 感谢**规划和统计局**提供基础的历史 Foreign Trade 系列数据,根据 2024 年第 13 号埃米尔决议,该数据目前由 NPC 保管。
- 感谢**OpenStreetMap 贡献者社区**提供作为供给侧度量基础的历史路网数据。
- 感谢**互联网档案的 Wayback Machine** 保存了此后被删除或迁移的公共记录来源。
## 仓库状态
| 项目 | 状态 |
|---|---|
| 手稿 (`paper/manuscript.pdf`) | v2 —— 已替代 DOI,准备提交至 Cambridge *Data & Policy* |
| Zenodo 存档 | 已创建草稿,已预留 DOI (`10.5281/zenodo.20739091`),尚未发布 |
| 复现脚本 | 已发布 (version 1.0) |
| 公开的 GitHub 仓库 | 已发布(本仓库) |
| 同行评审接受情况 | *在发布时尚未提交;本仓库未声称已被接受。* |
| OSM `.graphml` 快照 | 仅在 Zenodo 存档中提供(为保持克隆体积,未包含在 GitHub 中) |
如有实质性的研究问题,请使用 `paper/manuscript.pdf` 中的通讯作者联系方式。对于仓库级别的问题,推荐使用 GitHub issues —— 参见 [`CONTRIBUTING.md`](CONTRIBUTING.md)。