nithink-pixel/border-intelligence-dashboard
GitHub: nithink-pixel/border-intelligence-dashboard
一个面向边境过境数据的全栈商业智能项目,通过聚类与异常检测实现口岸风险可视化与决策支持。
Stars: 0 | Forks: 0
# 边境情报 — 共同操作画面
### 业务分析仪表板 · CBP 边境过境数据 · 面向 GDIT IHS 部门
[](https://nithink-pixel.github.io/border-intelligence-dashboard)
[](https://catalog.data.gov/dataset/border-crossing-entry-data-683ae)
[]()
[]()
[]()
## 概述
一个全栈式商业智能项目,分析 **273,391 条** 覆盖 **1996 年 4 月 – 2026 年 1 月** 的 **114 个活跃入境口岸** 的美国边境过境数据。旨在展示端到端的商业分析能力——从原始政府数据摄取到面向高管的交付成果。
该仪表板借鉴 GDIT 的 **共同操作画面(Common Operating Picture)** 框架,融合了 Power BI 风格的高管层、Tableau 风格的分析师深入分析以及机器学习驱动的口岸风险登记册。
**实时仪表板 →** [nithink-pixel.github.io/border-intelligence-dashboard](https://nithink-pixel.github.io/border-intelligence-dashboard)
## 仪表板面板
| 面板 | 层级 | 描述 |
|------|------|------|
| 高管视图 | Power BI 风格 | KPI 卡片、月度趋势、口岸排名、同比对比 |
| 分析师深入分析 | Tableau 风格 | 口岸细分、模式占比、COVID 影响、异常表 |
| 口岸风险聚类 | 机器学习层 | KMeans 聚类、散点图、完整风险登记册 |
| 业务分析发现备忘录 | 交付物 | 3 项发现、2 项风险、1 套分级建议 |
## 关键发现
**发现 1 — 圣伊西德罗是唯一的关键枢纽**
27440 万次过境(2020–2025)——几乎是第二高口岸埃尔帕索(14720 万)的两倍。通过 KMeans 聚类分析,在 114 个口岸中唯一被标记为“关键枢纽”。波动指数为 0.995,表明吞吐量大且稳定。
**发现 2 — 2025 年美加边境下降 19.2%**
美加边境过境量从 2024 年的 7460 万降至 2025 年的 6030 万,而美墨边境基本持平在约 2660 万。出现具有统计显著性的分歧,在北部口岸制定人员配置决策前需进行根本原因分析。
**发现 3 — 10 个口岸被标记为异常峰值**
Z 分数分析发现 10 个口岸超过 z > 2.0,其中 8 个集中在 2024 年 7–8 月的美加边境——这一时间集中度超过了正常的季节性波动。
## 技术栈
### 数据处理(Python)
```
# 核心管道
pandas # ETL, aggregation, feature engineering
scikit-learn # KMeans clustering (k=4), StandardScaler normalization
numpy # Z-score anomaly detection per port
```
### 聚类方法
- **算法:** KMeans(k=4,n_init=10,random_state=42)
- **特征:** total_volume、avg_monthly_volume、volatility_index、measure_type_diversity
- **归一化:** StandardScaler(零均值、单位方差)
- **异常检测:** 按月过境的端口 Z 分数(阈值:z > 2.0)
### 前端
- 纯 HTML/CSS/JS —— 零框架依赖
- Chart.js 4.4.0 用于所有可视化
- IBM Plex 字体系列
- 完全响应式 —— 适用于任何设备
## 数据集
| 属性 | 值 |
|------|------|
| 数据源 | 运输统计局(BTS) |
| 门户 | data.gov — CBP 边境过境入境数据 |
| 记录数 | 273,391 行 |
| 日期范围 | 1996 年 4 月 – 2026 年 1 月 |
| 边境 | 美墨 · 美加 |
| 口岸 | 114 个活跃入境口岸 |
| 指标 | 个人车辆、行人、卡车、巴士、火车及乘客 |
| 许可证 | 公共领域(美国政府作品) |
## 方法论
```
Raw CBP Data (273,391 rows)
│
▼
Python ETL Pipeline
├── Date parsing & normalization
├── Port-level feature engineering
│ ├── total_volume
│ ├── avg_monthly_volume
│ ├── std_monthly (volatility)
│ └── measure_type_diversity
│
▼
KMeans Clustering (k=4)
├── StandardScaler normalization
├── Cluster assignment → risk tier labeling
└── Output: Critical Hub / High Volume / Moderate / Low Activity
│
▼
Z-Score Anomaly Detection
├── Per-port monthly baseline (mean, std)
├── Z-score computation per port-month
└── Flag: z > 2.0 → anomaly event
│
▼
Dashboard (HTML/Chart.js)
├── Executive View — Power BI layer
├── Analyst Drill-Down — Tableau layer
├── Risk Clustering — ML layer
└── BA Findings Memo — deliverable layer
```
## 业务建议
基于分析结果,推荐采用 **四级资源分配模型**:
| 级别 | 分类 | 口岸 | 资源策略 |
|------|------|------|----------|
| 1 | 关键枢纽 | 1 | AI 监控 · 专职分析师 · 实时告警 |
| 2 | 高流量 | 11 | 自动化异常告警 · 月度回顾周期 |
| 3 | 中等 | 45 | 季度回顾 · 峰值应急待命 |
| 4 | 低活跃 | 57 | 年度回顾 · 仅自动报告 |
## 项目结构
```
border-intelligence-dashboard/
│
├── index.html # Full dashboard (self-contained)
├── README.md # This file
│
└── analysis/ # Python scripts (local, not deployed)
├── etl_pipeline.py # Data cleaning & feature engineering
├── clustering.py # KMeans port risk classification
└── anomaly_detect.py # Z-score flagging per port
```
## 关于
由 **Nithin Krishna** 构建,作为商业分析组合项目的一部分。
- 商业分析硕士 — 马萨诸塞大学伊森伯格管理学院(2027 年 5 月)
- 技能展示:SQL · Python · Power BI · Tableau · 业务分析 · KMeans 聚类 · Z 分数异常检测 · 高管报告
- LinkedIn:[linkedin.com/in/nithin-krishna145](https://linkedin.com/in/nithin-krishna145)
- GitHub:[github.com/nithink-pixel](https://github.com/nithink-pixel)
*数据源:运输统计局 · 美国海关和边境保护局 · data.gov · 公共领域*
标签:Apex, BSD, CBP, COVID-19影响, data.gov, GDIT, IHS, KMeans聚类, Power BI, Tableau, 代码示例, 仪表板, 商业智能, 国土安全, 大数据, 异常检测, 政府数据, 数据分析, 数据挖掘, 数据治理, 无监督学习, 时间序列分析, 机器学习, 港口风险登记, 目录扫描, 端口聚类, 趋势分析, 边境安全, 边境情报, 边境过境数据, 逆向工具, 风险分析