nithink-pixel/border-intelligence-dashboard

GitHub: nithink-pixel/border-intelligence-dashboard

一个面向边境过境数据的全栈商业智能项目,通过聚类与异常检测实现口岸风险可视化与决策支持。

Stars: 0 | Forks: 0

# 边境情报 — 共同操作画面 ### 业务分析仪表板 · CBP 边境过境数据 · 面向 GDIT IHS 部门 [![实时演示](https://img.shields.io/badge/Live%20Demo-View%20Dashboard-00d4ff?style=flat-square)](https://nithink-pixel.github.io/border-intelligence-dashboard) [![数据源](https://img.shields.io/badge/Data-data.gov%20%7C%20BTS%20CBP-orange?style=flat-square)](https://catalog.data.gov/dataset/border-crossing-entry-data-683ae) [![记录数](https://img.shields.io/badge/Records-273%2C391-green?style=flat-square)]() [![Python](https://img.shields.io/badge/Python-Pandas%20%7C%20Scikit--learn-blue?style=flat-square)]() [![状态](https://img.shields.io/badge/Status-Live-brightgreen?style=flat-square)]() ## 概述 一个全栈式商业智能项目,分析 **273,391 条** 覆盖 **1996 年 4 月 – 2026 年 1 月** 的 **114 个活跃入境口岸** 的美国边境过境数据。旨在展示端到端的商业分析能力——从原始政府数据摄取到面向高管的交付成果。 该仪表板借鉴 GDIT 的 **共同操作画面(Common Operating Picture)** 框架,融合了 Power BI 风格的高管层、Tableau 风格的分析师深入分析以及机器学习驱动的口岸风险登记册。 **实时仪表板 →** [nithink-pixel.github.io/border-intelligence-dashboard](https://nithink-pixel.github.io/border-intelligence-dashboard) ## 仪表板面板 | 面板 | 层级 | 描述 | |------|------|------| | 高管视图 | Power BI 风格 | KPI 卡片、月度趋势、口岸排名、同比对比 | | 分析师深入分析 | Tableau 风格 | 口岸细分、模式占比、COVID 影响、异常表 | | 口岸风险聚类 | 机器学习层 | KMeans 聚类、散点图、完整风险登记册 | | 业务分析发现备忘录 | 交付物 | 3 项发现、2 项风险、1 套分级建议 | ## 关键发现 **发现 1 — 圣伊西德罗是唯一的关键枢纽** 27440 万次过境(2020–2025)——几乎是第二高口岸埃尔帕索(14720 万)的两倍。通过 KMeans 聚类分析,在 114 个口岸中唯一被标记为“关键枢纽”。波动指数为 0.995,表明吞吐量大且稳定。 **发现 2 — 2025 年美加边境下降 19.2%** 美加边境过境量从 2024 年的 7460 万降至 2025 年的 6030 万,而美墨边境基本持平在约 2660 万。出现具有统计显著性的分歧,在北部口岸制定人员配置决策前需进行根本原因分析。 **发现 3 — 10 个口岸被标记为异常峰值** Z 分数分析发现 10 个口岸超过 z > 2.0,其中 8 个集中在 2024 年 7–8 月的美加边境——这一时间集中度超过了正常的季节性波动。 ## 技术栈 ### 数据处理(Python) ``` # 核心管道 pandas # ETL, aggregation, feature engineering scikit-learn # KMeans clustering (k=4), StandardScaler normalization numpy # Z-score anomaly detection per port ``` ### 聚类方法 - **算法:** KMeans(k=4,n_init=10,random_state=42) - **特征:** total_volume、avg_monthly_volume、volatility_index、measure_type_diversity - **归一化:** StandardScaler(零均值、单位方差) - **异常检测:** 按月过境的端口 Z 分数(阈值:z > 2.0) ### 前端 - 纯 HTML/CSS/JS —— 零框架依赖 - Chart.js 4.4.0 用于所有可视化 - IBM Plex 字体系列 - 完全响应式 —— 适用于任何设备 ## 数据集 | 属性 | 值 | |------|------| | 数据源 | 运输统计局(BTS) | | 门户 | data.gov — CBP 边境过境入境数据 | | 记录数 | 273,391 行 | | 日期范围 | 1996 年 4 月 – 2026 年 1 月 | | 边境 | 美墨 · 美加 | | 口岸 | 114 个活跃入境口岸 | | 指标 | 个人车辆、行人、卡车、巴士、火车及乘客 | | 许可证 | 公共领域(美国政府作品) | ## 方法论 ``` Raw CBP Data (273,391 rows) │ ▼ Python ETL Pipeline ├── Date parsing & normalization ├── Port-level feature engineering │ ├── total_volume │ ├── avg_monthly_volume │ ├── std_monthly (volatility) │ └── measure_type_diversity │ ▼ KMeans Clustering (k=4) ├── StandardScaler normalization ├── Cluster assignment → risk tier labeling └── Output: Critical Hub / High Volume / Moderate / Low Activity │ ▼ Z-Score Anomaly Detection ├── Per-port monthly baseline (mean, std) ├── Z-score computation per port-month └── Flag: z > 2.0 → anomaly event │ ▼ Dashboard (HTML/Chart.js) ├── Executive View — Power BI layer ├── Analyst Drill-Down — Tableau layer ├── Risk Clustering — ML layer └── BA Findings Memo — deliverable layer ``` ## 业务建议 基于分析结果,推荐采用 **四级资源分配模型**: | 级别 | 分类 | 口岸 | 资源策略 | |------|------|------|----------| | 1 | 关键枢纽 | 1 | AI 监控 · 专职分析师 · 实时告警 | | 2 | 高流量 | 11 | 自动化异常告警 · 月度回顾周期 | | 3 | 中等 | 45 | 季度回顾 · 峰值应急待命 | | 4 | 低活跃 | 57 | 年度回顾 · 仅自动报告 | ## 项目结构 ``` border-intelligence-dashboard/ │ ├── index.html # Full dashboard (self-contained) ├── README.md # This file │ └── analysis/ # Python scripts (local, not deployed) ├── etl_pipeline.py # Data cleaning & feature engineering ├── clustering.py # KMeans port risk classification └── anomaly_detect.py # Z-score flagging per port ``` ## 关于 由 **Nithin Krishna** 构建,作为商业分析组合项目的一部分。 - 商业分析硕士 — 马萨诸塞大学伊森伯格管理学院(2027 年 5 月) - 技能展示:SQL · Python · Power BI · Tableau · 业务分析 · KMeans 聚类 · Z 分数异常检测 · 高管报告 - LinkedIn:[linkedin.com/in/nithin-krishna145](https://linkedin.com/in/nithin-krishna145) - GitHub:[github.com/nithink-pixel](https://github.com/nithink-pixel) *数据源:运输统计局 · 美国海关和边境保护局 · data.gov · 公共领域*
标签:Apex, BSD, CBP, COVID-19影响, data.gov, GDIT, IHS, KMeans聚类, Power BI, Tableau, 代码示例, 仪表板, 商业智能, 国土安全, 大数据, 异常检测, 政府数据, 数据分析, 数据挖掘, 数据治理, 无监督学习, 时间序列分析, 机器学习, 港口风险登记, 目录扫描, 端口聚类, 趋势分析, 边境安全, 边境情报, 边境过境数据, 逆向工具, 风险分析