dirm02/Contest
GitHub: dirm02/Contest
针对加拿大公共支出与治理数据的开源情报概念验证平台,将碎片化政府数据集转化为排名审查信号和图谱证据,以人在回路方式辅助审核员识别高风险支出案例。
Stars: 3 | Forks: 0
## 人在回路 PoC
Maple DOGE 旨在支持人工审核员,而不是取代他们。该应用程序对公共支出信号进行排名和解释,然后将案例路由到审查队列、案例工作区、建议操作、简报和结果记录中,以便人员在做出任何政策或运营决策之前验证信息来源。
## 项目概述
Maple DOGE 将碎片化的公共部门数据集转化为有证据支撑的调查模块。
该应用程序结合了实体搜索、档案、排名监视列表、采购分析、政策差距审查、图谱探索、负面媒体背景以及人在回路审查工作流程。其目标不是做出自动执法决策。目标是帮助审查人员了解哪些公共支出案件最值得关注及其原因。
## 系统架构
```
flowchart LR
UI["React + Vite frontend"]
VM["Azure VM web server"]
API["Node/Express API"]
PG["Postgres source/serving data"]
BQ["GCP BigQuery analytics"]
EXT["Official public datasets"]
EXT --> BQ
EXT --> PG
UI --> VM
VM --> API
API --> PG
API --> BQ
```
| 层级 | 构建内容 |
| --- | --- |
| Frontend | React, Vite, TypeScript, Recharts, XYFlow, Lucide 图标 |
| Backend API | 位于 `backend/general/visualizations/server.js` 的 Node/Express API |
| 托管 | 提供静态前端和 API 路由的 Azure VM |
| 分析数据仓库 | 用于较重挑战表和验证的 GCP BigQuery |
| 来源/服务数据 | 由 Postgres 支持的实体、资金、慈善、登记、治理和图谱数据 |
| 部署 | `deploy/` 脚本将 `dist/` 和后端服务器代码同步到 VM |
## 应用程序包含的内容
| 区域 | 已构建功能 |
| --- | --- |
| 实体搜索 | 组织、慈善机构、公司、供应商和人员的搜索优先入口 |
| 档案 | 来源覆盖范围、资金背景、相关记录、图谱背景和挑战信号 |
| 调查面板 | 挑战模块的集中枢纽,取代拥挤的顶部导航 |
| 图谱 | 用于循环、治理和实体背景的 XYFlow 关系图 |
| 采购分析 | 修正案递增、单一来源后续、供应商集中度、合同趋势视图 |
| 政策分析 | 支出/优先级对齐和优先级差距审查 |
| 人工审查 | 挑战 1 审查队列、案例工作区、分数解释、建议操作、简报和结果 |
| 外部背景 | 使用 Google News RSS 和 NewsAPI 的后端负面媒体扫描 |
## 挑战覆盖范围
| # | 挑战 | 构建内容 | 成熟度 |
| --- | --- | --- | --- |
| 1 | 僵尸接收者 | 注册支持的接收者审查、BN 根匹配、资金消失后备、审查队列、案例工作区 | 端到端 PoC 工作流 |
| 2 | 幽灵容量 | 无 BN、稀疏奖励、高平均奖励和多部门容量信号 | 实时调查模块 |
| 3 | 资金循环 | CRA 循环检测,包括参与者、跳数、瓶颈、流动总额和图谱视图 | 实时图谱模块 |
| 4 | 单一来源与修正案递增 | 联邦原始/当前修正案逻辑加上阿尔伯塔省竞争性到单一来源后续匹配 | 实时采购模块 |
| 5 | 供应商集中度 | BigQuery HHI、CR4、最高份额、有效竞争者、经过不变性检查的集中度结果 | 实时分析模块 |
| 6 | 治理网络 | 共享董事规范化、组织对发现、人员/实体图谱视图 | 实时图谱模块 |
| 7 | 政策对齐 | BigQuery 审查行,比较优先级、计划/实际值、目标和结果 | 实时分析模块 |
| 8 | 重复资金与缺口 | 8A 重叠的公共资金流;8B 优先级缺口和基础设施延迟审查 | 实时分析模块 |
| 9 | 合同情报 | 采购级别的趋势分解、修正案贡献、集中度背景 | 实时分析模块 |
| 10 | 负面媒体 | 后端 RSS/NewsAPI 扫描器,具有故障处理和去重的负面媒体背景 | 实时背景模块 |
## 挑战方法
### 1. 僵尸接收者
在 PoC 中构建了最完整的完整工作流。
- 使用商业编号根将资金接收者与注册状态进行匹配。
- 将注册支持的案例与较低置信度的仅资金后备案例区分开来。
- 添加了分数段、注意事项、来源背景、建议操作、行动简报和结果跟踪。
### 2. 幽灵容量
- 标记了具有微弱容量信号的接收者。
- 使用了缺失的 BN、稀疏补助金、高平均奖励价值和多部门模式。
- 添加了用于证据审查的接收者详细信息页面。
### 3. 资金循环
- 使用 CRA 关系数据检测循环给予/资助路径。
- 按跳数、参与者数量、瓶颈和流量值对循环进行排名。
- 将循环路径渲染为图谱证据。
### 4. 单一来源与修正案递增
- 将联邦协议的原始价值与最新的累计修正价值进行了比较。
- 避免了对联邦修正案行进行原始求和,因为协议价值是累计的。
- 通过规范化的供应商名称将阿尔伯塔省的竞争性合同与单一来源的后续合同联系起来。
- 标记了高增长、后续价值、接近阈值的模式、重复关系和非标准理由背景。
### 5. 供应商集中度
- 按来源、部门和类别构建了 BigQuery 集中度输出。
- 计算了 HHI、CR4、顶级供应商份额、有效竞争者、总金额和顶级实体。
- 添加了不变性检查,以防止发布不可能的份额指标。
### 6. 治理网络
- 规范化了董事/人员姓名。
- 构建了组织对和人员详细信息视图。
- 使用图谱布局来显示共享的治理关系。
### 7. 政策对齐
- 使用了官方规划、授权、绩效、基础设施、住房和健康指标来源。
- 将声明的优先级和计划支出与观察到的金额、结果或交付状态进行了比较。
- 添加了置信度水平和注意事项,以防止过度声明。
### 8. 重复资金与优先级缺口
- 将工作分为两个流。
- 8A 查找联邦拨款、阿尔伯塔省拨款和 CRA 报告的政府资金中的重叠资金。
- 8B 审查优先级缺口、项目延误、支出差异和没有项目匹配的分配情况。
- 为预期的共同资助添加了公共部门注意事项。
### 9. 合同情报
- 从合同数据集构建了采购级别的视图。
- 将增长分解为合同数量、平均合同价值、修正案贡献、交互效应和供应商集中度。
- 明确将指标标记为平均合同价值,而非单价。
### 10. 负面媒体
- 将媒体扫描移至后端。
- 使用了 Google News RSS 和 NewsAPI。
- 移除了浏览器端的公共 CORS 代理依赖。
- 添加了优雅的故障行为,使失败的扫描不会显示为干净的结果。
- 将媒体视为上下文审查输入,而不是独立的决策触发器。
## 数据平台
| 平台 | 角色 |
| --- | --- |
| Azure VM | 托管概念验证 Web 应用程序和 Node API |
| GCP BigQuery | 存储并计算较大的分析挑战表 |
| Postgres | 为现有的实体、资金、CRA、阿尔伯塔省、联邦、治理和图谱支持的 API 路由提供服务 |
| 公共数据集 | 联邦拨款、阿尔伯塔省合同/拨款、CRA 慈善数据、登记数据、CanadaBuys、GC InfoBase、加拿大基础设施部、CMHC、PHAC、新闻来源 |
## 人在回路设计
Maple DOGE 在设计上是建议性的。
| 设计选择 | 原因 |
| --- | --- |
| 分数是分诊信号 | 它们优先考虑审查,而不是执法 |
| 注意事项保留在证据旁边 | 审查员在采取行动前能看到不确定性 |
| 负面媒体仅作为背景 | 新闻本身不会创建案例 |
| 审查队列使用人工确认 | 必须由人员验证来源并选择建议操作 |
| 行动简报总结证据 | 决策者获得一份紧凑的审查产物 |
## 仓库布局
```
src/
React frontend, routes, dossiers, challenge pages, graph components
backend/general/
Node API, data access, entity-resolution scripts, challenge ingestion scripts
backend/general/visualizations/server.js
Main JSON API used by the web app
deploy/
Azure VM deployment helpers
public/
Static assets, including the Maple DOGE logo
```
## PoC 范围
Maple DOGE 展示了公共支出问责应用程序可以结合:
- 公共数据摄取
- 实体解析
- 排名的审查信号
- 链接来源的档案
- 图谱证据
- 采购分析
- 政策分析
- GCP BigQuery 分析表
- Azure VM 部署
- 人在回路审查工作流
挑战 1 是最完整的决策工作流。其他挑战作为调查模块实现,提供排名输出、图谱、表格、图表、来源注意事项和准备好进行深入验证的分析证据。
## 版权
版权所有 (c) 从 2026-3000 dirm02。保留所有权利。
本项目受仓库 [版权](COPYRIGHT) 声明保护。除非适用法律要求或事先获得版权持有人的书面许可,否则不得授予使用、复制、修改、发布、分发、再许可或出售本软件或源代码任何部分的许可。
标签:Azure, ESC4, Express, GCP BigQuery, GNU通用公共许可证, MITM代理, Node.js, OSINT, React, Syscalls, TypeScript, Vite, 人机协同, 代码示例, 公共支出审计, 加拿大, 可视化图谱, 合规审查, 安全插件, 慈善监管, 政务公开, 政府采购, 数据分析, 自定义脚本, 黑客松项目