dquillman/medicaid-inspector

GitHub: dquillman/medicaid-inspector

面向 Medicaid 提供商数据的生产级欺诈检测平台，通过统计异常检测与规则引擎对十万级提供商进行多维风险评分并生成审查队列。

Stars: 0 | Forks: 0

# Medicaid Inspector Medicaid 提供商数据的生产级欺诈检测平台。使用统计异常检测和基于规则的信号，扫描 10 万+ 提供商，并标记计费违规、空壳实体网络和虚假计费模式。 **在线地址：** [https://medicaid-inspector.web.app](https://medicaid-inspector.web.app) ## 功能介绍接入 Medicaid 理赔数据，基于六项独立的欺诈信号对每位提供商进行评分，并为调查人员生成一个排序后的审查队列。 | 信号 | 检测目标 | | :---- | :---- | | `claims_per_bene_anomaly` | 计费额度高于同专业同行平均值 >3σ 的提供商 | | `bene_concentration` | 单个受益人的理赔数量过多（虚假计费模式） | | `upcoding_pattern` | 单个高报销代码在提供商的代码组合中占主导地位 | | `address_cluster_risk` | 多个提供商共用一个地址（OIG 并址标记） | | `corporate_shell_risk` | 一名授权官员控制多个 NPI（空壳网络） | | `oig_exclusion` | 与联邦 OIG 排除名单进行交叉比对 | 每位提供商都会获得一个加权综合风险评分。分析师按自上而下的顺序处理该队列。 ## 技术栈 - **后端** — Python 3.11、FastAPI、DuckDB 查询 Azure Blob Storage 上的远程 Parquet 数据 - **前端** — React + TypeScript + Vite + Tailwind - **基础设施** — Google Cloud Run（自动扩缩容 0–3 个实例，2 GB）、Firebase Hosting、Cloud Build CI/CD - **数据规模** — 106,660 名提供商，多年理赔历史记录（2018 年至今） ## 架构亮点 - 模块化服务层：`core/`、`routes/`、`services/`、`tests/` - **符合 HIPAA 标准的审计日志** — 每次对 PHI 的访问均记录在 `phi_access_log.json` 中 - **可配置的规则引擎** — `alert_rules.json` 和 `watchlist.json` 支持免重新部署编辑 - 速率限制 + 基于角色的身份验证（admin / analyst / user） - 无状态后端；理赔数据从不进行本地持久化 - API 网关：Firebase Hosting 将 `/api/**` 重写至 Cloud Run ## 本地运行 # 后端 cd backend pip install -r requirements.txt uvicorn main:app --reload --port 8000 # 前端 cd frontend npm install npm run dev 生产环境部署说明请参见 [`DEPLOY.md`](http://./DEPLOY.md)。 ## 当前状态活跃。被用作政府理赔数据欺诈检测工作流的参考实现。

标签：AV绕过, Azure Blob Storage, DuckDB, FastAPI, Firebase, Google Cloud Run, HIPAA, Medicaid, OIG排除名单, Parquet, React, Streamlit, Syscalls, Tailwind CSS, TypeScript, Vite, 云计算, 代码示例, 医疗合规, 医疗欺诈检测, 医疗滥用, 安全插件, 审计日志, 异常检测, 微服务架构, 数据分析, 无服务器, 空壳公司识别, 统计异常, 网络虚假计费, 自动扩缩容, 规则引擎, 角色身份验证, 访问控制, 调查队列, 风险评分