Fahad-Mutlaq/XAI-Diabetes-Prediction
GitHub: Fahad-Mutlaq/XAI-Diabetes-Prediction
一个基于 XGBoost 与 SHAP 的可解释 AI 糖尿病早期筛查框架,通过优化临床敏感度并提供透明的诊断依据来解决医疗预测模型不可信的问题。
Stars: 0 | Forks: 0
使用可解释 AI (XAI) 进行糖尿病风险早期预测
一个安全、基于云的预测框架,利用可解释人工智能 (XAI) 通过 临床偏置 XGBoost 引擎提供高敏感度、透明且临床安全的早期糖尿病风险评估。
Figure 1: Comprehensive Data Processing, Cloud-Modeling, and Validation Layer Architecture.
解决方案: 将专用的 `TreeExplainer` 直接绑定到模型结构中,计算确切的 Shapley 值,以满足严格的透明度要求。 * **类不平衡现实:** 公共卫生数据包含了绝大多数的非糖尿病报告。
解决方案: 在训练配置中原生地传入成本敏感向量 (`scale_pos_weight = 1.3`),重罚漏诊情况而不增加合成畸变。 * **运营阈值设定:** 由于方差影响,标准的 0.5 分界点会错误分类高风险糖尿病患者。
解决方案: 执行了穷举式的 Precision-Recall 步骤优化,覆盖基线配置以硬编码目标为 `0.295` 的临床阈值。 ## 快速开始 (部署与验证) ### 前置条件 * **环境:** Google Colab、Jupyter Notebook 或本地化的 Python IDE。 * **核心语言:** Python 3.x * **所需环境:** 直接在 `requirements.txt` 中列出的库。 ### 执行 Pipeline 1. 将项目环境结构克隆到您的工作区: git clone [https://github.com/Fahad-Mutlaq/XAI-Diabetes-Prediction.git](https://github.com/Fahad-Mutlaq/XAI-Diabetes-Prediction.git) cd XAI-Diabetes-Prediction 2. 即时安装指定的库版本: pip install -r requirements.txt 3. 运行主要建模脚本或逐步的 Notebook 结构以评估指标,并重新生成局部/全局的 SHAP 图表: python main.py ## 未来路线图 (可扩展性与云端演进) 为了弥合学术原型与企业医院整合之间的差距: 1. **容器化的 API Gateway 部署:** 将 Python pipeline 封装在安全的 **Docker 容器**中,并通过 **AWS API Gateway** 或 Azure 端点利用现代 TLS 1.3 加密进行扩展。 2. **实时 EHR 获取:** 通过专用的、由 IAM 控制的私有获取适配器,将模型组件直接连接到 Electronic Health Record (EHR) 数据库流。 3. **优化的 Edge 推理:** 通过 TensorRT/ONNX runtime 编译最终确定的 XGBoost 结构,以便在气隙隔离的**医院 Edge 设备**上本地执行,防止关键患者数据在开放的公共网络连接中泄露。 ## 项目团队与学术背景 于 **Qassim University**(信息技术系)开发 **最终成绩:** A+ ### IT 工程团队 * **[Fahad Alharbi](https://www.linkedin.com/in/fahad-mu-alharbi)** * **Abdulmajeed Abalkhail** * **Abdullah Altuwaijri** * **Abdulmohsen Aleid** ### 学术指导 * **Manal Alghaith 博士** ## 许可证 本项目的编制纯粹出于学术研究、验证和教育作品集应用的目的。在处理实时的公共患者分析之前,请务必确保严格遵守全球医疗指南和法定数据法案(例如 HIPAA)。 ## 联系交流 无论您是有兴趣合作、对安全的 ML pipeline 有疑问,还是想讨论创新的 IT 医疗保健解决方案——请随时直接联系!
标签:Python, XGBoost, 人工智能, 医疗健康, 可解释AI, 无后门, 用户模式Hook绕过, 疾病预测, 逆向工具