Ash-projects-personal/heart-attack-detection-ml

GitHub: Ash-projects-personal/heart-attack-detection-ml

一个心脏病发作预测的机器学习pipeline,整合Random Forest和TensorFlow/Keras深度神经网络模型,通过特征工程将患者生命体征转化为临床风险指标进行心脏病概率预测。

Stars: 0 | Forks: 0

# 心脏病发作检测-机器学习 [![MIT 许可证](https://img.shields.io/badge/License-MIT-yellow.svg)](LICENSE) [![Python](https://img.shields.io/badge/python-3.11-blue.svg)](https://www.python.org/) [![scikit-learn](https://img.shields.io/badge/scikit--learn-1.3+-orange)](https://scikit-learn.org/) [![TensorFlow](https://img.shields.io/badge/TensorFlow-2.13+-FF6F00)](https://www.tensorflow.org/) 构建了这个预测模型来分析医疗数据并标记高风险心脏病患者。在此推送核心 ML pipeline。 这是一个 machine learning pipeline,接收患者生命体征和 EHR 数据(年龄、胆固醇、静息血压、最大心率、ECG 结果等),并预测患心脏病的可能性。 我在特征工程上投入了大量时间——将原始指标组合成临床风险指标,如 pressure_rate_ratio 和 age_chol_risk 指数。与仅将原始特征输入算法相比,这显著提高了模型准确性。 训练了两个不同的模型来比较方法。scikit-learn 的 Random Forest 具有很好的可解释性,我用它来提取特征重要性,结果显示工程化的 high_risk_profile 和 oldpeak(ST depression)是最强的预测因子。使用 TensorFlow/Keras 的带 dropout 的 3 层 feed-forward neural network 在准确率上略胜于 Random Forest。 两个模型在测试集上都达到了约 83% 的准确率。 ``` pip install -r requirements.txt python heart_disease_predictor.py ``` 这会生成一个合成数据集(模仿 UCI Heart Disease 数据集结构),执行特征工程,训练两个模型,并将准确率指标和图表输出到 outputs/ 文件夹。 ## 免责声明 本项目仅用于教育和研究目的。它**不是**医疗器械,未经临床验证,不得用于诊断、治疗或做出任何医疗决策。请务必咨询合格的医疗专业人员。 ## 许可证 根据 [MIT 许可证](LICENSE) 发布。
标签:Apex, EHR数据, Keras, Python, Random Forest, scikit-learn, TensorFlow, 临床风险预测, 二分类问题, 人工智能医疗, 医疗健康, 医疗数据分析, 心脏病预测, 无后门, 机器学习, 模型训练, 模型评估, 深度学习, 特征工程, 疾病检测, 神经网络, 逆向工具