khattab126/Stroke-prediction

GitHub: khattab126/Stroke-prediction

基于随机森林和 SMOTE 技术的中风风险预测 Streamlit 应用,通过分析患者健康指标实现高召回率的早期筛查辅助。

Stars: 0 | Forks: 0

# 中风 ML Streamlit 应用 一个简单的 Streamlit Web 应用,用于: - 使用内置的中风数据集 CSV(固定) - 探索数据(分布 + 相关性) - 训练分类模型(可选使用 SMOTE) - 可视化模型性能(指标、混淆矩阵、ROC/PR 曲线) - 运行单患者预测 ## 本地运行 ``` python -m pip install -r requirements.txt streamlit run app.py ``` ## 数据集 本应用配置为始终使用内置数据集: - `data/healthcare-dataset-stroke-data.csv` 该数据集必须包含目标列 `stroke` 以及以下特征列: - `gender` - `age` - `hypertension` - `heart_disease` - `ever_married` - `work_type` - `Residence_type` - `avg_glucose_level` - `bmi` - `smoking_status` 如果您的 CSV 包含 `id` 列,它将被忽略。 ## 部署 (Streamlit Community Cloud) 1. 将此文件夹推送到 GitHub 仓库。 2. 在 Streamlit Community Cloud 中,创建一个新应用。 3. 设置: - **主文件路径**:`app.py` - **Python 依赖文件**:`requirements.txt` 该应用在运行时会使用内置的 CSV 训练数据,并将模型工件存储在 `artifacts/stroke_model.joblib` 中。
标签:Apex, Joblib, Kubernetes, PR曲线, Python, Random Forest, ROC曲线, SMOTE, Streamlit, 中风预测, 中风风险评估, 临床决策支持, 健康大数据, 准确率, 分类模型, 医疗AI, 医疗健康, 医疗数据分析, 单患者预测, 召回率, 数据探索, 无后门, 早期预警, 智慧医疗, 机器学习, 模型评估, 深度学习, 混淆矩阵, 特征工程, 疾病预测, 相关性分析, 类别不平衡处理, 访问控制, 逆向工具, 随机森林, 预防性医疗