Zeel2205/neurological-disease-prediction-

GitHub: Zeel2205/neurological-disease-prediction-

利用分类、聚类与关联规则等数据挖掘技术,基于临床与行为数据集对帕金森病、阿尔茨海默病和癫痫进行早期预测的机器学习项目。

Stars: 0 | Forks: 0

# 神经疾病预测- 这是一个机器学习与数据挖掘项目,旨在利用分类、聚类和关联规则挖掘技术对帕金森病、阿尔茨海默病和癫痫进行早期检测。该项目通过分析临床与行为数据集,为早期诊断和风险预测提供支持。 神经疾病早期检测的预测性分析 概述 本项目应用数据挖掘与机器学习技术,在早期阶段检测诸如帕金森病、阿尔茨海默病和癫痫等神经疾病。该系统分析患者的临床与行为数据,识别风险模式,并使用多种机器学习算法预测疾病的发生。 目标 神经疾病的早期预测。 执行探索性数据分析 (EDA)。 应用聚类技术。 使用 Apriori 算法生成关联规则。 比较多种分类模型。 使用准确率、ROC 曲线和混淆矩阵评估模型性能。 数据集 本项目使用了三个数据集: 帕金森病数据集 阿尔茨海默病数据集 癫痫数据集 每个数据集包含约 20,000 条患者记录。 使用的技术 Python Pandas NumPy Matplotlib Seaborn Scikit-Learn XGBoost LightGBM CatBoost Mlxtend 项目工作流 1. 数据预处理 数据集加载 缺失值检查 特征编码 特征选择 数据缩放 2. 探索性数据分析 单变量分析 双变量分析 多变量分析 相关性热力图 3. 聚类 K-Means 聚类 层次聚类 DBSCAN 聚类 4. 关联规则挖掘 Apriori 算法 频繁项集生成 关联规则提取 5. 分类模型 Logistic Regression Random Forest Support Vector Machine (SVM) Naive Bayes Decision Tree AdaBoost Gradient Boosting XGBoost LightGBM CatBoost 结果 帕金森病数据集模型对比 模型 准确率 AdaBoost 51.35% XGBoost 50.75% Gradient Boosting 50.38% Logistic Regression 50.30% Random Forest 50.20% 表现最佳的模型:准确率为 51.35% 的 AdaBoost 分类器。 主要发现 聚类技术未能清晰地将疾病类别区分开来。 DBSCAN 可有效用于识别异常值。 Apriori 分析显示单个特征之间的关联性较弱。 由于特征交互复杂,神经疾病预测需要采用监督学习方法。 目录结构 neurological-disease-prediction/ │ ├── datasets/ │ ├── parkinsons_dataset.csv │ ├── alzheimers_dataset.csv │ └── epilepsy_dataset.csv │ ├── notebooks/ │ └── Neurological_Disease_Prediction.ipynb │ ├── images/ │ ├── roc_curve.png │ ├── confusion_matrix.png │ └── model_comparison.png │ ├── requirements.txt ├── README.md └── LICENSE
标签:Apex, BSD, Python数据科学, 分类与聚类, 医疗健康, 数据挖掘, 机器学习, 疾病预测, 逆向工具