aliureza/titanic-survival-prediction

GitHub: aliureza/titanic-survival-prediction

泰坦尼克号乘客生存预测机器学习项目

Stars: 0 | Forks: 0

# 🚢 泰坦尼克号生存预测 使用机器学习预测泰坦尼克号乘客的生存情况。 ## 📊 数据集 - 891名乘客,12个特征 - 目标:`Survived`(0 = 死亡,1 = 生存) ## 🔍 关键步骤 1. 数据清洗(缺失值,异常值) 2. 探索性数据分析(EDA) 3. 特征工程(船舱字母,编码) 4. 相关性分析与特征选择 5. 模型训练与比较 ## 🤖 使用模型 - 逻辑回归 - 随机森林 - SVM - KNN - 决策树 - XGBoost ## 📈 最佳性能 **XGBoost** 达到 **83.05% 准确率** 和 **0.8269 F1 分数** ## 📁 文件 - `titanic.ipynb` - 主要 Jupyter 笔记本 - `titanic.csv` - 原始数据集 - `requirements.txt` - 依赖项 ## 🚀 如何运行 ``` pip install -r requirements.txt jupyter notebook titanic.ipynb ```
标签:Apex, BSD, F1 分数, K近邻, NoSQL, pip, Python, XGBoost, 依赖管理, 决策树, 异常检测, 支持向量机, 数据挖掘, 数据清洗, 无后门, 机器学习, 模型比较, 模型评估, 特征工程, 逆向工具, 逻辑回归, 随机森林