aliureza/titanic-survival-prediction
GitHub: aliureza/titanic-survival-prediction
泰坦尼克号乘客生存预测机器学习项目
Stars: 0 | Forks: 0
# 🚢 泰坦尼克号生存预测
使用机器学习预测泰坦尼克号乘客的生存情况。
## 📊 数据集
- 891名乘客,12个特征
- 目标:`Survived`(0 = 死亡,1 = 生存)
## 🔍 关键步骤
1. 数据清洗(缺失值,异常值)
2. 探索性数据分析(EDA)
3. 特征工程(船舱字母,编码)
4. 相关性分析与特征选择
5. 模型训练与比较
## 🤖 使用模型
- 逻辑回归
- 随机森林
- SVM
- KNN
- 决策树
- XGBoost
## 📈 最佳性能
**XGBoost** 达到 **83.05% 准确率** 和 **0.8269 F1 分数**
## 📁 文件
- `titanic.ipynb` - 主要 Jupyter 笔记本
- `titanic.csv` - 原始数据集
- `requirements.txt` - 依赖项
## 🚀 如何运行
```
pip install -r requirements.txt
jupyter notebook titanic.ipynb
```
标签:Apex, BSD, F1 分数, K近邻, NoSQL, pip, Python, XGBoost, 依赖管理, 决策树, 异常检测, 支持向量机, 数据挖掘, 数据清洗, 无后门, 机器学习, 模型比较, 模型评估, 特征工程, 逆向工具, 逻辑回归, 随机森林