shreyaspadhi2003/universal-ds-pipeline
GitHub: shreyaspadhi2003/universal-ds-pipeline
一个针对表格数据的自动化端到端数据科学流水线,能自动识别问题类型并运行百余种机器学习模型。
Stars: 0 | Forks: 0
# 通用数据科学 Pipeline
一个适用于任何表格数据集的自动化端到端数据科学 pipeline。
## 功能特性
- 自动检测列类型、目标变量和问题类型
- 支持单个或多个关系型数据集(CSV/Excel)
- 运行 100 多种模型,涵盖回归、分类、聚类、时间序列、异常检测
- 关联规则 / 购物篮分析
- 混合集成模型(投票、stacking、blending)
- SHAP 可解释性
- 包含可视化的完整 EDA
- 特征重要性与特征选择
## 如何运行
```
cd universal_ds_pipeline
python main.py
```
## 环境要求
```
pip install -r requirements.txt
```
标签:Apex, AutoML, DNS解析, EDA, Python, SHAP, 关联规则, 分类, 回归分析, 堆叠模型, 市场篮子分析, 开源项目, 异常检测, 投票模型, 探索性数据分析, 数据科学, 无后门, 时间序列分析, 机器学习, 模型可解释性, 深度学习, 特征工程, 特征选择, 端到端流水线, 聚类, 自动化机器学习, 表格数据处理, 资源验证, 逆向工具, 集成学习