shreyaspadhi2003/universal-ds-pipeline

GitHub: shreyaspadhi2003/universal-ds-pipeline

一个针对表格数据的自动化端到端数据科学流水线，能自动识别问题类型并运行百余种机器学习模型。

Stars: 0 | Forks: 0

# 通用数据科学 Pipeline 一个适用于任何表格数据集的自动化端到端数据科学 pipeline。 ## 功能特性 - 自动检测列类型、目标变量和问题类型 - 支持单个或多个关系型数据集（CSV/Excel） - 运行 100 多种模型，涵盖回归、分类、聚类、时间序列、异常检测 - 关联规则 / 购物篮分析 - 混合集成模型（投票、stacking、blending） - SHAP 可解释性 - 包含可视化的完整 EDA - 特征重要性与特征选择 ## 如何运行 ``` cd universal_ds_pipeline python main.py ``` ## 环境要求 ``` pip install -r requirements.txt ```

标签：Apex, AutoML, DNS解析, EDA, Python, SHAP, 关联规则, 分类, 回归分析, 堆叠模型, 市场篮子分析, 开源项目, 异常检测, 投票模型, 探索性数据分析, 数据科学, 无后门, 时间序列分析, 机器学习, 模型可解释性, 深度学习, 特征工程, 特征选择, 端到端流水线, 聚类, 自动化机器学习, 表格数据处理, 资源验证, 逆向工具, 集成学习