catboost/catboost

GitHub: catboost/catboost

由 Yandex 开源的高性能梯度提升决策树库,原生支持类别特征处理与 GPU 加速,广泛用于排序、分类和回归等机器学习任务。

Stars: 8993 | Forks: 1300

[官网](https://catboost.ai) | [文档](https://catboost.ai/docs/) | [教程](https://catboost.ai/docs/concepts/tutorials.html) | [安装](https://catboost.ai/docs/concepts/installation.html) | [发布说明](https://github.com/catboost/catboost/releases) [![GitHub license](https://img.shields.io/github/license/catboost/catboost.svg)](https://github.com/catboost/catboost/blob/master/LICENSE) [![PyPI version](https://badge.fury.io/py/catboost.svg)](https://badge.fury.io/py/catboost) [![Conda Version](https://img.shields.io/conda/vn/conda-forge/catboost.svg)](https://anaconda.org/conda-forge/catboost) [![GitHub issues](https://img.shields.io/github/issues/catboost/catboost.svg)](https://github.com/catboost/catboost/issues) [![Telegram](https://img.shields.io/badge/chat-on%20Telegram-2ba2d9.svg)](https://t.me/catboost_en) [![Twitter](https://img.shields.io/badge/@CatBoostML--_.svg?style=social&logo=twitter)](https://twitter.com/CatBoostML) CatBoost 是一种基于决策树上的[梯度提升](https://en.wikipedia.org/wiki/Gradient_boosting)的机器学习方法。 ## CatBoost 的主要优势: - 在许多数据集上与其他 GBDT 库[相比](https://github.com/catboost/benchmarks/blob/master/README.md),具有卓越的质量。 - 同类最佳的[预测](https://catboost.ai/docs/concepts/c-plus-plus-api.html)速度。 - 同时支持[数值和类别](https://catboost.ai/docs/concepts/algorithm-main-stages.html)特征。 - 开箱即用的快速 GPU 和多 GPU 训练支持。 - 内置[可视化工具](https://catboost.ai/docs/features/visualization.html)。 - 通过 [Apache Spark](https://catboost.ai/en/docs/concepts/spark-overview) 和 [CLI](https://catboost.ai/en/docs/concepts/cli-distributed-learning) 实现快速且可重现的分布式训练。 ## 入门与文档 所有 CatBoost 文档均可在[此处](https://catboost.ai/docs/)获取。 请按照以下指南安装 CatBoost: * [Python 包](https://catboost.ai/en/docs/concepts/python-installation) * [R 包](https://catboost.ai/en/docs/concepts/r-installation) * [命令行](https://catboost.ai/en/docs/concepts/cli-installation) * [Apache Spark 包](https://catboost.ai/en/docs/concepts/spark-installation) 接下来您可能想要探索: * [教程](https://github.com/catboost/tutorials/#readme) * [训练模式和指标](https://catboost.ai/docs/concepts/loss-functions.html) * [交叉验证](https://catboost.ai/docs/features/cross-validation.html#cross-validation) * [参数调优](https://catboost.ai/docs/concepts/parameter-tuning.html) * [特征重要性计算](https://catboost.ai/docs/features/feature-importances-calculation.html) * [常规](https://catboost.ai/docs/features/prediction.html#prediction)和[分阶段](https://catboost.ai/docs/features/staged-prediction.html#staged-prediction)预测 * 适用于 Apache Spark 的 CatBoost 视频:[介绍](https://youtu.be/47-mAVms-b8)和[架构](https://youtu.be/nrGt5VKZpzc) 如果您无法在浏览器中打开文档,请尝试将 yastatic.net 和 yastat.net 添加到您的 Privacy Badger 的允许域名列表中。 ## 生产环境中的 CatBoost 模型 如果您想在应用程序中评估 CatBoost 模型,请阅读[模型 API 文档](https://github.com/catboost/catboost/tree/master/catboost/CatboostModelAPI.md)。 ## 提问与 Bug 报告 * 如需报告 Bug,请使用 [catboost/bugreport](https://github.com/catboost/catboost/issues) 页面。 * 在 [CatBoost GitHub Discussions 问答论坛](https://github.com/catboost/catboost/discussions/categories/q-a)上提问。 * 在 [Stack Overflow](https://stackoverflow.com/questions/tagged/catboost) 上使用 catboost 标签提问,我们会关注上面的新问题。 * 在 [Telegram 群组](https://t.me/catboost_en)或俄语 [Telegram 聊天室](https://t.me/catboost_ru)中寻求快速建议。 ## 帮助改进 CatBoost * 查看[未解决的问题](https://github.com/catboost/catboost/blob/master/open_problems/open_problems.md)和[需要帮助的 issue](https://github.com/catboost/catboost/labels/help%20wanted)以了解可以改进的地方,或者在您有需求时提出一个 issue。 * 将您的故事和经验添加到 [Awesome CatBoost](AWESOME.md) 中。 * [贡献者指南](https://github.com/catboost/catboost/blob/master/CONTRIBUTING.md)。 ## 新闻 最新新闻发布在 [Twitter](https://twitter.com/catboostml) 上。 ## 参考论文 Anna Veronika Dorogush, Andrey Gulin, Gleb Gusev, Nikita Kazeev, Liudmila Ostroumova Prokhorenkova, Aleksandr Vorobev ["Fighting biases with dynamic boosting"](https://arxiv.org/abs/1706.09516). arXiv:1706.09516, 2017. Anna Veronika Dorogush, Vasily Ershov, Andrey Gulin ["CatBoost: gradient boosting with categorical features support"](http://learningsys.org/nips17/assets/papers/paper_11.pdf). Workshop on ML Systems at NIPS 2017. ## 许可证 © YANDEX LLC, 2017-2026。采用 Apache License, Version 2.0 授权。有关更多详细信息,请参阅 LICENSE 文件。
标签:Apex, CatBoost, GPU计算, JS文件枚举, 数据科学, 文档结构分析, 机器学习, 梯度提升树, 算法库, 资源验证, 逆向工具