fivetran/great_expectations

GitHub: fivetran/great_expectations

Great Expectations 是一个帮助数据团队以「Expectations」规则对数据进行质量验证、自动生成文档并集成到数据管道中的开源数据质量工具。

Stars: 11565 | Forks: 1763

[![Python 版本](https://img.shields.io/pypi/pyversions/great_expectations.svg)](https://pypi.python.org/pypi/great_expectations) [![PyPI](https://img.shields.io/pypi/v/great_expectations)](https://pypi.org/project/great-expectations/#history) [![PyPI 下载量](https://img.shields.io/pypi/dm/great-expectations)](https://pypistats.org/packages/great-expectations) [![构建状态](https://img.shields.io/azure-devops/build/great-expectations/bedaf2c2-4c4a-4b37-87b0-3877190e71f5/1)](https://dev.azure.com/great-expectations/great_expectations/_build/latest?definitionId=1&branchName=develop) [![pre-commit.ci 状态](https://results.pre-commit.ci/badge/github/great-expectations/great_expectations/develop.svg)](https://results.pre-commit.ci/latest/github/great-expectations/great_expectations/develop) [![codecov](https://codecov.io/gh/great-expectations/great_expectations/graph/badge.svg?token=rbHxgTxYTs)](https://codecov.io/gh/great-expectations/great_expectations) [![DOI](https://zenodo.org/badge/DOI/10.5281/zenodo.5683574.svg)](https://doi.org/10.5281/zenodo.5683574) [![Twitter 关注](https://img.shields.io/twitter/follow/expectgreatdata?style=social)](https://twitter.com/expectgreatdata) [![Slack 状态](https://img.shields.io/badge/slack-join_chat-white.svg?logo=slack&style=social)](https://greatexpectations.io/slack) [![贡献者](https://img.shields.io/github/contributors/great-expectations/great_expectations)](https://github.com/great-expectations/great_expectations/graphs/contributors) [![Ruff](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/astral-sh/ruff/main/assets/badge/v2.json)](https://github.com/astral-sh/ruff) ## 关于 GX Core GX Core 汇集了数千名社区成员的集体智慧,以及在全球数据质量部署中经过验证的成功记录,并将其封装成一个专为数据团队打造的超级简单的工具包。 它强大的技术工具从 Expectations 开始:这是用于你的数据的具有表现力且可扩展的单元测试。Expectations 通过为团队提供一种以直观方式表达数据质量测试的通用语言,从而促进团队协作。你可以为每组验证结果自动生成文档,让每个人都能轻松保持信息同步。这不仅简化了你的数据质量流程,还有助于保留组织内部对其数据的机构知识。 在我们的精选[案例研究](https://greatexpectations.io/case-studies/)中了解更多关于数据团队如何使用 GX Core 的信息。 ## 集成支持策略 GX Core 支持 Python `3.10` 到 `3.13`。 在安装 `great_expectations` 时,可以通过设置 `GX_PYTHON_EXPERIMENTAL` 环境变量来启用对 Python `3.14` 及更高版本的实验性支持。 有关 GX 支持的数据源和其他集成,请参阅[兼容性参考](https://docs.greatexpectations.io/docs/help/compatibility_reference)获取更多信息。 ## 开始使用 GX 建议在虚拟环境中部署 GX Core。有关开始使用 GX Core 的更多信息,请参阅 [GX Core 简介](https://docs.greatexpectations.io/docs/core/introduction/)。 1. 在 Python 虚拟环境内的空基础目录中运行以下命令以安装 GX Core: pip install great_expectations 2. 运行以下命令以导入 `great_expectations module` 并创建一个 Data Context: import great_expectations as gx context = gx.get_context() ## 获取 GX 和社区的支持 以下列表按 GX 处理支持问题的优先级顺序排列: 1. [GX GitHub 仓库](https://github.com/great-expectations)中的 Issue 和 PR 2. 发布到 [GX Core Discourse 论坛](https://discourse.greatexpectations.io/c/oss-support/11)的问题 3. 发布到 [GX Slack 社区频道](https://greatexpectationstalk.slack.com/archives/CUTCNHN82)的问题 ## 贡献 我们真诚重视社区的贡献,并始终欢迎提交 pull request。我们鼓励通过 PR 来修复 Bug 和开发新功能。对于功能请求,我们要求你首先创建一个 Issue 进行讨论,以确保该功能符合 GX Core 的愿景,并在实现方法上达成一致,从而使你的时间和精力得到充分利用。感谢你成为 GX Core 至关重要的一部分! ## 行为准则 所有在 GX Core 项目代码库、Discourse 论坛、Slack 频道和电子邮件通信中进行互动的人员,都应遵守 [GX 社区行为准则](https://discourse.greatexpectations.io/t/gx-community-code-of-conduct/1199)。
标签:Python, 数据工程, 数据测试, 数据管道, 数据质量, 数据验证, 无后门, 软件工程, 逆向工具