fivetran/great_expectations
GitHub: fivetran/great_expectations
Great Expectations 是一个帮助数据团队以「Expectations」规则对数据进行质量验证、自动生成文档并集成到数据管道中的开源数据质量工具。
Stars: 11565 | Forks: 1763
[](https://pypi.python.org/pypi/great_expectations)
[](https://pypi.org/project/great-expectations/#history)
[](https://pypistats.org/packages/great-expectations)
[](https://dev.azure.com/great-expectations/great_expectations/_build/latest?definitionId=1&branchName=develop)
[](https://results.pre-commit.ci/latest/github/great-expectations/great_expectations/develop)
[](https://codecov.io/gh/great-expectations/great_expectations)
[](https://doi.org/10.5281/zenodo.5683574)
[](https://twitter.com/expectgreatdata)
[](https://greatexpectations.io/slack)
[](https://github.com/great-expectations/great_expectations/graphs/contributors)
[](https://github.com/astral-sh/ruff)
## 关于 GX Core
GX Core 汇集了数千名社区成员的集体智慧,以及在全球数据质量部署中经过验证的成功记录,并将其封装成一个专为数据团队打造的超级简单的工具包。
它强大的技术工具从 Expectations 开始:这是用于你的数据的具有表现力且可扩展的单元测试。Expectations 通过为团队提供一种以直观方式表达数据质量测试的通用语言,从而促进团队协作。你可以为每组验证结果自动生成文档,让每个人都能轻松保持信息同步。这不仅简化了你的数据质量流程,还有助于保留组织内部对其数据的机构知识。
在我们的精选[案例研究](https://greatexpectations.io/case-studies/)中了解更多关于数据团队如何使用 GX Core 的信息。
## 集成支持策略
GX Core 支持 Python `3.10` 到 `3.13`。
在安装 `great_expectations` 时,可以通过设置 `GX_PYTHON_EXPERIMENTAL` 环境变量来启用对 Python `3.14` 及更高版本的实验性支持。
有关 GX 支持的数据源和其他集成,请参阅[兼容性参考](https://docs.greatexpectations.io/docs/help/compatibility_reference)获取更多信息。
## 开始使用
GX 建议在虚拟环境中部署 GX Core。有关开始使用 GX Core 的更多信息,请参阅 [GX Core 简介](https://docs.greatexpectations.io/docs/core/introduction/)。
1. 在 Python 虚拟环境内的空基础目录中运行以下命令以安装 GX Core:
pip install great_expectations
2. 运行以下命令以导入 `great_expectations module` 并创建一个 Data Context:
import great_expectations as gx
context = gx.get_context()
## 获取 GX 和社区的支持
以下列表按 GX 处理支持问题的优先级顺序排列:
1. [GX GitHub 仓库](https://github.com/great-expectations)中的 Issue 和 PR
2. 发布到 [GX Core Discourse 论坛](https://discourse.greatexpectations.io/c/oss-support/11)的问题
3. 发布到 [GX Slack 社区频道](https://greatexpectationstalk.slack.com/archives/CUTCNHN82)的问题
## 贡献
我们真诚重视社区的贡献,并始终欢迎提交 pull request。我们鼓励通过 PR 来修复 Bug 和开发新功能。对于功能请求,我们要求你首先创建一个 Issue 进行讨论,以确保该功能符合 GX Core 的愿景,并在实现方法上达成一致,从而使你的时间和精力得到充分利用。感谢你成为 GX Core 至关重要的一部分!
## 行为准则
所有在 GX Core 项目代码库、Discourse 论坛、Slack 频道和电子邮件通信中进行互动的人员,都应遵守 [GX 社区行为准则](https://discourse.greatexpectations.io/t/gx-community-code-of-conduct/1199)。
## 关于 GX Core
GX Core 汇集了数千名社区成员的集体智慧,以及在全球数据质量部署中经过验证的成功记录,并将其封装成一个专为数据团队打造的超级简单的工具包。
它强大的技术工具从 Expectations 开始:这是用于你的数据的具有表现力且可扩展的单元测试。Expectations 通过为团队提供一种以直观方式表达数据质量测试的通用语言,从而促进团队协作。你可以为每组验证结果自动生成文档,让每个人都能轻松保持信息同步。这不仅简化了你的数据质量流程,还有助于保留组织内部对其数据的机构知识。
在我们的精选[案例研究](https://greatexpectations.io/case-studies/)中了解更多关于数据团队如何使用 GX Core 的信息。
## 集成支持策略
GX Core 支持 Python `3.10` 到 `3.13`。
在安装 `great_expectations` 时,可以通过设置 `GX_PYTHON_EXPERIMENTAL` 环境变量来启用对 Python `3.14` 及更高版本的实验性支持。
有关 GX 支持的数据源和其他集成,请参阅[兼容性参考](https://docs.greatexpectations.io/docs/help/compatibility_reference)获取更多信息。
## 开始使用
GX 建议在虚拟环境中部署 GX Core。有关开始使用 GX Core 的更多信息,请参阅 [GX Core 简介](https://docs.greatexpectations.io/docs/core/introduction/)。
1. 在 Python 虚拟环境内的空基础目录中运行以下命令以安装 GX Core:
pip install great_expectations
2. 运行以下命令以导入 `great_expectations module` 并创建一个 Data Context:
import great_expectations as gx
context = gx.get_context()
## 获取 GX 和社区的支持
以下列表按 GX 处理支持问题的优先级顺序排列:
1. [GX GitHub 仓库](https://github.com/great-expectations)中的 Issue 和 PR
2. 发布到 [GX Core Discourse 论坛](https://discourse.greatexpectations.io/c/oss-support/11)的问题
3. 发布到 [GX Slack 社区频道](https://greatexpectationstalk.slack.com/archives/CUTCNHN82)的问题
## 贡献
我们真诚重视社区的贡献,并始终欢迎提交 pull request。我们鼓励通过 PR 来修复 Bug 和开发新功能。对于功能请求,我们要求你首先创建一个 Issue 进行讨论,以确保该功能符合 GX Core 的愿景,并在实现方法上达成一致,从而使你的时间和精力得到充分利用。感谢你成为 GX Core 至关重要的一部分!
## 行为准则
所有在 GX Core 项目代码库、Discourse 论坛、Slack 频道和电子邮件通信中进行互动的人员,都应遵守 [GX 社区行为准则](https://discourse.greatexpectations.io/t/gx-community-code-of-conduct/1199)。标签:Python, 数据工程, 数据测试, 数据管道, 数据质量, 数据验证, 无后门, 软件工程, 逆向工具