arx-deidentifier/arx

GitHub: arx-deidentifier/arx

一款支持多种隐私模型的开源数据脱敏工具,帮助组织在保护个人隐私的前提下安全发布数据。

Stars: 700 | Forks: 232

# ARX - 开源数据脱敏软件 ## 注意 ARX 是一个研究项目的成果。为了支持我们的研究,请在科学文章中引用我们的论文之一,而不是引用我们的网站。您可以在[这里](https://arx.deidentifier.org/publications/)找到关于 ARX 的论文概述。如果您不确定引用哪篇论文,我们推荐这一篇: Prasser F., Eicher J., Spengler H., Bild R., Kuhn K. A. (2020) Flexible Data Anonymization Using ARX — Current Status and Challenges Ahead. Software Pract Exper 2020;1–28. [(链接)](https://doi.org/10.1002/spe.2812) 谢谢! ## 简介 ARX 是一款用于脱敏敏感个人数据的综合开源软件。 它从一开始就被设计为具有高度的可扩展性、易用性,并且紧密集成了与数据脱敏相关的许多不同方面。其主要亮点包括: * 基于效用聚焦的脱敏,使用不同的统计模型 * 语法隐私模型,例如 k-anonymity、ℓ-diversity、t-closeness 和 δ-presence * 语义隐私模型,例如 (ɛ, δ)-differential privacy * 基于货币成本效益分析优化数据发布盈利性的方法 * 数据转换,包括泛化、抑制、微聚合和顶部/底部编码,以及全局和局部重编码 * 分析数据效用的方法 * 分析重识别风险的方法 该软件能够在商用硬件上处理非常庞大的数据集,并具有直观的跨平台图形用户界面。您可以在项目[网站](https://arx.deidentifier.org/)上找到更多信息。 ## 开发设置 目前,ARX 的主要开发工作使用 Eclipse 作为 IDE,并使用 Ant 作为构建工具。对 IntelliJ IDEA 和 Maven 等其他 IDE 的支持尚处于实验阶段。 Ant 构建脚本包含各种目标,可用于构建不同版本的 ARX(例如,包含或不包含 GUI 代码)。 要使用 Maven 构建项目,请运行一次安装脚本以注册依赖项,然后通过 Maven CLI 执行构建过程,以编译 ARX 主代码模块和 GUI 组件: ``` ./install_deps.sh # 配置文件: gtk-64 (Linux), win-64 (Windows), osx-64 (Mac) mvn clean package compile -P gtk-64 -Dcore=true -DskipTests ``` ## 贡献与行为准则 请参阅[这里](https://github.com/arx-deidentifier/arx/blob/master/contributing.md)和[这里](https://github.com/arx-deidentifier/arx/blob/master/code_of_conduct.md)。 ## 许可证 ARX (C) 2012 - 2025 Fabian Prasser 及贡献者。 根据 Apache 许可证 2.0 版(以下简称“许可证”)获得许可; 除非遵守本许可证,否则您不得使用本文件。 您可以在以下位置获取许可证副本 http://www.apache.org/licenses/LICENSE-2.0 除非适用法律要求或书面同意,否则根据许可证分发的软件 是按“原样”分发的, 没有任何形式的明示或暗示的担保或条件。 请参阅许可证以了解管理许可和限制的具体语言。 ## 外部库 ARX 使用了外部库。其许可证列在各自的文件夹中。
标签:Ant, Eclipse, GDPR, GUI, JS文件枚举, K-匿名, L-多样性, T-接近性, 二进制发布, 人工智能安全, 医疗数据, 去标识化, 合规性, 域名枚举, 域名枚举, 大数据安全, 差分隐私, 开源工具, 微聚合, 敏感数据, 数据匿名化, 数据发布, 数据抑制, 数据泛化, 数据脱敏, 数据质量分析, 科研工具, 统计分析, 网络安全, 重识别风险, 隐私保护, 隐私计算