nvisycom/elide

GitHub: nvisycom/elide

一个 Rust 可组合脱敏工具包,用于从非结构化文档中检测、移除 PII/PHI 敏感数据并构建隐私保护流水线。

Stars: 1 | Forks: 0

# elide [![Build](https://img.shields.io/github/actions/workflow/status/nvisycom/elide/build.yml?branch=main&label=build%20%26%20test&style=flat-square)](https://github.com/nvisycom/elide/actions/workflows/build.yml) 用于检测和脱敏敏感数据的可组合工具包。 elide 是一个 Rust 工具包,用于从文档中查找和移除 PII 和 PHI。 它提供了构建块(识别器、去重、 验证、脱敏和格式处理),使用者可以将它们接入 自己的文档处理流程中。elide 仅是工具包层; 编排运行时和网关服务器位于单独的项目中。 ## 功能 - **模式检测**:regex、dictionary 和 checksum 识别器可跨多种常见格式和司法管辖区查找结构化的 PII 和 PHI - **上下文感知评分**:附近的 keywords 会提升模糊匹配的置信度,因此只有当周围环境支持时,微弱的发现才会达到阈值 - **去重**:来自多个识别器的重叠发现会协调为一组实体,并进行冲突解决和置信度校准 - **脱敏操作符**:对每个检测到的实体进行掩码、替换、哈希或加密,可逆选项会记录恢复所需的信息 - **格式编解码器**:读取、编辑和写入文档(纯文本、JSON、HTML、XML 等),确保精确的往返过程,仅更改脱敏部分 - **溯源优先模型**:每个实体都携带完整的审计追踪记录,记录其是如何被发现、评分和隐藏的 ## 文档 有关架构、安全和 API 文档,请参阅 [`docs/`](docs/)。 ## 更新日志 有关发布说明和版本历史,请参阅 [CHANGELOG.md](CHANGELOG.md)。 ## 许可证 Apache 2.0 License,请参阅 [LICENSE.txt](LICENSE.txt) ## 支持 - **文档**:[docs.nvisy.com](https://docs.nvisy.com) - **问题**:[GitHub Issues](https://github.com/nvisycom/elide/issues) - **电子邮件**:[support@nvisy.com](mailto:support@nvisy.com)
标签:PII检测, Rust, 可视化界面, 数据处理流水线, 数据脱敏, 数据隐私, 文档处理, 网络流量审计, 通知系统