nvisycom/elide
GitHub: nvisycom/elide
一个 Rust 可组合脱敏工具包,用于从非结构化文档中检测、移除 PII/PHI 敏感数据并构建隐私保护流水线。
Stars: 1 | Forks: 0
# elide
[](https://github.com/nvisycom/elide/actions/workflows/build.yml)
用于检测和脱敏敏感数据的可组合工具包。
elide 是一个 Rust 工具包,用于从文档中查找和移除 PII 和 PHI。
它提供了构建块(识别器、去重、
验证、脱敏和格式处理),使用者可以将它们接入
自己的文档处理流程中。elide 仅是工具包层;
编排运行时和网关服务器位于单独的项目中。
## 功能
- **模式检测**:regex、dictionary 和 checksum 识别器可跨多种常见格式和司法管辖区查找结构化的 PII 和 PHI
- **上下文感知评分**:附近的 keywords 会提升模糊匹配的置信度,因此只有当周围环境支持时,微弱的发现才会达到阈值
- **去重**:来自多个识别器的重叠发现会协调为一组实体,并进行冲突解决和置信度校准
- **脱敏操作符**:对每个检测到的实体进行掩码、替换、哈希或加密,可逆选项会记录恢复所需的信息
- **格式编解码器**:读取、编辑和写入文档(纯文本、JSON、HTML、XML 等),确保精确的往返过程,仅更改脱敏部分
- **溯源优先模型**:每个实体都携带完整的审计追踪记录,记录其是如何被发现、评分和隐藏的
## 文档
有关架构、安全和 API 文档,请参阅 [`docs/`](docs/)。
## 更新日志
有关发布说明和版本历史,请参阅 [CHANGELOG.md](CHANGELOG.md)。
## 许可证
Apache 2.0 License,请参阅 [LICENSE.txt](LICENSE.txt)
## 支持
- **文档**:[docs.nvisy.com](https://docs.nvisy.com)
- **问题**:[GitHub Issues](https://github.com/nvisycom/elide/issues)
- **电子邮件**:[support@nvisy.com](mailto:support@nvisy.com)
标签:PII检测, Rust, 可视化界面, 数据处理流水线, 数据脱敏, 数据隐私, 文档处理, 网络流量审计, 通知系统