coorgiri/pii.engineer
GitHub: coorgiri/pii.engineer
一款本地离线运行的个人隐私信息检测与脱敏工具,支持 50+ 语言,帮助企业和个人快速识别文档中的敏感数据以满足合规要求。
Stars: 0 | Forks: 0
# 🛡️ pii.engineer - 自动检测并隐藏隐私数据
[](https://github.com/coorgiri/pii.engineer/releases)
pii.engineer 可以查找并遮盖文件中的敏感信息。该工具能够识别姓名、电子邮件地址、电话号码和物理地址等数据。它在您自己的计算机上运行。由于不会有任何文件离开您的系统,您可以完全控制自己的数据。
## 📋 工具功能
GDPR、PDPA 和 PIPL 等隐私法要求您保护用户数据。人工检查文档既耗时又容易出错。本软件可扫描文本文件和文档以突出显示隐私细节。然后您可以选择删除或隐藏这些数据。
该软件支持识别十三种语言的九种实体类型。它使用 ONNX Runtime 以提高速度。您不需要专用的显卡或互联网连接即可运行此软件。
## 💻 系统要求
- Windows 10 或 Windows 11
- 4 GB 可用内存 (RAM)
- 500 MB 可用硬盘空间
- 无需安装 Python 或 Rust
## 📥 如何下载和运行
1. 访问[此页面](https://github.com/coorgiri/pii.engineer/releases)下载软件。
2. 在最新发布版块中找到以 `.exe` 结尾的文件。
3. 点击文件名开始下载。
4. 文件保存完成后,打开您的 Downloads(下载)文件夹。
5. 双击该文件以启动应用程序。
如果 Windows 显示有关受保护 PC 的消息,请点击“更多信息”,然后点击“仍要运行”。出现此消息是因为该软件是一个本地实用程序,不依赖于基于云的追踪。
## ⚙️ 如何使用本软件
主屏幕显示一个简单的界面,包含三个主框。
### 选择您的文件
点击标有“Add Files”的按钮以选择要扫描的文档。您可以一次选择一个或多个文件。该应用程序支持纯文本格式和常见的文档文件。
### 选择隐私设置
设置菜单允许您选择工具应查找的信息类型。您可以启用或禁用特定类别的检测,例如姓名、出生日期或身份证号码。
### 扫描并查看
点击“Start Scan”按钮。进度条显示分析剩余的时间。完成后,工具会显示找到的项目列表。您可以点击任何检测到的项目,查看其在文档中的位置。
### 保存您的结果
选择“Redact”以创建隐藏了敏感信息的文档新副本。除非您选择替换选项,否则原始文件在文件夹中保持不变。
## 🌍 支持的语言
该软件支持识别以下语言的敏感信息:
- 英语
- 西班牙语
- 法语
- 德语
- 意大利语
- 葡萄牙语
- 荷兰语
- 中文
- 日语
- 韩语
- 阿拉伯语
- 俄语
- 印地语
底层引擎会分析每个句子的结构以理解上下文。这有助于在常见词汇同时充当姓名或地点时避免识别错误。
## 🛡️ 隐私与安全
您的数据保留在本地机器上。此应用程序不连接到外部服务器。它不会将文件或分析数据发送给任何第三方。检测逻辑使用预训练模型在应用程序内部运行。
## 🛠️ 性能提示
- 在运行大规模扫描之前,请关闭视频编辑器等大型应用程序。
- 将文件保存到本地硬盘而不是网络文件夹,以获得更快的速度。
- 如果扫描数百个文件,请等待进度条完成后再打开结果。
## ❓ 常见问题排查
如果应用程序无法打开:
- 如果您下载的是压缩文件,请确保已解压该文件。
- 检查您的用户帐户是否有权从 Downloads(下载)文件夹运行程序。
- 确认您的 Windows 版本是否为最新。
如果应用程序未找到某些数据:
- 验证您的文档格式是否兼容。
- 检查设置菜单,确保已启用特定的实体类型。
- 检查您的文档是否存在低质量文本或扫描错误,因为清晰的文本会产生最佳效果。
如果应用程序运行缓慢:
- 将单次批处理的文件数量限制在五十个以内。
- 禁用不需要的实体类型检测。
## 📜 法律合规性
使用此工具可帮助您满足隐私法的要求。它不提供法律建议。请始终检查遮盖后的文档,以验证工具是否捕获了所有必要的信息。不同国家对什么算作隐私数据有不同的标准。请调整您的设置以符合适用于您具体情况的法律。
标签:AI安全工具, GDPR, NLP, ONNX, ONNX Runtime, PDPA, PII检测, PIPL, Windows应用程序, 个人数据保护, 个人隐私信息检测, 信息屏蔽, 合规, 命名实体识别, 多语言PII, 敏感信息识别, 敏感数据发现, 数据清洗, 数据脱敏, 数据防泄漏(DLP), 文件扫描, 文本处理, 无需GPU, 本地离线处理, 网络安全, 隐私保护, 隐私数据过滤