coorgiri/pii.engineer

GitHub: coorgiri/pii.engineer

一款本地离线运行的个人隐私信息检测与脱敏工具,支持 50+ 语言,帮助企业和个人快速识别文档中的敏感数据以满足合规要求。

Stars: 0 | Forks: 0

# 🛡️ pii.engineer - 自动检测并隐藏隐私数据 [![](https://img.shields.io/badge/Download-Latest_Release-blue.svg)](https://github.com/coorgiri/pii.engineer/releases) pii.engineer 可以查找并遮盖文件中的敏感信息。该工具能够识别姓名、电子邮件地址、电话号码和物理地址等数据。它在您自己的计算机上运行。由于不会有任何文件离开您的系统,您可以完全控制自己的数据。 ## 📋 工具功能 GDPR、PDPA 和 PIPL 等隐私法要求您保护用户数据。人工检查文档既耗时又容易出错。本软件可扫描文本文件和文档以突出显示隐私细节。然后您可以选择删除或隐藏这些数据。 该软件支持识别十三种语言的九种实体类型。它使用 ONNX Runtime 以提高速度。您不需要专用的显卡或互联网连接即可运行此软件。 ## 💻 系统要求 - Windows 10 或 Windows 11 - 4 GB 可用内存 (RAM) - 500 MB 可用硬盘空间 - 无需安装 Python 或 Rust ## 📥 如何下载和运行 1. 访问[此页面](https://github.com/coorgiri/pii.engineer/releases)下载软件。 2. 在最新发布版块中找到以 `.exe` 结尾的文件。 3. 点击文件名开始下载。 4. 文件保存完成后,打开您的 Downloads(下载)文件夹。 5. 双击该文件以启动应用程序。 如果 Windows 显示有关受保护 PC 的消息,请点击“更多信息”,然后点击“仍要运行”。出现此消息是因为该软件是一个本地实用程序,不依赖于基于云的追踪。 ## ⚙️ 如何使用本软件 主屏幕显示一个简单的界面,包含三个主框。 ### 选择您的文件 点击标有“Add Files”的按钮以选择要扫描的文档。您可以一次选择一个或多个文件。该应用程序支持纯文本格式和常见的文档文件。 ### 选择隐私设置 设置菜单允许您选择工具应查找的信息类型。您可以启用或禁用特定类别的检测,例如姓名、出生日期或身份证号码。 ### 扫描并查看 点击“Start Scan”按钮。进度条显示分析剩余的时间。完成后,工具会显示找到的项目列表。您可以点击任何检测到的项目,查看其在文档中的位置。 ### 保存您的结果 选择“Redact”以创建隐藏了敏感信息的文档新副本。除非您选择替换选项,否则原始文件在文件夹中保持不变。 ## 🌍 支持的语言 该软件支持识别以下语言的敏感信息: - 英语 - 西班牙语 - 法语 - 德语 - 意大利语 - 葡萄牙语 - 荷兰语 - 中文 - 日语 - 韩语 - 阿拉伯语 - 俄语 - 印地语 底层引擎会分析每个句子的结构以理解上下文。这有助于在常见词汇同时充当姓名或地点时避免识别错误。 ## 🛡️ 隐私与安全 您的数据保留在本地机器上。此应用程序不连接到外部服务器。它不会将文件或分析数据发送给任何第三方。检测逻辑使用预训练模型在应用程序内部运行。 ## 🛠️ 性能提示 - 在运行大规模扫描之前,请关闭视频编辑器等大型应用程序。 - 将文件保存到本地硬盘而不是网络文件夹,以获得更快的速度。 - 如果扫描数百个文件,请等待进度条完成后再打开结果。 ## ❓ 常见问题排查 如果应用程序无法打开: - 如果您下载的是压缩文件,请确保已解压该文件。 - 检查您的用户帐户是否有权从 Downloads(下载)文件夹运行程序。 - 确认您的 Windows 版本是否为最新。 如果应用程序未找到某些数据: - 验证您的文档格式是否兼容。 - 检查设置菜单,确保已启用特定的实体类型。 - 检查您的文档是否存在低质量文本或扫描错误,因为清晰的文本会产生最佳效果。 如果应用程序运行缓慢: - 将单次批处理的文件数量限制在五十个以内。 - 禁用不需要的实体类型检测。 ## 📜 法律合规性 使用此工具可帮助您满足隐私法的要求。它不提供法律建议。请始终检查遮盖后的文档,以验证工具是否捕获了所有必要的信息。不同国家对什么算作隐私数据有不同的标准。请调整您的设置以符合适用于您具体情况的法律。
标签:AI安全工具, GDPR, NLP, ONNX, ONNX Runtime, PDPA, PII检测, PIPL, Windows应用程序, 个人数据保护, 个人隐私信息检测, 信息屏蔽, 合规, 命名实体识别, 多语言PII, 敏感信息识别, 敏感数据发现, 数据清洗, 数据脱敏, 数据防泄漏(DLP), 文件扫描, 文本处理, 无需GPU, 本地离线处理, 网络安全, 隐私保护, 隐私数据过滤