poojakira/poojakira

GitHub: poojakira/poojakira

Pooja Kiran 的机器学习安全工程个人项目,专注于模型安全与隐私保护。

Stars: 0 | Forks: 0

# Pooja Kiran **机器学习安全工程师** 凤凰城,亚利桑那州 | [LinkedIn](https://www.linkedin.com/in/pooja-kiran/) | [GitHub](https://github.com/poojakira) ## 核心机器学习安全仓库 | 仓库 | 核心功能 | 安全特性展示 | 状态 | |---|---|---|---| | [Model-Supply-Chain-Auditor](https://github.com/poojakira/Model-Supply-Chain-Auditor) | pickle 字节码的静态分析,用于检测恶意操作码和 Ed25519 模型签名。 | **完整性**:防止通过模型权重执行任意代码,并确保工件来源可追溯。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/93c767fd4f061339.svg) | | [LLM-Guard-Scanner](https://github.com/poojakira/LLM-Guard-Scanner) | 用于检测提示注入、PII 泄露和 RAG 毒化的轻量级扫描器。 | **输入验证**:强化 LLM 接口以抵御对抗性提示和敏感数据泄露。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/787eccc6fb061340.svg) | | [ML-Privacy-Attacks](https://github.com/poojakira/ML-Privacy-Attacks) | 使用 DP-SGD 防御实现的成员推理和模型反演攻击。 | **机密性**:量化并减轻深度学习模型中的训练数据泄露。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/76d43b8c91061341.svg) | | [docquery](https://github.com/poojakira/docquery) | 具有多租户隔离和检索阶段安全控制的 RAG 管道生产环境。 | **隔离**:确保数据分离,并防止检索增强系统中的间接提示注入。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/d9befc0550061342.svg) | | [Adversarial-Robustness-Toolkit](https://github.com/poojakira/Adversarial-Robustness-Toolkit) | 对抗攻击套件(FGSM、PGD、C&W)和视觉模型的鲁棒训练实现。 | **可用性/可靠性**:评估模型在对抗噪声下的性能,并实施加固。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/907072f83d061343.svg) | | [Secure-ML-platform](https://github.com/poojakira/Secure-ML-platform) | 基于 JWT 的 RBAC 和哈希链式审计日志的模型安全托管基础设施。 | **访问控制**:实施最小权限访问和非否认审计,以保护机器学习基础设施。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/f8d3d7633d061344.svg) | ## 技术能力 - **对抗性机器学习**:实现规避、毒化和隐私攻击;对抗性训练和防御。 - **机器学习运维安全**:模型签名(Ed25519)、SBOM 生成、SLSA 可追溯性和安全工件分发。 - **LLM 安全**:提示注入检测、PII 删除和 RAG 管道的安全控制。 - **安全工程**:JWT/OAuth2、RBAC、哈希链式日志和自动化安全扫描(pip-audit、ruff)。 - **框架**:PyTorch、FastAPI、Qdrant、Docker、GitHub Actions。 - **标准**:MITRE ATLAS、OWASP LLM Top 10、NIST AI RMF。 ## 安全与限制 此项目是一个研究原型,并不打算用于生产环境。它尚未经过正式审计,可能存在漏洞。具体限制包括: - 没有正式的安全或鲁棒性保证。 - 可能无法保护所有类型的攻击。 ### 威胁模型 本节概述了假设的攻击者能力和保护范围。我们假设攻击者具有访问模型和数据的“白盒”权限,但并不一定有访问训练基础设施的权限。我们不明确保护针对零日漏洞或超出典型研究原型范围的非常复杂、有针对性的攻击。 ## 数据、隐私和伦理 此项目使用的数据是合成的、公开可用的或匿名化的。除非明确声明和证明,否则不使用任何敏感个人数据。用户应意识到部署机器学习模型的伦理影响,并确保遵守相关隐私法规。 ## 供应链安全 为确保依赖项的完整性,我们建议定期运行 `pip-audit` 或 `safety`。对于模型工件,应记录哈希和验证步骤,以防止篡改。
标签:凭据扫描, 请求拦截