poojakira/poojakira

GitHub: poojakira/poojakira

Pooja Kiran 的机器学习安全工程个人项目，专注于模型安全与隐私保护。

Stars: 1 | Forks: 0

# Pooja Kiran **机器学习安全工程师** 凤凰城，亚利桑那州 | [LinkedIn](https://www.linkedin.com/in/pooja-kiran/) | [GitHub](https://github.com/poojakira) ## 核心机器学习安全仓库 | 仓库 | 核心功能 | 安全特性展示 | 状态 | |---|---|---|---| | [Model-Supply-Chain-Auditor](https://github.com/poojakira/Model-Supply-Chain-Auditor) | pickle 字节码的静态分析，用于检测恶意操作码和 Ed25519 模型签名。 | **完整性**：防止通过模型权重执行任意代码，并确保工件来源可追溯。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/93c767fd4f061339.svg) | | [LLM-Guard-Scanner](https://github.com/poojakira/LLM-Guard-Scanner) | 用于检测提示注入、PII 泄露和 RAG 毒化的轻量级扫描器。 | **输入验证**：强化 LLM 接口以抵御对抗性提示和敏感数据泄露。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/787eccc6fb061340.svg) | | [ML-Privacy-Attacks](https://github.com/poojakira/ML-Privacy-Attacks) | 使用 DP-SGD 防御实现的成员推理和模型反演攻击。 | **机密性**：量化并减轻深度学习模型中的训练数据泄露。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/76d43b8c91061341.svg) | | [docquery](https://github.com/poojakira/docquery) | 具有多租户隔离和检索阶段安全控制的 RAG 管道生产环境。 | **隔离**：确保数据分离，并防止检索增强系统中的间接提示注入。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/d9befc0550061342.svg) | | [Adversarial-Robustness-Toolkit](https://github.com/poojakira/Adversarial-Robustness-Toolkit) | 对抗攻击套件（FGSM、PGD、C&W）和视觉模型的鲁棒训练实现。 | **可用性/可靠性**：评估模型在对抗噪声下的性能，并实施加固。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/907072f83d061343.svg) | | [Secure-ML-platform](https://github.com/poojakira/Secure-ML-platform) | 基于 JWT 的 RBAC 和哈希链式审计日志的模型安全托管基础设施。 | **访问控制**：实施最小权限访问和非否认审计，以保护机器学习基础设施。 | ![CI](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/f8d3d7633d061344.svg) | ## 技术能力 - **对抗性机器学习**：实现规避、毒化和隐私攻击；对抗性训练和防御。 - **机器学习运维安全**：模型签名（Ed25519）、SBOM 生成、SLSA 可追溯性和安全工件分发。 - **LLM 安全**：提示注入检测、PII 删除和 RAG 管道的安全控制。 - **安全工程**：JWT/OAuth2、RBAC、哈希链式日志和自动化安全扫描（pip-audit、ruff）。 - **框架**：PyTorch、FastAPI、Qdrant、Docker、GitHub Actions。 - **标准**：MITRE ATLAS、OWASP LLM Top 10、NIST AI RMF。 ## 安全与限制此项目是一个研究原型，并不打算用于生产环境。它尚未经过正式审计，可能存在漏洞。具体限制包括： - 没有正式的安全或鲁棒性保证。 - 可能无法保护所有类型的攻击。 ### 威胁模型本节概述了假设的攻击者能力和保护范围。我们假设攻击者具有访问模型和数据的“白盒”权限，但并不一定有访问训练基础设施的权限。我们不明确保护针对零日漏洞或超出典型研究原型范围的非常复杂、有针对性的攻击。 ## 数据、隐私和伦理此项目使用的数据是合成的、公开可用的或匿名化的。除非明确声明和证明，否则不使用任何敏感个人数据。用户应意识到部署机器学习模型的伦理影响，并确保遵守相关隐私法规。 ## 供应链安全为确保依赖项的完整性，我们建议定期运行 `pip-audit` 或 `safety`。对于模型工件，应记录哈希和验证步骤，以防止篡改。

标签：凭据扫描, 请求拦截