ramvadlamudi29-ai/medical-llm-safety

GitHub: ramvadlamudi29-ai/medical-llm-safety

面向医疗领域的大模型安全评估平台,集成 PHI 脱敏、自动化红队攻击与防御检测,帮助验证 LLM 的 HIPAA 合规性。

Stars: 0 | Forks: 0

# 🛡️ 医疗 LLM 安全与评估平台 ## 🏗️ 架构 ``` inputs/inputs.csv (Raw medical data with PHI) │ ▼ scripts/sanitize.py ← HIPAA-aligned PHI de-identification │ ▼ scripts/vector_store.py ← ChromaDB semantic index (local embeddings) │ ▼ scripts/attacker_agent.py ← 12-vector Automated Red-Teaming │ ▼ scripts/defender_agent.py ← Multi-layer PHI + jailbreak detection │ ▼ app.py ← 4-page Streamlit Safety Dashboard ``` ## ⚡ 快速开始 ``` python -m venv venv source venv/bin/activate # Windows: .\venv\Scripts\activate pip install -r requirements.txt python scripts/run_harness.py # Run full pipeline streamlit run app.py # Open dashboard ``` ## 🔴 涵盖的攻击向量(共 12 种) | 严重性 | 类别 | |----------|------------| | HIGH | 直接 PHI 提取, 越狱 (DAN/Dev Mode), Prompt 注入, 社会工程学 | | MEDIUM | 推理攻击, 聚合数据泄露, 执法部门滥用, 邮件提取, 关联分析 | | LOW | 良性查询(基线对照) | ## 🧰 技术栈 | 层级 | 技术 | |-------|------------| | 数据处理 | Pandas | | PHI 检测 | 正则表达式 (HIPAA Safe-Harbor 模式) | | 向量数据库 | ChromaDB (持久化, 本地) | | Embeddings | Sentence-Transformers `all-MiniLM-L6-v2` | | 仪表盘 | Streamlit + Plotly | ## 👤 作者 **Vadlamudi Ramana Babu** | AI 安全与数据工程 📧 ramvadlamudi29@gmail.com | 📍 维杰亚瓦达, 安得拉邦
标签:AI安全, AV绕过, Chat Copilot, ChromaDB, CISA项目, FastAPI, HIPAA合规, Kubernetes, LLM越狱防御, PHI脱敏, Plotly, Python, RuleLab, Sentence-Transformers, Streamlit, 医疗大模型, 医疗数据安全, 向量数据库, 大语言模型评估, 提示词注入检测, 攻击向量, 数据匿名化, 数据清洗, 数据防泄漏(DLP), 无后门, 网络安全, 网络安全, 自动化红队, 访问控制, 语义检索, 逆向工具, 防御智能体, 隐私保护, 隐私保护