ramvadlamudi29-ai/medical-llm-safety
GitHub: ramvadlamudi29-ai/medical-llm-safety
面向医疗领域的大模型安全评估平台,集成 PHI 脱敏、自动化红队攻击与防御检测,帮助验证 LLM 的 HIPAA 合规性。
Stars: 0 | Forks: 0
# 🛡️ 医疗 LLM 安全与评估平台
## 🏗️ 架构
```
inputs/inputs.csv (Raw medical data with PHI)
│
▼
scripts/sanitize.py ← HIPAA-aligned PHI de-identification
│
▼
scripts/vector_store.py ← ChromaDB semantic index (local embeddings)
│
▼
scripts/attacker_agent.py ← 12-vector Automated Red-Teaming
│
▼
scripts/defender_agent.py ← Multi-layer PHI + jailbreak detection
│
▼
app.py ← 4-page Streamlit Safety Dashboard
```
## ⚡ 快速开始
```
python -m venv venv
source venv/bin/activate # Windows: .\venv\Scripts\activate
pip install -r requirements.txt
python scripts/run_harness.py # Run full pipeline
streamlit run app.py # Open dashboard
```
## 🔴 涵盖的攻击向量(共 12 种)
| 严重性 | 类别 |
|----------|------------|
| HIGH | 直接 PHI 提取, 越狱 (DAN/Dev Mode), Prompt 注入, 社会工程学 |
| MEDIUM | 推理攻击, 聚合数据泄露, 执法部门滥用, 邮件提取, 关联分析 |
| LOW | 良性查询(基线对照) |
## 🧰 技术栈
| 层级 | 技术 |
|-------|------------|
| 数据处理 | Pandas |
| PHI 检测 | 正则表达式 (HIPAA Safe-Harbor 模式) |
| 向量数据库 | ChromaDB (持久化, 本地) |
| Embeddings | Sentence-Transformers `all-MiniLM-L6-v2` |
| 仪表盘 | Streamlit + Plotly |
## 👤 作者
**Vadlamudi Ramana Babu** | AI 安全与数据工程
📧 ramvadlamudi29@gmail.com | 📍 维杰亚瓦达, 安得拉邦
标签:AI安全, AV绕过, Chat Copilot, ChromaDB, CISA项目, FastAPI, HIPAA合规, Kubernetes, LLM越狱防御, PHI脱敏, Plotly, Python, RuleLab, Sentence-Transformers, Streamlit, 医疗大模型, 医疗数据安全, 向量数据库, 大语言模型评估, 提示词注入检测, 攻击向量, 数据匿名化, 数据清洗, 数据防泄漏(DLP), 无后门, 网络安全, 网络安全, 自动化红队, 访问控制, 语义检索, 逆向工具, 防御智能体, 隐私保护, 隐私保护