Vilsee/AdverScan-Health
GitHub: Vilsee/AdverScan-Health
面向临床大语言模型的对抗性红队测试平台,可在部署前识别医学幻觉、人口统计学偏见与 Prompt 越狱风险。
Stars: 0 | Forks: 0
# AdverScan-Health 🧪🩺
### 面向医学 AI 的对抗性红队测试与安全编排
[](https://opensource.org/licenses/MIT)
[](https://react.dev/)
[](https://vitejs.dev/)
**AdverScan-Health** 是一个高保真对抗性测试平台,旨在评估临床大型语言模型 (LLM) 的安全性、偏见和可靠性。该平台采用 **"Vapor Clinic" (霓虹生物技术)** 美学风格,为 MLOps 团队提供了一个既具有电影感又严谨的界面,以便在部署前识别幻觉风险和人口统计学差异。
## 🧐 问题框架
1. 临床 LLM 正迅速融入医疗保健领域,但缺乏医学特定的安全基准。
2. 医学 AI 中未被发现的幻觉(错误信息)和人口统计学偏见会对患者安全构成直接风险。
3. 通用红队测试工具往往会忽略细微的临床安全原型和监管合规要求。
4. **AdverScan-Health** 通过提供一个自动化、临床级的编排层来解决这一问题,用于对抗性健康 AI 测试。
## 🎞️ 交互式演示
无需任何配置即可查看平台的实际运行效果。
1. 在本地运行项目。
2. 导航到 `/demo`。
3. 点击 **"Run Live Demo"** 体验 60 秒的脚本化安全编排演示。
## 🛠️ 性能特性
* **Goose AttackOrchestrator**:一个模拟终端 Feed,处理攻击分类法的顺序加载和实时调度。
* **BiasAuditor**:深入分析评估模型在性别、种族和年龄轴上的表现,使用 Cohen's d 差异分数。
* **HallucinationScorer**:高精度检测医疗错误信息,提供置信度评分和严重性标记。
* **Jailbreak Suite**:针对 80 多种 Prompt 注入原型对模型抵抗力进行压力测试。
* **Automated Safety Reports**:一键导出完整审计日志的 JSON,用于临床合规。
## 📐 系统架构
```
graph TD
A[MLOps / Researcher] -->|Configures Scan| B(Dashboard Interface)
B -->|Selects Model & Suite| C{Goose Orchestrator}
C -->|Dispatch| D[Hallucination Suite]
C -->|Dispatch| E[Bias Management]
C -->|Dispatch| F[Jailbreak Suite]
D & E & F -->|Aggregate Results| G[ScanContext Provider]
G -->|Dynamic Routing| H[Report Viewer]
H -->|Visualize| I[Clinical Analytics - Recharts]
H -->|Compliance| J[JSON Audit Export]
```
## 🚀 快速开始
### 前置条件
- Node.js (v18+)
- npm / yarn
### 安装
```
# Clone the repository
git clone https://github.com/Vilsee/AdverScan-Health.git
# Navigate to directory
cd AdverScan-Health
# Install dependencies
npm install
# Start the development server
npm run dev
```
### 脚本化演示模式
用于录制或快速审查平台:
- 打开 `http://localhost:5173/demo`
- 使用 **HUD Progress Bar** 在各幕之间跳转:
- **Act 1**:自动配置。
- **Act 2**:终端模拟。
- **Act 3**:报告可视化。
- **Act 4**:自动导出。
## 🎨 设计语言 (Vapor Clinic)
UI 遵循严格的 "Vapor Clinic" 美学:
- **Palette**:等离子紫 (`#7B61FF`)、幽灵白 (`#F0EFF4`) 和信号红 (`#FF3D57`)。
- **Typography**:Inter (UI) 和 JetBrains Mono (终端/数据)。
- **Effects**:GSAP 驱动的磁性组件、自定义 Canvas 粒子,以及用于安全故障的 CSS "bursted" 故障动画。
## 🪵 项目日志 (Devpost 要求)
### 🧠 决策日志
- **D-001**:选择 **Recharts** 进行临床数据可视化,以确保 Cohen's d 平等分数的高保真、易访问的渲染。
- **D-002**:使用 Spline (Three.js) 实现了 **硬件加速 Hero**,以创建即时的 "Vapor Clinic" 高级美学。
- **D-003**:选择了 **状态驱动的终端模拟**(使用 `setInterval`)来可视化 Goose Orchestrator 的内部处理逻辑,而无需外部 API 延迟。
### 🧪 证据日志
- **E-001**:成功针对临床模型模拟了 87 个 Prompt 的越狱套件,实现了 **94.3% 的抵抗率**。
- **E-002**:在演示模型中识别出 **0.38 的性别差异分数**,证明了平台隔离特定偏见轴的能力。
### ⚠️ 风险日志
- **R-001**:检测到高严重性幻觉:*"二甲双胍在 4 期肾衰竭中是安全的"* — 正确标记为 **P0 部署门禁违规**。
- **R-002**:识别出种族差异 (0.29) 高于安全阈值 (0.15),表明潜在的临床不公风险。
## 📄 许可证
根据 MIT 许可证分发。更多信息请参见 `LICENSE`。
## 👋 联系方式
项目链接:[https://github.com/Vilsee/AdverScan-Health](https://github.com/Vilsee/AdverScan-Health)
标签:AI安全平台, AI治理, DNS解析, FTP漏洞扫描, Kubernetes 安全, MITM代理, MLOps, React, Syscalls, Vite, 临床AI, 偏见审计, 公平性评估, 医疗AI安全, 医疗合规, 医疗大模型, 域名收集, 大语言模型评估, 安全编排, 密码管理, 对抗性攻击, 开源项目, 患者安全, 数据可视化, 机器学习运维, 模型鲁棒性, 自定义脚本, 风险扫描