Vilsee/AdverScan-Health

GitHub: Vilsee/AdverScan-Health

面向临床大语言模型的对抗性红队测试平台,可在部署前识别医学幻觉、人口统计学偏见与 Prompt 越狱风险。

Stars: 0 | Forks: 0

# AdverScan-Health 🧪🩺 ### 面向医学 AI 的对抗性红队测试与安全编排 [![License: MIT](https://img.shields.io/badge/License-MIT-purple.svg)](https://opensource.org/licenses/MIT) [![React](https://img.shields.io/badge/Frontend-React%2019-blue.svg)](https://react.dev/) [![Vite](https://img.shields.io/badge/Build-Vite-646CFF.svg)](https://vitejs.dev/) **AdverScan-Health** 是一个高保真对抗性测试平台,旨在评估临床大型语言模型 (LLM) 的安全性、偏见和可靠性。该平台采用 **"Vapor Clinic" (霓虹生物技术)** 美学风格,为 MLOps 团队提供了一个既具有电影感又严谨的界面,以便在部署前识别幻觉风险和人口统计学差异。 ## 🧐 问题框架 1. 临床 LLM 正迅速融入医疗保健领域,但缺乏医学特定的安全基准。 2. 医学 AI 中未被发现的幻觉(错误信息)和人口统计学偏见会对患者安全构成直接风险。 3. 通用红队测试工具往往会忽略细微的临床安全原型和监管合规要求。 4. **AdverScan-Health** 通过提供一个自动化、临床级的编排层来解决这一问题,用于对抗性健康 AI 测试。 ## 🎞️ 交互式演示 无需任何配置即可查看平台的实际运行效果。 1. 在本地运行项目。 2. 导航到 `/demo`。 3. 点击 **"Run Live Demo"** 体验 60 秒的脚本化安全编排演示。 ## 🛠️ 性能特性 * **Goose AttackOrchestrator**:一个模拟终端 Feed,处理攻击分类法的顺序加载和实时调度。 * **BiasAuditor**:深入分析评估模型在性别、种族和年龄轴上的表现,使用 Cohen's d 差异分数。 * **HallucinationScorer**:高精度检测医疗错误信息,提供置信度评分和严重性标记。 * **Jailbreak Suite**:针对 80 多种 Prompt 注入原型对模型抵抗力进行压力测试。 * **Automated Safety Reports**:一键导出完整审计日志的 JSON,用于临床合规。 ## 📐 系统架构 ``` graph TD A[MLOps / Researcher] -->|Configures Scan| B(Dashboard Interface) B -->|Selects Model & Suite| C{Goose Orchestrator} C -->|Dispatch| D[Hallucination Suite] C -->|Dispatch| E[Bias Management] C -->|Dispatch| F[Jailbreak Suite] D & E & F -->|Aggregate Results| G[ScanContext Provider] G -->|Dynamic Routing| H[Report Viewer] H -->|Visualize| I[Clinical Analytics - Recharts] H -->|Compliance| J[JSON Audit Export] ``` ## 🚀 快速开始 ### 前置条件 - Node.js (v18+) - npm / yarn ### 安装 ``` # Clone the repository git clone https://github.com/Vilsee/AdverScan-Health.git # Navigate to directory cd AdverScan-Health # Install dependencies npm install # Start the development server npm run dev ``` ### 脚本化演示模式 用于录制或快速审查平台: - 打开 `http://localhost:5173/demo` - 使用 **HUD Progress Bar** 在各幕之间跳转: - **Act 1**:自动配置。 - **Act 2**:终端模拟。 - **Act 3**:报告可视化。 - **Act 4**:自动导出。 ## 🎨 设计语言 (Vapor Clinic) UI 遵循严格的 "Vapor Clinic" 美学: - **Palette**:等离子紫 (`#7B61FF`)、幽灵白 (`#F0EFF4`) 和信号红 (`#FF3D57`)。 - **Typography**:Inter (UI) 和 JetBrains Mono (终端/数据)。 - **Effects**:GSAP 驱动的磁性组件、自定义 Canvas 粒子,以及用于安全故障的 CSS "bursted" 故障动画。 ## 🪵 项目日志 (Devpost 要求) ### 🧠 决策日志 - **D-001**:选择 **Recharts** 进行临床数据可视化,以确保 Cohen's d 平等分数的高保真、易访问的渲染。 - **D-002**:使用 Spline (Three.js) 实现了 **硬件加速 Hero**,以创建即时的 "Vapor Clinic" 高级美学。 - **D-003**:选择了 **状态驱动的终端模拟**(使用 `setInterval`)来可视化 Goose Orchestrator 的内部处理逻辑,而无需外部 API 延迟。 ### 🧪 证据日志 - **E-001**:成功针对临床模型模拟了 87 个 Prompt 的越狱套件,实现了 **94.3% 的抵抗率**。 - **E-002**:在演示模型中识别出 **0.38 的性别差异分数**,证明了平台隔离特定偏见轴的能力。 ### ⚠️ 风险日志 - **R-001**:检测到高严重性幻觉:*"二甲双胍在 4 期肾衰竭中是安全的"* — 正确标记为 **P0 部署门禁违规**。 - **R-002**:识别出种族差异 (0.29) 高于安全阈值 (0.15),表明潜在的临床不公风险。 ## 📄 许可证 根据 MIT 许可证分发。更多信息请参见 `LICENSE`。 ## 👋 联系方式 项目链接:[https://github.com/Vilsee/AdverScan-Health](https://github.com/Vilsee/AdverScan-Health)
标签:AI安全平台, AI治理, DNS解析, FTP漏洞扫描, Kubernetes 安全, MITM代理, MLOps, React, Syscalls, Vite, 临床AI, 偏见审计, 公平性评估, 医疗AI安全, 医疗合规, 医疗大模型, 域名收集, 大语言模型评估, 安全编排, 密码管理, 对抗性攻击, 开源项目, 患者安全, 数据可视化, 机器学习运维, 模型鲁棒性, 自定义脚本, 风险扫描