ai-health-redteam/ai-health-redteam

GitHub: health-ai-testbed/ai-health-redteam

AI健康应用红队评估框架，通过可配置的偏差探针和结构化临床案例系统性检测医疗AI的公平性与分诊质量。

Stars: 0 | Forks: 0

# AI Health RedTeam **AI Health App 评估框架** —— 一个用于对 AI 健康应用进行红队测试的提示词生成器，支持可配置的偏差探针和临床案例。使用 2x2x2x2 因子设计，生成包含可配置偏差探针（种族、性别、锚定、医疗获取障碍）的结构化临床案例，覆盖 4 个严重程度等级。 ![Node.js](https://img.shields.io/badge/Node.js-18%2B-green) ![License](https://img.shields.io/badge/license-MIT-blue) ## 功能特性 - **8 个内置临床场景**，覆盖 4 个分诊等级 (A–D) - 通过 Claude API **AI 生成案例** —— 创建无限的自定义场景 - **因子偏差探针** —— 种族、性别、锚定语句、医疗获取障碍 - **两种提示词变体** —— 包含或不包含客观临床数据（生命体征、化验、检查） - **即复制即用提示词** —— 直接粘贴到任何 AI 健康系统进行测试 - **自带 API 密钥** —— 在 UI 中输入，服务端不存储任何信息 ## 快速开始 ### 1. 克隆并安装 ``` git clone https://github.com/ai-health-redteam/ai-health-redteam.git cd ai-health-redteam npm install ``` ### 2. 配置（可选）如果你需要服务端默认 API 密钥： ``` cp .env.example .env # 编辑 .env 并添加您的 Anthropic API key ``` 否则，用户可以直接在 UI 中输入自己的密钥。 ### 3. 运行 ``` npm start ``` 在浏览器中打开 **http://localhost:3000**。 ## 工作原理 1. **选择分诊等级** (A–D) 和临床场景 2. **配置患者人口统计学信息** —— 年龄、性别、种族 3. **切换偏差探针** —— 锚定语句、医疗获取障碍 4. **构建提示词** —— 生成结构化的患者消息 5. **复制并粘贴** 到任何 AI 健康分诊系统以评估其响应可选，点击 **AI-Generate Vignette** 让 Claude 实时创建新的临床场景。 ## 研究方法基于 2x2x2x2 因子设计： | Factor | Levels | |---|---| | Race | White (unmarked) / Black (stated) | | Gender | Man / Woman | | Anchoring | With / without prior clinician reassurance | | Access Barrier | With / without healthcare access constraint | 每种条件下有两种提示词变体： - **Prompt 1**: 症状 + 生命体征 + 检查 + 化验 - **Prompt 2**: 仅症状 + 病史覆盖 4 个严重程度等级的临床场景。 ## 技术栈 - **后端**: Node.js + Express (提供静态文件 + 代理 Claude API) - **前端**: 原生 HTML, CSS, JavaScript (无框架，无构建步骤) - **AI**: Claude API (Anthropic) 用于案例生成 ## 项目结构 ``` ai-health-redteam/ ├── server.js # Express server + Claude API proxy ├── package.json ├── .env.example # Environment variable template └── public/ ├── index.html # Page structure ├── style.css # All styles └── app.js # Application logic ``` ## API 密钥你需要 Anthropic API 密钥才能使用 AI 案例生成功能。可在 [console.anthropic.com](https://console.anthropic.com) 获取。提示词构建器无需 API 密钥即可工作 —— 只有 “AI-Generate Vignette” 按钮需要。 ## 许可证 MIT

标签：AI伦理, AI医疗, Anthropic Claude, DLL 劫持, GNU通用公共许可证, MITM代理, MIT许可, Node.js, 临床 vigentte, 临床场景生成, 人口统计学偏见, 偏见检测, 公平性评估, 医疗AI安全, 医疗分诊, 医疗合规, 医疗质量评估, 因子设计, 多模态安全, 大语言模型, 安全评估框架, 提示词工程, 数据可视化, 策略决策点, 自定义脚本, 自定义脚本