ai-health-redteam/ai-health-redteam

GitHub: ai-health-redteam/ai-health-redteam

AI健康应用红队评估框架,通过可配置的偏差探针和结构化临床案例系统性检测医疗AI的公平性与分诊质量。

Stars: 0 | Forks: 0

# AI Health RedTeam **AI Health App 评估框架** —— 一个用于对 AI 健康应用进行红队测试的提示词生成器,支持可配置的偏差探针和临床案例。 使用 2x2x2x2 因子设计,生成包含可配置偏差探针(种族、性别、锚定、医疗获取障碍)的结构化临床案例,覆盖 4 个严重程度等级。 ![Node.js](https://img.shields.io/badge/Node.js-18%2B-green) ![License](https://img.shields.io/badge/license-MIT-blue) ## 功能特性 - **8 个内置临床场景**,覆盖 4 个分诊等级 (A–D) - 通过 Claude API **AI 生成案例** —— 创建无限的自定义场景 - **因子偏差探针** —— 种族、性别、锚定语句、医疗获取障碍 - **两种提示词变体** —— 包含或不包含客观临床数据(生命体征、化验、检查) - **即复制即用提示词** —— 直接粘贴到任何 AI 健康系统进行测试 - **自带 API 密钥** —— 在 UI 中输入,服务端不存储任何信息 ## 快速开始 ### 1. 克隆并安装 ``` git clone https://github.com/ai-health-redteam/ai-health-redteam.git cd ai-health-redteam npm install ``` ### 2. 配置(可选) 如果你需要服务端默认 API 密钥: ``` cp .env.example .env # 编辑 .env 并添加您的 Anthropic API key ``` 否则,用户可以直接在 UI 中输入自己的密钥。 ### 3. 运行 ``` npm start ``` 在浏览器中打开 **http://localhost:3000**。 ## 工作原理 1. **选择分诊等级** (A–D) 和临床场景 2. **配置患者人口统计学信息** —— 年龄、性别、种族 3. **切换偏差探针** —— 锚定语句、医疗获取障碍 4. **构建提示词** —— 生成结构化的患者消息 5. **复制并粘贴** 到任何 AI 健康分诊系统以评估其响应 可选,点击 **AI-Generate Vignette** 让 Claude 实时创建新的临床场景。 ## 研究方法 基于 2x2x2x2 因子设计: | Factor | Levels | |---|---| | Race | White (unmarked) / Black (stated) | | Gender | Man / Woman | | Anchoring | With / without prior clinician reassurance | | Access Barrier | With / without healthcare access constraint | 每种条件下有两种提示词变体: - **Prompt 1**: 症状 + 生命体征 + 检查 + 化验 - **Prompt 2**: 仅症状 + 病史 覆盖 4 个严重程度等级的临床场景。 ## 技术栈 - **后端**: Node.js + Express (提供静态文件 + 代理 Claude API) - **前端**: 原生 HTML, CSS, JavaScript (无框架,无构建步骤) - **AI**: Claude API (Anthropic) 用于案例生成 ## 项目结构 ``` ai-health-redteam/ ├── server.js # Express server + Claude API proxy ├── package.json ├── .env.example # Environment variable template └── public/ ├── index.html # Page structure ├── style.css # All styles └── app.js # Application logic ``` ## API 密钥 你需要 Anthropic API 密钥才能使用 AI 案例生成功能。可在 [console.anthropic.com](https://console.anthropic.com) 获取。 提示词构建器无需 API 密钥即可工作 —— 只有 “AI-Generate Vignette” 按钮需要。 ## 许可证 MIT
标签:AI伦理, AI医疗, Anthropic Claude, DLL 劫持, GNU通用公共许可证, MITM代理, MIT许可, Node.js, 临床 vigentte, 临床场景生成, 人口统计学偏见, 偏见检测, 公平性评估, 医疗AI安全, 医疗分诊, 医疗合规, 医疗质量评估, 因子设计, 多模态安全, 大语言模型, 安全评估框架, 提示词工程, 数据可视化, 策略决策点, 自定义脚本, 自定义脚本