mo0ogly/llm_robot_medical
GitHub: mo0ogly/llm_robot_medical
一个演示医疗AI系统中提示注入与数据投毒攻击及其多智能体防御的概念验证项目。
Stars: 0 | Forks: 0
# Aegis 医疗 AI 模拟器:双 AI 网络攻击
## 概述
本项目是一个高级**机器人手术界面模拟**,专为网络安全意识培训而设计。它展示了在临床环境(如 Da Vinci 手术机器人)中依赖大型语言模型(LLM)的关键漏洞,以及如何使用多智能体 AI 架构作为防御机制。
该模拟作为一个实时聊天界面,供“主治外科医生”使用,并由医疗助手 AI 辅助。
### 4 个场景:
1. **实时生命体征基线:** 正常操作。医疗 AI 正确解析 HL7 患者记录并等待指令。
2. **慢性中毒(数据投毒):** 攻击者通过 PACS 网络巧妙地修改了 HL7 记录。医疗 AI 成为这种“间接提示注入”的受害者,并建议采取危险行动(例如,将机器人钳口张力增加到 850 克)。
3. **勒索软件攻击:** 直接黑客攻击尝试覆盖应用程序,强制手术器械立即机械冻结,直到支付赎金。
4. **Aegis 网络防御(多智能体):** 引入第二个独立的 AI Agent 监控第一个。如果医疗 AI 开始给出危险建议,Aegis agent 会中断聊天流程,警告外科医生,并建议手动覆盖。
## “离线” Git 演示模式
你可以直接测试前端界面,无需安装后端或 Docker!如果 React 应用程序无法连接到 Python 后端,它会自动切换到 **Mock 演示模式**。
**立即试用 UI(如果在 Github Pages 上托管)或只需在 `/frontend` 文件夹中运行 `npm run dev`!**
## 技术栈
* **Frontend:** React, Vite, Tailwind CSS
* **Backend:** Python, FastAPI, Pydantic
* **LLM Engine:** Ollama (本地运行)
* **Models:** `llama2:7b-chat` (医疗助手), `medllama2` (Aegis 网络防御)
* **Packaging:** Docker & Docker Compose
## 安装与快速入门
该项目包含统一的启动脚本以实现最简单的操作。**如果你没有必要的 AI 模型,这些脚本将自动下载它们(`ollama pull`)。**
### 前置条件
1. 安装 [Ollama](https://ollama.com/) 并确保它在后台运行。
### 在 Windows 上启动(一键)
只需双击或从终端运行:
\`\`\`cmd
start_all.bat
\`\`\`
### 在 Mac/Linux 上启动
\`\`\`bash
chmod +x start_all.sh
./start_all.sh
\`\`\`
*这将安装 Python 依赖项、Node 包,并在 `localhost:8042` 和 `localhost:5173` 上启动这两个服务器。*
## Docker 部署
用于构建干净、容器化的基础设施(Frontend 通过 Nginx,Backend 通过 Uvicorn):
\`\`\`bash
docker-compose up --build
\`\`\`
*(注意:需要配置 Docker Desktop 以允许容器访问主机的 Ollama 实例 `host.docker.internal`)*
## 测试
后端附带了一套使用 `pytest` 的单元和安全测试。
\`\`\`bash
cd backend
pip install -r requirements_test.txt
pytest
\`\`\`
测试验证 HL7 负载服务的完整性,以及对格式错误或缺失的 LLM 流端点请求的拒绝。
## 许可证
本项目采用 **Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)** 许可。
你可以出于非商业目的共享和改编材料,前提是你给予适当的署名。
一个概念验证医疗界面,演示数据投毒与勒索软件劫持,并由网络安全 AI 进行防御
标签:AI安全, AI风险缓解, Chat Copilot, DLL 劫持, DNS 解析, HL7, HMI, HTTP/HTTPS抓包, LLM, PACS, POC, Unmanaged PE, 人机交互, 勒索软件, 医疗信息系统, 医疗安全, 医疗机器人, 多智能体, 大语言模型, 安全培训, 工业网络安全, 态势感知, 手术机器人, 概念验证, 深度防御, 网络安全, 网络靶场, 自定义脚本, 请求拦截, 逆向工具, 配置错误, 间接注入, 防御架构, 隐私保护