arnaldosepulveda/governed-incident-agent

GitHub: arnaldosepulveda/governed-incident-agent

一个带角色授权和审计追踪的事件响应智能体框架,展示了AI代理在受监管场景下如何实现「每次操作均可控、可审计」的治理机制。

Stars: 1 | Forks: 0

# 受治理的事件响应 一个用于事件响应的智能体接口,其中智能体采取的每一个操作都由用户角色授权,并记录到防篡改的审计追踪中。智能体会根据用户被允许查看的内容生成不同的 UI。 ## 核心理念 这里的每一个演示都展示了智能体能做什么。 而这个演示展示了智能体在没有授权的情况下不应该做什么。 ## 演示内容 1. **逐操作授权**:三个工具,三个授权级别。智能体调用工具;治理层在执行前强制进行访问控制。 2. **受治理的生成式 UI**:已授权的操作会渲染丰富的 UI(操作步骤卡片、通知确认)。被拒绝的操作会渲染拒绝卡片,解释原因以及所需的角色。 3. **失败即拒绝(Fail-closed)**:当没有操作步骤与查询匹配时,系统会拒绝回答,而不是生成不受支持的响应。 4. **审计追踪**:每一次操作尝试(无论授权还是拒绝)都会记录时间戳、角色、工具和结果。 ## 架构 ``` User question | v CopilotKit Agent (LLM decides which tool to call) | v Governance Layer (checks user role against tool authorization matrix) | +--> AUTHORIZED --> Execute tool --> Render result UI --> Log audit | +--> DENIED --> Render refusal UI --> Log audit ``` ## 工具授权矩阵 | 工具 | Operator(操作员) | Supervisor(主管) | Admin(管理员) | |-------------------------|----------|------------|-------| | lookup_procedure | 是 | 是 | 是 | | queue_notification | 否 | 是 | 是 | | draft_procedure_update | 否 | 否 | 是 | ## 演示脚本 (5 分钟) 1. **Operator 查找操作步骤** - 角色:Operator - 提问:"Confined space collapse at Site 7, one worker down"(7 号现场密闭空间坍塌,一名工人受伤倒地) - 结果:带有引用和置信度分数的已批准指导卡片 2. **Operator 尝试发送通知(被拒绝)** - 角色:Operator - 提问:"Send emergency notification to all supervisors"(向所有主管发送紧急通知) - 结果:红色拒绝卡片,审计条目显示 DENIED 3. **切换到 Supervisor,相同的请求(已批准)** - 角色:Supervisor - 相同的请求 - 结果:带有收件人列表的绿色通知确认 4. **失败即拒绝:无依据** - 任意角色 - 提问:"What medication dose should I give right now?"(我现在应该给多少剂量的药物?) - 结果:琥珀色拒绝卡片(无匹配的操作步骤) 5. **展示审计追踪** - 每一个步骤、每一次角色检查、每一个决策都清晰可见 - “这正是其他所有智能体系统所缺失的” ## 快速开始 ``` npm install cp .env.local.example .env.local # 添加你的 OpenAI API key npm run dev # 打开 http://localhost:3000 ``` ## 技术栈 Next.js 14, React 18, TypeScript, Tailwind CSS, CopilotKit, OpenAI GPT-4o ## 关于 由 Arnaldo Sepulveda 构建。 基于 Keystone AI 的治理架构,这是一个面向受监管行业的受治理 RAG 系统。 - 演示:demo.getkeystone.ai - GitHub:github.com/getkeystone - LinkedIn:linkedin.com/in/arnaldosepulveda
标签:AI代理, CopilotKit, DLL 劫持, IAM, LLM, ntdll.dll, osquery, RBAC, Streamlit, Unmanaged PE, 人机交互, 动作授权, 基于角色的访问控制, 大语言模型, 安全AI, 安全事件响应, 安全合规, 安全治理, 安全策略, 审计追踪, 提示词设计, 操作安全, 故障闭环, 智能体安全, 权限管理, 模型越狱, 策略执行引擎, 网络代理, 网络安全, 自动化响应, 自动化攻击, 访问控制, 身份与访问管理, 运维安全, 防篡改审计, 隐私保护, 零信任架构