sainihal-chimata/incident-response-agent

GitHub: sainihal-chimata/incident-response-agent

一个基于 OpenEnv 标准的 SRE 故障模拟评测环境,用于测试和评估 LLM Agent 在云运维场景下的故障诊断与修复能力。

Stars: 0 | Forks: 0

title: Incident Response Agent emoji: 🚨 colorFrom: red colorTo: yellow sdk: docker pinned: false app_port: 7860 tags: - openenv # Incident Response Agent 一个基于步骤的模拟环境,其中 AI Agent 扮演 SRE 工程师, 诊断并解决现实世界的系统故障。 ## Action Space check_logs, check_metrics, check_db, restart_service, scale_service, fix_db ## Observation Space status, alert, logs, logs_checked, cpu, metrics_checked, db_status, db_checked ## 任务 - easy: 服务宕机,检查日志然后重启 - medium: CPU 占用高,检查指标然后扩容 - hard: 未知根本原因(CPU 或 DB),Agent 必须调查并应用正确的修复措施 ## 设置 pip install openai pydantic fastapi uvicorn export HF_TOKEN=your_key export API_BASE_URL=https://api.groq.com/openai/v1 export MODEL_NAME=llama-3.1-8b-instant python inference.py ## 基准分数 easy: 1.0 (optimal) / 0.7 (skips investigation) medium: 1.0 (optimal) / 0.7 (skips investigation) hard: 1.0 (optimal) / 0.7 (correct fix, skips investigation)
标签:AIOps, AI模拟器, AV绕过, DLL 劫持, DNS 反向解析, Docker, FastAPI, LLM智能体, OpenEnv, Petitpotam, Pydantic, Python, SRE运维, Sysdig, 事故响应, 云故障诊断, 仿真环境, 大语言模型, 安全防御评估, 强化学习环境, 性能监控, 故障自愈, 数据库修复, 无后门, 站点可靠性工程, 自动化运维, 请求拦截, 逆向工具