robusta-dev/robusta

GitHub: robusta-dev/robusta

Robusta 是一款 Kubernetes 专用的 Prometheus 告警增强工具,通过智能分组、告警富化、AI 调查和自动修复能力帮助运维团队更快定位并解决问题。

Stars: 2979 | Forks: 300

Robusta Classic - Kubernetes 的 Prometheus 告警增强工具

## Robusta 能做什么?

工作原理 | 安装 | 集成 ↗ | 文档 ↗ | Slack 社区 ↗

兼容 kube-prometheus-stack、Prometheus Operator 等。 Robusta 通过 webhook 与 Prometheus 集成,并增加以下功能: * [**智能分组**](https://docs.robusta.dev/master/configuration/notification-grouping.html) - 利用 Slack 线程减少通知干扰 🧵 * [**AI 调查**](https://docs.robusta.dev/master/configuration/holmesgpt/index.html#ai-analysis) - 利用 AI 启动告警调查(可选) * [**告警丰富**](https://docs.robusta.dev/master/how-it-works/index.html#automatically-investigate-a-prometheus-alert) - 在告警旁边查看 Pod 日志和其他数据 * [**自愈**](https://docs.robusta.dev/master/tutorials/alert-remediation.html#remediate-prometheus-alerts) - 定义自动修复规则以加快解决问题 * [**高级路由**](https://docs.robusta.dev/master/notification-routing/configuring-sinks.html) - 基于团队、命名空间等进行路由 * [**无 PromQL 问题检测**](https://docs.robusta.dev/master/playbook-reference/triggers/index.html#triggers-reference) - 为 OOMKills、失败的 Job 等生成 Kubernetes 原生告警 * [**变更追踪**](https://docs.robusta.dev/master/tutorials/playbook-track-changes.html#track-kubernetes-changes) - 追踪 Kubernetes 资源的变更,以关联告警和发布 * [**自动解决**](https://docs.robusta.dev/master/configuration/sinks/jira.html#jira) - 当告警解决时更新外部系统(例如 Jira) * [**数十种集成**](https://docs.robusta.dev/master/configuration/index.html#integrations-overview) - Slack、Teams、Jira 等 没有 Prometheus?你可以在没有 Prometheus 的情况下使用 Robusta,或者安装我们包含 Robusta 和 Prometheus 的一体化 Kubernetes 可观测性堆栈。 ## 🔗 集成 Robusta 与各种工具和平台集成。点击任意徽标了解更多关于集成的信息。 ### 📤 通知目标
Slack
Slack
MS Teams
MS Teams
Discord
Discord
Telegram
Telegram
Google Chat
Google Chat
Mattermost
Mattermost
PagerDuty
PagerDuty
Opsgenie
Opsgenie
Jira
Jira
ServiceNow
ServiceNow
Email
Email
Webhook
Webhook
DataDog
DataDog
VictorOps
VictorOps
Rocket.Chat
Rocket.Chat
Webex
Webex
Pushover
Pushover
Zulip
Zulip
Robusta UI
Robusta UI
Kafka
Kafka
File
File
Yandex Messenger
Yandex Messenger
### 📊 指标和告警
Prometheus
Prometheus
Victoria Metrics
Victoria Metrics
Grafana
Grafana Alertmanager
Thanos
Thanos
AWS Managed Prometheus
AWS Managed Prometheus
Google Managed Prometheus
Google Managed Prometheus
Azure Managed Prometheus
Azure Managed Prometheus
Coralogix
Coralogix
### 🧠 AI 驱动的告警增强
HolmesGPT
HolmesGPT
### 💰 成本管理
KRR
KRR (Kubernetes Resource Recommender)

(回到顶部)

## 🛠️ 工作原理 Robusta 使用规则和 AI 来处理 Prometheus 告警,并向其添加额外信息,例如 Pod 日志、相关图表、可能的修复措施等。 以下是 Slack 中的告警示例: ![](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/dc8b80c631054237.png) 以下是修复操作示例: ![](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/0df619f3aa054238.png) [了解更多 »](https://docs.robusta.dev/master/how-it-works/index.html)

(回到顶部)

## 📒 安装 Robusta Robusta 通过 Helm 安装。为方便起见,我们提供了一个 CLI 向导来生成 Helm values。 你可以将 Robusta 与现有的 Prometheus 一起安装,或者作为包含 Robusta 和预配置 `kube-prometheus-stack` 的一体化捆绑包安装。 为了*更大程度*地利用 Robusta,我们建议创建 [一个免费的 Robusta UI 账户](#-free-robusta-ui)。在下方了解更多。 [创建免费的 Robusta UI 账户 »](https://platform.robusta.dev/signup?utm_source=github&utm_medium=robusta-readme&utm_content=installing_robusta_section) [安装说明 »](https://docs.robusta.dev/master/setup-robusta/installation/index.html) ## 🖥 免费 Robusta UI 通过 [Robusta SaaS 平台](https://platform.robusta.dev/signup?utm_source=github&utm_medium=robusta-readme&utm_content=free_robusta_ui_section)将你的 Kubernetes 监控提升到一个新的水平。创建账户是免费的,包括: - **AI 助手**:通过突出显示相关可观测性数据的 AI 助手更快解决告警 - **告警时间线**:查看跨多个集群的 Prometheus 告警,并通过强大的时间线视图发现关联性 - **变更追踪**:将告警与基础设施或应用程序的变更相关联,利用 Robusta 对 Kubernetes 的自动变更追踪

(回到顶部)

## 📝 文档 感兴趣?了解更多关于 Robusta 的信息。 [完整文档 »](https://docs.robusta.dev/master/index.html)

(回到顶部)

## ✉️ 联系方式 * Slack - [robustacommunity.slack.com](https://bit.ly/robusta-slack) * Twitter - [@RobustaDev](https://twitter.com/RobustaDev) * LinkedIn - [robusta-dev](https://www.linkedin.com/company/robusta-dev/) * 邮件支持 - [support@robusta.dev ](mailto:support@robusta.dev )

(回到顶部)

## 📑 许可证 Robusta 根据 MIT 许可证分发。有关更多信息,请参阅 [LICENSE.md](https://github.com/robusta-dev/robusta/blob/master/LICENSE)。 ## 🕐 保持更新 我们会定期添加新功能。在 GitHub 上 Watch 我们以保持更新。 ![](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/0cdc3ae3b8054240.gif)
标签:AIOps, API集成, HolmesGPT, Kube-Prometheus-Stack, Slack集成, SRE, 偏差过滤, 变更追踪, 可观测性, 告警丰富, 告警路由, 子域名突变, 容器监控, 故障排查, 智能分组, 监控告警, 站点可靠性工程, 自动修复, 自定义请求头, 自愈系统, 请求拦截, 运维自动化, 逆向工具