robusta-dev/robusta
GitHub: robusta-dev/robusta
Robusta 是一款 Kubernetes 专用的 Prometheus 告警增强工具,通过智能分组、告警富化、AI 调查和自动修复能力帮助运维团队更快定位并解决问题。
Stars: 2979 | Forks: 300
Robusta Classic - Kubernetes 的 Prometheus 告警增强工具
工作原理 | 安装 | 集成 ↗ | 文档 ↗ | Slack 社区 ↗
兼容 kube-prometheus-stack、Prometheus Operator 等。 Robusta 通过 webhook 与 Prometheus 集成,并增加以下功能: * [**智能分组**](https://docs.robusta.dev/master/configuration/notification-grouping.html) - 利用 Slack 线程减少通知干扰 🧵 * [**AI 调查**](https://docs.robusta.dev/master/configuration/holmesgpt/index.html#ai-analysis) - 利用 AI 启动告警调查(可选) * [**告警丰富**](https://docs.robusta.dev/master/how-it-works/index.html#automatically-investigate-a-prometheus-alert) - 在告警旁边查看 Pod 日志和其他数据 * [**自愈**](https://docs.robusta.dev/master/tutorials/alert-remediation.html#remediate-prometheus-alerts) - 定义自动修复规则以加快解决问题 * [**高级路由**](https://docs.robusta.dev/master/notification-routing/configuring-sinks.html) - 基于团队、命名空间等进行路由 * [**无 PromQL 问题检测**](https://docs.robusta.dev/master/playbook-reference/triggers/index.html#triggers-reference) - 为 OOMKills、失败的 Job 等生成 Kubernetes 原生告警 * [**变更追踪**](https://docs.robusta.dev/master/tutorials/playbook-track-changes.html#track-kubernetes-changes) - 追踪 Kubernetes 资源的变更,以关联告警和发布 * [**自动解决**](https://docs.robusta.dev/master/configuration/sinks/jira.html#jira) - 当告警解决时更新外部系统(例如 Jira) * [**数十种集成**](https://docs.robusta.dev/master/configuration/index.html#integrations-overview) - Slack、Teams、Jira 等 没有 Prometheus?你可以在没有 Prometheus 的情况下使用 Robusta,或者安装我们包含 Robusta 和 Prometheus 的一体化 Kubernetes 可观测性堆栈。 ## 🔗 集成 Robusta 与各种工具和平台集成。点击任意徽标了解更多关于集成的信息。 ### 📤 通知目标|
Slack |
MS Teams |
Discord |
Telegram |
Google Chat |
Mattermost |
|
PagerDuty |
Opsgenie |
Jira |
ServiceNow |
|
Webhook |
|
DataDog |
VictorOps |
Rocket.Chat |
Webex |
Pushover |
Zulip |
|
Robusta UI |
Kafka |
File |
Yandex Messenger |
|
Prometheus |
Victoria Metrics |
Grafana Alertmanager |
Thanos |
|
AWS Managed Prometheus |
Google Managed Prometheus |
Azure Managed Prometheus |
Coralogix |
|
HolmesGPT |
|
KRR (Kubernetes Resource Recommender) |
(回到顶部)
## 🛠️ 工作原理 Robusta 使用规则和 AI 来处理 Prometheus 告警,并向其添加额外信息,例如 Pod 日志、相关图表、可能的修复措施等。 以下是 Slack 中的告警示例:  以下是修复操作示例:  [了解更多 »](https://docs.robusta.dev/master/how-it-works/index.html)(回到顶部)
## 📒 安装 Robusta Robusta 通过 Helm 安装。为方便起见,我们提供了一个 CLI 向导来生成 Helm values。 你可以将 Robusta 与现有的 Prometheus 一起安装,或者作为包含 Robusta 和预配置 `kube-prometheus-stack` 的一体化捆绑包安装。 为了*更大程度*地利用 Robusta,我们建议创建 [一个免费的 Robusta UI 账户](#-free-robusta-ui)。在下方了解更多。 [创建免费的 Robusta UI 账户 »](https://platform.robusta.dev/signup?utm_source=github&utm_medium=robusta-readme&utm_content=installing_robusta_section) [安装说明 »](https://docs.robusta.dev/master/setup-robusta/installation/index.html) ## 🖥 免费 Robusta UI 通过 [Robusta SaaS 平台](https://platform.robusta.dev/signup?utm_source=github&utm_medium=robusta-readme&utm_content=free_robusta_ui_section)将你的 Kubernetes 监控提升到一个新的水平。创建账户是免费的,包括: - **AI 助手**:通过突出显示相关可观测性数据的 AI 助手更快解决告警 - **告警时间线**:查看跨多个集群的 Prometheus 告警,并通过强大的时间线视图发现关联性 - **变更追踪**:将告警与基础设施或应用程序的变更相关联,利用 Robusta 对 Kubernetes 的自动变更追踪(回到顶部)
## 📝 文档 感兴趣?了解更多关于 Robusta 的信息。 [完整文档 »](https://docs.robusta.dev/master/index.html)(回到顶部)
## ✉️ 联系方式 * Slack - [robustacommunity.slack.com](https://bit.ly/robusta-slack) * Twitter - [@RobustaDev](https://twitter.com/RobustaDev) * LinkedIn - [robusta-dev](https://www.linkedin.com/company/robusta-dev/) * 邮件支持 - [support@robusta.dev ](mailto:support@robusta.dev )(回到顶部)
## 📑 许可证 Robusta 根据 MIT 许可证分发。有关更多信息,请参阅 [LICENSE.md](https://github.com/robusta-dev/robusta/blob/master/LICENSE)。 ## 🕐 保持更新 我们会定期添加新功能。在 GitHub 上 Watch 我们以保持更新。 标签:AIOps, API集成, HolmesGPT, Kube-Prometheus-Stack, Slack集成, SRE, 偏差过滤, 变更追踪, 可观测性, 告警丰富, 告警路由, 子域名突变, 容器监控, 故障排查, 智能分组, 监控告警, 站点可靠性工程, 自动修复, 自定义请求头, 自愈系统, 请求拦截, 运维自动化, 逆向工具