databricks-solutions/ai-dev-kit

GitHub: databricks-solutions/ai-dev-kit

Databricks 官方推出的 AI 编程助手增强工具包,通过 MCP 协议和最佳实践知识库,让 Claude Code、Cursor 等工具能够高效构建数据管道、ML 应用和 Databricks 全栈应用。

Stars: 773 | Forks: 144

# Databricks AI Dev Kit

Databricks Certified Gold Project

## 概述 Databricks 上的 AI 驱动开发体验现已大幅提升。**AI Dev Kit** 为您的 AI 编程助手(Claude Code, Cursor, Windsurf 等)提供所需的可信来源,助其在 Databricks 上构建得更快速、更智能。

Architecture

## 我可以构建什么? - **Spark Declarative Pipelines**(流式表、CDC、SCD Type 2、Auto Loader) - **Databricks Jobs**(计划工作流、多任务 DAG) - **AI/BI Dashboards**(可视化、KPI、分析) - **Unity Catalog**(表、卷、治理) - **Genie Spaces**(自然语言数据探索) - **Knowledge Assistants**(基于 RAG 的文档问答) - **MLflow Experiments**(评估、评分、追踪) - **Model Serving**(将 ML 模型和 AI agents 部署到 endpoints) - **Databricks Apps**(全栈 Web 应用程序) - ...以及更多 ## 选择您的路径 | 路径 | 最适合 | 从这里开始 | |----------------------------------|----------|------------| | :star: [**安装 AI Dev Kit**](#install-in-existing-project) | **从这里开始!** 按照快速安装说明添加到您现有的项目文件夹 | [快速开始(安装)](#install-in-existing-project) | | [**Visual Builder App**](#visual-builder-app) | 用于 Databricks 开发的 Web 界面 | `databricks-builder-app/` | | [**Core Library**](#core-library) | 构建自定义集成(LangChain, OpenAI 等) | `pip install` | | [**仅 Skills**](databricks-skills/) | 提供 Databricks 模式和最佳实践(不含 MCP 函数) | 安装 skills | | [**仅 MCP Tools**](databricks-mcp-server/) | 仅可执行操作(无指导) | 注册 MCP server | ## 快速开始 ### 前置条件 - [uv](https://github.com/astral-sh/uv) - Python 包管理器 - [Databricks CLI](https://docs.databricks.com/aws/en/dev-tools/cli/) - Databricks 命令行界面 - AI 编码环境(一个或多个): - [Claude Code](https://claude.ai/code) - [Cursor](https://cursor.com) - [Gemini CLI](https://github.com/google-gemini/gemini-cli) ### 安装到现有项目 默认情况下,这将安装在项目级别而非用户级别。这通常是一个不错的选择,但要求您从用于安装的确切目录运行客户端。 _注意:项目配置文件可以在其他项目中重复使用。您可以在 .claude、.cursor 或 .gemini 下找到这些配置。_ #### Mac / Linux **基本安装**(使用 DEFAULT 配置文件,项目范围) ``` bash <(curl -sL https://raw.githubusercontent.com/databricks-solutions/ai-dev-kit/main/install.sh) ```
高级选项(点击展开) **全局安装并强制重新安装** ``` bash <(curl -sL https://raw.githubusercontent.com/databricks-solutions/ai-dev-kit/main/install.sh) --global --force ``` **指定配置文件并强制重新安装** ``` bash <(curl -sL https://raw.githubusercontent.com/databricks-solutions/ai-dev-kit/main/install.sh) --profile DEFAULT --force ``` **仅为特定工具安装** ``` bash <(curl -sL https://raw.githubusercontent.com/databricks-solutions/ai-dev-kit/main/install.sh) --tools cursor,gemini ```
**后续步骤:** 响应交互式提示并按照屏幕上的说明操作。 - 注意:Cursor 和 Copilot 在安装后需要手动更新设置。 #### Windows (PowerShell) **基本安装**(使用 DEFAULT 配置文件,项目范围) ``` irm https://raw.githubusercontent.com/databricks-solutions/ai-dev-kit/main/install.ps1 | iex ```
高级选项(点击展开) **先下载脚本** ``` irm https://raw.githubusercontent.com/databricks-solutions/ai-dev-kit/main/install.ps1 -OutFile install.ps1 ``` **全局安装并强制重新安装** ``` .\install.ps1 -Global -Force ``` **指定配置文件并强制重新安装** ``` .\install.ps1 -Profile DEFAULT -Force ``` **仅为特定工具安装** ``` .\install.ps1 -Tools cursor,gemini ```
**后续步骤:** 响应交互式提示并按照屏幕上的说明操作。 - 注意:Cursor 和 Copilot 在安装后需要手动更新设置。 ### Visual Builder App 具有聊天 UI 的全栈 Web 应用程序,用于 Databricks 开发: ``` cd ai-dev-kit/databricks-builder-app ./scripts/setup.sh # 按照说明启动 app ``` ### Core Library 直接在您的 Python 项目中使用 `databricks-tools-core`: ``` from databricks_tools_core.sql import execute_sql results = execute_sql("SELECT * FROM my_catalog.schema.table LIMIT 10") ``` 适用于 LangChain、OpenAI Agents SDK 或任何 Python 框架。有关详细信息,请参阅 [databricks-tools-core/](databricks-tools-core/)。 ## 包含内容 | 组件 | 描述 | |-----------|-------------| | [`databricks-tools-core/`](databricks-tools-core/) | 具有 Databricks 高级功能的 Python 库 | | [`databricks-mcp-server/`](databricks-mcp-server/) | 为 AI 助手提供 50 多个工具的 MCP server | | [`databricks-skills/`](databricks-skills/) | 19 个教授 Databricks 模式的 markdown skills | | [`databricks-builder-app/`](databricks-builder-app/) | 具有 Claude Code 集成的全栈 Web 应用 | ## 许可证 (c) 2026 Databricks, Inc. 保留所有权利。 本项目提供的源代码受 [Databricks License](https://databricks.com/db-license-source) 约束。有关详细信息,请参阅 [LICENSE.md](LICENSE.md)。
第三方许可证 | 包 | 版本 | 许可证 | 项目 URL | |---------|---------|---------|-------------| | [fastmcp](https://github.com/jlowin/fastmcp) | ≥0.1.0 | MIT | https://github.com/jlowin/fastmcp | | [mcp](https://github.com/modelcontextprotocol/python-sdk) | ≥1.0.0 | MIT | https://github.com/modelcontextprotocol/python-sdk | | [sqlglot](https://github.com/tobymao/sqlglot) | ≥20.0.0 | MIT | https://github.com/tobymao/sqlglot | | [sqlfluff](https://github.com/sqlfluff/sqlfluff) | ≥3.0.0 | MIT | https://github.com/sqlfluff/sqlfluff | | [litellm](https://github.com/BerriAI/litellm) | ≥1.0.0 | MIT | https://github.com/BerriAI/litellm | | [pymupdf](https://github.com/pymupdf/PyMuPDF) | ≥1.24.0 | AGPL-3.0 | https://github.com/pymupdf/PyMuPDF | | [claude-agent-sdk](https://github.com/anthropics/claude-code) | ≥0.1.19 | MIT | https://github.com/anthropics/claude-code | | [fastapi](https://github.com/fastapi/fastapi) | ≥0.115.8 | MIT | https://github.com/fastapi/fastapi | | [uvicorn](https://github.com/encode/uvicorn) | ≥0.34.0 | BSD-3-Clause | https://github.com/encode/uvicorn | | [httpx](https://github.com/encode/httpx) | ≥0.28.0 | BSD-3-Clause | https://github.com/encode/httpx | | [sqlalchemy](https://github.com/sqlalchemy/sqlalchemy) | ≥2.0.41 | MIT | https://github.com/sqlalchemy/sqlalchemy | | [alembic](https://github.com/sqlalchemy/alembic) | ≥1.16.1 | MIT | https://github.com/sqlalchemy/alembic | | [asyncpg](https://github.com/MagicStack/asyncpg) | ≥0.30.0 | Apache-2.0 | https://github.com/MagicStack/asyncpg | | [greenlet](https://github.com/python-greenlet/greenlet) | ≥3.0.0 | MIT | https://github.com/python-greenlet/greenlet | | [psycopg2-binary](https://github.com/psycopg/psycopg2) | ≥2.9.11 | LGPL-3.0 | https://github.com/psycopg/psycopg2 |
致谢 MCP Databricks Command Execution API 来自 [databricks-exec-code](),作者为 Natyra Bajraktari 和 Henryk Borzymowski。
标签:AI Agents, AI/BI Dashboards, AI 开发工具包, Auto Loader, Claude Code, Coding Agent, Cursor, Databricks, Databricks Jobs, Declarative Pipelines, ETL, Genie Spaces, JavaCC, LangChain, LLM 应用开发, MCP Server, MLflow, MLOps, OpenAI, RAG, Spark, Unity Catalog, Vibe Coding, Windsurf, 全栈应用, 内存规避, 多线程, 数据工程, 数据治理, 数据科学, 模型服务, 知识助手, 编程代理, 自动化开发, 自然语言编程, 资源验证, 轻量级, 逆向工具