ruslanmv/ollabridge

GitHub: ruslanmv/ollabridge

将本地和远程 GPU 资源聚合成统一 OpenAI 兼容 API 的网关工具，节点主动出连无需端口转发。

Stars: 0 | Forks: 0

# OllaBridge ⚡️ **您通往所有 LLM 的单一网关 —— 本地、远程、任何地方。** [![PyPI version](https://badge.fury.io/py/ollabridge.svg)](https://badge.fury.io/py/ollabridge) [![Python 3.10+](https://img.shields.io/badge/python-3.10+-blue.svg)](https://www.python.org/downloads/) [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) [![Code style: black](https://img.shields.io/badge/code%20style-black-000000.svg)](https://github.com/psf/black) [快速开始](#-60-second-start) • [为什么选择 OllaBridge](#-why-ollabridge) • [分布式计算](#-add-any-gpu-in-60-seconds) • [示例](#-use-it-anywhere) • [演示客户端](#-try-the-interactive-demo-client) • [MCP 模式](#-ai-agents-love-ollabridge)

## 🎯 什么是 OllaBridge？ OllaBridge 是您运行每个 LLM 的**单一、OpenAI 兼容 API** —— 无论是在您的笔记本电脑、工作站、免费 GPU 服务器、云实例，还是任何地方。 **问题所在：** 您的模型运行在各处（笔记本电脑、云 GPU、朋友的游戏 PC），而每个应用都需要不同的配置。 **OllaBridge 解决方案：** 应用连接到一个地方。OllaBridge 自动路由到正确的计算资源。 ``` graph TB A[Your Apps] -->|OpenAI SDK| B[OllaBridge
Control Plane] B -->|Auto Routes| C[Local Laptop
llama3.1] B -->|Auto Routes| D[Free GPU Cloud
deepseek-r1] B -->|Auto Routes| E[Remote Workstation
mixtral] C -.->|Dials Out| B D -.->|Dials Out| B E -.->|Dials Out| B style B fill:#6366f1,stroke:#4f46e5,stroke-width:3px,color:#fff style A fill:#10b981,stroke:#059669,stroke-width:2px,color:#fff style C fill:#8b5cf6,stroke:#7c3aed,stroke-width:2px,color:#fff style D fill:#ec4899,stroke:#db2777,stroke-width:2px,color:#fff style E fill:#f59e0b,stroke:#d97706,stroke-width:2px,color:#fff ``` **核心创新：** 计算节点**主动向外连接**到您的网关。无需端口转发，无需 VPN，告别配置地狱。 ## 🚀 为什么选择 OllaBridge？ ### 🎯 **单一事实来源** - ✅ **一个 URL 搞定一切** —— 您的应用无需更改代码 - ✅ **零配置** —— 无需触碰应用即可添加新 GPU - ✅ **智能路由** —— OllaBridge 自动选择最佳节点 - ✅ **OpenAI 兼容** —— 适用于任何 SDK、框架或工具 ### 🛡️ **企业级安全** - ✅ **API 密钥认证** —— 保护您的 LLM - ✅ **速率限制** —— 控制每个密钥的使用量 - ✅ **请求日志** —— 完整的审计追踪 - ✅ **加密连接** —— 远程节点使用 TLS ### 🌍 **随处运行** - ✅ **免费 GPU 云** —— Colab、Kaggle、Lightning AI（无需端口转发！） - ✅ **临时实例** —— 节点主动向外连接，IP 地址无关紧要 - ✅ **防火墙之后** —— 您的笔记本电脑可以从咖啡店 WiFi 加入 - ✅ **混合环境** —— 无缝结合本地与云端 ### 🤖 **AI Agent 就绪** - ✅ **MCP 服务器** —— Agent 可以控制您的基础设施 - ✅ **工具暴露** —— 通过工具管理节点、路由、健康状态 - ✅ **自我修复** —— 自动安装、自动配置、自动恢复 ## ⚡ 60 秒快速开始 ### 步骤 1：安装 ``` pip install ollabridge ``` ### 步骤 2：启动您的网关 ``` ollabridge start ``` **就是这样！** 您将看到： ``` ✅ Ollama installed (if needed) ✅ Model downloaded (if needed) ✅ Gateway online at http://localhost:11435 ╭─────────────────── 🚀 Gateway Ready ────────────────────╮ │ │ │ ✅ OllaBridge is Online │ │ │ │ Model: deepseek-r1 │ │ Local API: http://localhost:11435/v1 │ │ Key: sk-ollabridge-xY9kL2mN8pQ4rT6vW1zA │ │ │ │ Node join token: eyJ0eXAi... │ │ Example node command: │ │ ollabridge-node join --control http://localhost:11435 │ │ --token eyJ0eXAi... │ │ │ ╰──────────────────────────────────────────────────────────╯ ``` ### 步骤 3：开始使用！ ``` from openai import OpenAI client = OpenAI( base_url="http://localhost:11435/v1", api_key="sk-ollabridge-xY9kL2mN8pQ4rT6vW1zA" ) response = client.chat.completions.create( model="deepseek-r1", messages=[{"role": "user", "content": "Hello!"}] ) print(response.choices[0].message.content) ``` **完成！** 您正在使用 OpenAI API 运行私有 LLM。 ## 🌍 60 秒添加任意 GPU 在 Colab 上有免费 GPU？还是远程工作站？立即添加： ### 在您的远程 GPU/机器上： ``` # 安装 pip install ollabridge # 加入你的网关（从网关启动时复制命令） ollabridge-node join \ --control http://YOUR_GATEWAY_IP:11435 \ --token eyJ0eXAi... ``` **就是这样！** 远程 GPU 将会： - ✅ 如有需要自动安装 Ollama - ✅ 如有需要自动下载模型 - ✅ **主动向外连接**到您的网关（无需端口转发！） - ✅ 显示为可用的计算资源 ### 您的应用自动识别 ``` # 相同的代码，现在同时使用本地 + 远程 GPU！ client = OpenAI(base_url="http://localhost:11435/v1", ...) response = client.chat.completions.create(...) # Auto-routed ``` **OllaBridge 自动路由请求**至您的所有节点。 ## 🎯 真实场景 ### 场景 1：“我家里有一台游戏 PC” ``` # 在你的游戏 PC 上： ollabridge-node join --control https://your-gateway.com --token ... # 现在你的笔记本可以使用你游戏 PC 的 GPU # 即使你在咖啡店！ ``` ### 场景 2：“我想使用免费的 Colab GPU” ``` # 在 Colab notebook 中： !pip install ollabridge !ollabridge-node join --control https://your-gateway.com --token ... # 现在你的生产应用可以使用免费的 Colab 算力 # Colab 会话结束？开启一个新的。零配置更改。 ``` ### 场景 3：“我有多个云 GPU” ``` # 每个 GPU 实例： ollabridge-node join --control https://gateway.company.com --token ... # 你的团队共享一个 API URL # OllaBridge 在所有 GPU 间进行负载均衡 ``` ## 💻 随处使用 ### Python (OpenAI SDK) ``` from openai import OpenAI client = OpenAI( base_url="http://localhost:11435/v1", api_key="your-key-here" ) # 聊天 response = client.chat.completions.create( model="deepseek-r1", messages=[{"role": "user", "content": "Explain quantum computing"}] ) # Embeddings embeddings = client.embeddings.create( model="nomic-embed-text", input="Hello, world!" ) ``` ### Node.js / TypeScript ``` import OpenAI from "openai"; const client = new OpenAI({ baseURL: "http://localhost:11435/v1", apiKey: process.env.OLLABRIDGE_KEY }); const completion = await client.chat.completions.create({ model: "deepseek-r1", messages: [{ role: "user", content: "Hello!" }] }); ``` ### LangChain ``` from langchain_openai import ChatOpenAI llm = ChatOpenAI( base_url="http://localhost:11435/v1", api_key="your-key-here", model="deepseek-r1" ) response = llm.invoke("What is the meaning of life?") ``` ### cURL ``` curl -X POST http://localhost:11435/v1/chat/completions \ -H "Authorization: Bearer your-key-here" \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-r1", "messages": [{"role": "user", "content": "Hello!"}] }' ``` **适用于任何 OpenAI 兼容的工具或库。** ## 🎨 尝试交互式演示客户端想看看 OllaBridge 的实际效果？查看我们在 `example/` 文件夹中的**两键演示客户端**！ ### ⚡ 快速开始 ``` # 1. 安装并启动 OllaBridge cd example ./install-ollabridge.sh # Mac/Linux # 或 .\install-ollabridge.ps1 # Windows # 2. 运行演示客户端 make run # 3. 在浏览器中打开 http://localhost:3000 ``` ### ✨ 功能特性 - 🎯 **精美 UI** —— 现代、响应式 Web 界面 - 🔌 **真实集成** —— 实际调用 OllaBridge 端点的 API - 📊 **实时指标** —— 请求统计、延迟、运行时间追踪 - 🔑 **认证演示** —— 了解 API 密钥认证如何工作 - 📝 **最佳实践** —— 生产级代码示例 ### 📚 完美学习材料示例客户端向您展示： - ✅ 如何从浏览器连接到 OllaBridge - ✅ 如何正确处理 CORS - ✅ 如何使用 API 密钥实现认证 - ✅ 如何动态加载模型 - ✅ 如何发送聊天请求并处理响应 **[查看完整文档 →](example/README.md)** ## 🤖 AI Agent 钟爱 OllaBridge OllaBridge 内置了 **Model Context Protocol (MCP) 服务器**。 Agent 可以： - ✅ 创建注册令牌 - ✅ 列出已连接的计算节点 - ✅ 检查网关健康状态 - ✅ 通过工具管理您的 LLM 基础设施 ### 启动 MCP 服务器 ``` ollabridge-mcp ``` ### 示例：Agent 工作流 ``` # Agent 可以调用这些工具： await session.call_tool("ollabridge.enroll.create", {}) # → 返回注册 token await session.call_tool("ollabridge.runtimes.list", {}) # → 显示所有已连接的节点 await session.call_tool("ollabridge.gateway.health", {}) # → 检查网关状态 ``` **使用案例：** “嘿 Claude，把我的工作站 GPU 添加到我们的 LLM 网关中” → Agent 创建令牌，提供命令，您运行它。搞定。 ## 🔐 安全与配置 ### 认证 OllaBridge 在首次运行时自动生成一个安全的 API 密钥（保存在 `.env` 中）： ``` API_KEYS=sk-ollabridge-xY9kL2mN8pQ4rT6vW1zA ``` 在您的应用中使用它： ``` # 选项 1：Bearer token headers = {"Authorization": "Bearer sk-ollabridge-..."} # 选项 2：Custom header headers = {"X-API-Key": "sk-ollabridge-..."} ``` ### 配置（`.env`） ``` # API Keys（多个用逗号分隔） API_KEYS=sk-ollabridge-abc123,sk-ollabridge-def456 # 服务器 HOST=0.0.0.0 PORT=11435 # 默认模型 DEFAULT_MODEL=deepseek-r1 DEFAULT_EMBED_MODEL=nomic-embed-text # 速率限制 RATE_LIMIT=60/minute # 安全 ENROLLMENT_SECRET=your-secret-here ENROLLMENT_TTL_SECONDS=3600 # 数据库（可选） DATABASE_URL=postgresql://user:pass@localhost/ollabridge ``` ### 注册令牌为节点加入创建短期令牌： ``` ollabridge enroll-create --ttl 3600 ``` 出于安全考虑，令牌会自动过期。 ## 📡 API 参考 ### 核心端点 | 端点 | 方法 | 描述 | |----------|--------|-------------| | `/health` | GET | 网关健康状态 + 节点数量 | | `/v1/chat/completions` | POST | OpenAI 兼容聊天 | | `/v1/embeddings` | POST | 生成嵌入 | | `/v1/models` | GET | 列出可用模型（从节点聚合） | ### 管理端点（需要 API 密钥） | 端点 | 方法 | 描述 | |----------|--------|-------------| | `/admin/recent` | GET | 最近请求日志 | | `/admin/runtimes` | GET | 列出已连接节点 | | `/admin/enroll` | POST | 创建注册令牌 | ### 示例：检查已连接节点 ``` curl -H "X-API-Key: your-key" http://localhost:11435/admin/runtimes ``` **响应：** ``` { "runtimes": [ { "node_id": "local", "connector": "local_ollama", "healthy": true, "tags": ["local"], "models": ["deepseek-r1", "llama3.1"] }, { "node_id": "colab-gpu-1", "connector": "relay_link", "healthy": true, "tags": ["gpu", "free"], "models": ["mixtral", "codellama"] } ] } ``` ## 🏗️ 架构深度解析 ### 工作原理 1. **控制平面（Gateway）**：您的应用连接到这里 2. **节点**：任何运行模型的带有 GPU/CPU 的机器 3. **中继链接**：节点主动向外连接到网关（WebSocket） 4. **路由器**：为每个请求选择最佳节点 ### 为什么“主动向外连接”很重要 **传统方式（有问题）：** ``` App → Gateway → Try to reach GPU ❌ Blocked by firewall ❌ NAT issues ❌ No public IP ``` **OllaBridge（随处可用）：** ``` App → Gateway ← GPU dials in ✅ Works from anywhere ✅ No port forwarding ✅ Ephemeral IPs OK ``` ### 连接器类型 - **RelayLink**：节点通过 WebSocket 主动向外连接（默认，随处可用） - **DirectEndpoint**：通过 HTTP 连接到稳定节点（性能最佳） - **LocalOllama**：内置本地运行时（零配置） OllaBridge 自动选择合适的方式。 ## 📈 扩展性 ### 添加更多 Worker ``` ollabridge start --workers 4 ``` ### 使用 PostgreSQL ``` pip install psycopg2-binary export DATABASE_URL=postgresql://user:pass@localhost/ollabridge ollabridge start --workers 8 ``` ### 添加更多节点 ``` # 只需不断添加节点！ ollabridge-node join --control ... --token ... ``` OllaBridge 自动在所有健康节点间进行负载均衡。 ## 🌍 公网访问（可选） ### 快速演示（Ngrok） ``` ollabridge start --share ``` ### 生产环境（Cloudflare Tunnel） ``` # 终端 1：启动网关 ollabridge start # 终端 2：暴露它 cloudflared tunnel --url http://localhost:11435 ``` 现在您的网关拥有一个公共 `https://` URL！ **安全提示：** 对于公共网关，请务必使用 API 密钥。 ## 🎓 初学者指南 ### “我以前从未使用过 LLM” 1. 安装：`pip install ollabridge` 2. 启动：`ollabridge start` 3. 从输出中复制 API 密钥 4. 使用此代码： ``` from openai import OpenAI client = OpenAI( base_url="http://localhost:11435/v1", api_key="PASTE_KEY_HERE" ) response = client.chat.completions.create( model="deepseek-r1", messages=[{"role": "user", "content": "Explain Python in simple terms"}] ) print(response.choices[0].message.content) ``` **就是这样！** 您正在计算机上运行 AI 模型。 ### “我想添加我游戏 PC 的 GPU” 1. 在您的主计算机（网关）上： ollabridge start # 复制 "Node join token" 和网关 URL 2. 在您的游戏 PC 上： pip install ollabridge ollabridge-node join --control http://GATEWAY_IP:11435 --token TOKEN_HERE 3. 完成！您的应用现在可以使用您游戏 PC 的算力了。 ### “我想使用免费的 Colab GPU” 1. 在家启动您的网关： ollabridge start --share # 记下公共 URL (https://xxx.ngrok.io) 2. 在 Colab notebook 中： !pip install ollabridge !ollabridge-node join --control https://xxx.ngrok.io --token YOUR_TOKEN 3. 现在您的应用使用免费的 Colab GPU 了！ **专业提示：** 当 Colab 断开连接时，只需重启并再次运行步骤 2。无需更改配置。 ## 🛠️ CLI 命令参考 OllaBridge 包含强大的 CLI 命令，用于诊断、测试和管理。 ### 诊断命令 #### `ollabridge doctor` 诊断您的 OllaBridge 设置（Ollama、网关、认证、CORS）： ``` ollabridge doctor ``` **输出：** ``` OllaBridge Doctor ┏━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓ ┃ Check ┃ Result ┃ ┡━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┩ │ Ollama /api/tags │ ✅ OK │ │ OllaBridge /health │ ✅ OK │ │ API_KEYS configured │ ✅ yes │ │ CORS_ORIGINS │ http://localhost:5173,... │ │ Auth usage │ Use Authorization: Bearer │ └─────────────────────┴─────────────────────────────────┘ ``` **使用场景：** 排除连接问题，部署前验证设置。 #### `ollabridge models` 列出可用模型（需要 API 密钥）： ``` ollabridge models --api-key sk-ollabridge-xY9kL2mN8pQ4rT6vW1zA ``` **输出：** ``` deepseek-r1 llama3.1 mixtral ``` **使用场景：** 验证所有节点上有哪些模型可用。 #### `ollabridge test-chat` 发送测试聊天补全（需要 API 密钥）： ``` # 简单测试 ollabridge test-chat "Hello, how are you?" --api-key sk-ollabridge-... # 指定模型 ollabridge test-chat "Explain quantum computing" \ --model deepseek-r1 \ --api-key sk-ollabridge-... ``` **输出：** ``` ╭─────────── Assistant ───────────╮ │ Hello! I'm doing well, thank │ │ you for asking. How can I help │ │ you today? │ ╰──────────────────────────────────╯ ``` **使用场景：** 验证端到端连接，测试 API 密钥，验证模型响应。 ### 网关管理 #### `ollabridge start` 启动网关（标准模式）： ``` ollabridge start ``` #### `ollabridge start --lan` 启动并显示 LAN URL（用于教室/共享网络）： ``` ollabridge start --lan ``` **输出包含：** ``` 🌐 LAN Access LAN API base: http://192.168.1.50:11435/v1 LAN Health: http://192.168.1.50:11435/health Example (with API key): curl -H 'Authorization: Bearer ' http://192.168.1.50:11435/v1/models ``` **使用场景：** 在您的网络上与其他设备（Quest 头显、手机、其他笔记本电脑）共享您的网关。 #### `ollabridge start --share` 暴露公共 URL（通过 ngrok）： ``` ollabridge start --share ``` **使用场景：** 远程访问，从任何地方连接节点。 #### `ollabridge enroll-create` 为节点创建注册令牌： ``` ollabridge enroll-create --ttl 3600 ``` ### 快速任务 | 任务 | 命令 | |------|---------| | **列出模型 (API)** | `ollabridge models --api-key ` | | **测试连接** | `ollabridge test-chat "test" --api-key ` | | **检查健康** | `curl http://localhost:11435/health` | | **诊断设置** | `ollabridge doctor` | | **查看节点** | `curl -H "X-API-Key: " http://localhost:11435/admin/runtimes` | | **查看日志** | `curl -H "X-API-Key: " http://localhost:11435/admin/recent` | | **创建令牌** | `ollabridge enroll-create` | ### 面向开发者 OllaBridge 需要 API 密钥来验证请求。如果没有提供 `.env` 文件，或者 `.env` 文件不包含 `API_KEYS`，OllaBridge 将自动生成一个**临时的、单次运行的密钥 API 密钥**（`sk-ollabridge-...`），将其打印到屏幕上，并仅在当前运行中使用，以便您可以立即开始开发。**默认情况下，此密钥不会写入磁盘**，这可以防止凭据意外持久化并提高安全性。如果您明确希望 OllaBridge 持久化生成的 API 密钥，您必须通过以下方式启动网关来选择加入： ``` ollabridge start --write-env ``` 在这种情况下，OllaBridge 会将生成的密钥写入 `.env`。对于生产部署，强烈建议使用**环境变量或安全的密钥管理器**来设置 `API_KEYS`，而不是 `.env` 文件。这种设计提供了安全的默认值，同时避免了意外存储敏感信息。 ## ☁️ 可选：OllaBridge Cloud OllaBridge Local 可以**选择性地**连接到 **OllaBridge Cloud**，以实现多用户、多设备部署。 ### 云端功能 - 🔐 **安全设备配对**，需用户批准 - 👥 **多用户支持**，具有设备所有权 - 🌍 **无需端口转发**（设备主动向外连接到云端） - 📱 **每用户多设备**（PC + Quest + 手机等） - 🔄 **流式支持**，用于实时响应 ### 将您的设备与云端配对 ``` # 1. 将此设备与 OllaBridge Cloud 配对 ollabridge-node cloud-pair --cloud https://your-cloud-url.com # 显示配对码 - 通过 web UI 批准 # 2. 连接到 Cloud（使用已保存的凭证） ollabridge-node cloud-connect ``` **工作原理：** 1. `cloud-pair` 从云端获取配对码 2. 您通过云端的 Web UI 批准该代码 3. 设备凭据保存到 `~/.ollabridge/cloud_device.json` 4. `cloud-connect` 将您的设备连接到云端中继 5. 云端安全地将请求路由到您的设备 ### 本地模式（默认） vs 云端模式 | 功能 | 本地模式 | 云端模式 | |---------|------------|------------| | **设置** | `ollabridge-node join --control --token ` | `ollabridge-node cloud-pair --cloud ` | | **认证** | 注册令牌 | 设备配对 + 批准 | | **用户** | 单用户自托管 | 多用户云账户 | | **设备** | 手动节点管理 | 每用户设备所有权 | | **流式传输** | 尚不支持 | ✅ 支持 | | **端口转发** | 不需要（出站） | 不需要（出站） | **两种模式可以协同工作！** 运行本地网关 + 节点进行自托管，并可选择将设备与云端配对以实现多用户场景。 ## 🏠 HomePilot 集成 OllaBridge 包含一个内置的 **HomePilot 连接器**，可以将 [HomePilot](https://github.com/ruslanmv/HomePilot) 角色作为标准 OpenAI 模型公开。任何使用 OpenAI 协议的应用 —— 包括 [3D Avatar Chatbot](https://github.com/ruslanmv/3D-Avatar-Chatbot) —— 都可以与具有个性、长期记忆和 MCP 工具访问权限的持久 AI 角色聊天。 ### 启用 HomePilot ``` # .env HOMEPILOT_ENABLED=true HOMEPILOT_BASE_URL=http://localhost:8000 HOMEPILOT_API_KEY=your-api-key ``` ### 工作原理 ``` graph LR A[Your App] -->|OpenAI SDK| B[OllaBridge] B -->|"model=deepseek-r1"| C[Local Ollama] B -->|"model=persona:proj-123"| D[HomePilot] B -->|"model=personality:therapist"| D style B fill:#6366f1,stroke:#4f46e5,stroke-width:3px,color:#fff style D fill:#10b981,stroke:#059669,stroke-width:2px,color:#fff ``` **智能路由**：以 `persona:` 或 `personality:` 开头的模型会自动发送到 HomePilot。其他所有内容则发送到 Ollama 或其他连接的节点。 ### 与角色聊天 ``` from openai import OpenAI client = OpenAI( base_url="http://localhost:11435/v1", api_key="sk-ollabridge-YOUR-KEY" ) # 与 HomePilot 角色聊天 — 同样的 OpenAI API response = client.chat.completions.create( model="persona:my-therapist", messages=[{"role": "user", "content": "I've been feeling stressed."}] ) print(response.choices[0].message.content) ``` ### 发现可用角色 ``` # 列出所有模型（Ollama + HomePilot 角色） curl -H "Authorization: Bearer sk-ollabridge-..." \ http://localhost:11435/v1/models ``` 在单个列表中返回本地 Ollama 模型和 HomePilot 角色： ``` { "data": [ {"id": "deepseek-r1", "owned_by": "ollama"}, {"id": "personality:therapist", "owned_by": "homepilot"}, {"id": "persona:proj-abc123", "owned_by": "homepilot"} ] } ``` ### 角色带来的功能每个 HomePilot 角色都具有超越普通 LLM 的能力： | 功能 | 描述 | |---|---| | **个性** | 包含心理学、语音风格、行为的丰富系统提示 | | **长期记忆** | 跨会话的每角色持久记忆 | | **MCP 工具** | Gmail、Calendar、GitHub、Slack、网络搜索等 | | **知识库** | 基于上传文档的 RAG | | **图像生成** | ComfyUI 工作流（FLUX、SDXL） | 对客户端完全透明 —— 您获得的是标准的 OpenAI 格式响应。 ### 3D 虚拟形象聊天机器人 + HomePilot [3D Avatar Chatbot](https://github.com/ruslanmv/3D-Avatar-Chatbot) 内置了 OllaBridge 提供者。在设置中选择它，获取模型，您的 3D 虚拟形象就会带有 HomePilot 角色的个性和记忆进行对话： ``` 3D Avatar Chatbot → OllaBridge Gateway → HomePilot Persona → LLM + Memory + Tools ``` ### 完整架构 ``` ┌──────────────────────────────────────────┐ │ OllaBridge Gateway │ │ │ │ Registry │ │ ├── local_ollama → Ollama (:11434) │ │ ├── relay_link → Remote GPUs │ │ └── homepilot → HomePilot (:8000) │ │ │ │ Router │ │ ├── "persona:*" → homepilot nodes │ │ ├── "personality:*"→ homepilot nodes │ │ └── other models → best available │ └──────────────────────────────────────────┘ ``` 有关详细的角色系统文档，请参阅 [HomePilot's OLLABRIDGE.md](https://github.com/ruslanmv/HomePilot/blob/main/docs/OLLABRIDGE.md)。 ## 🖥️ 仪表盘 UI OllaBridge 附带一个内置的 **广播塔仪表盘** —— 一个实时指挥中心，可以一目了然地可视化您的整个 LLM 路由基础设施。

OllaBridge Dashboard – Broadcast Tower

### 快速开始 ``` # 安装前端依赖 make ui-install # 开发（热重载，代理到 OllaBridge API） make ui-dev # 生产构建（在网关运行时通过 /ui 提供） make ui-build ``` 构建完成后，当 OllaBridge 运行时，可以通过 **`http://localhost:11435/ui`** 访问仪表盘。 ### 您将看到的内容 | 元素 | 描述 | |---------|-------------| | **中央球体** | LLM 核心 —— 在线时脉冲跳动，显示活动模型名称 | | **源芯片** | 上游输入（源输入）和已连接的 LLM 模型 | | **信号光束** | 动画 SVG 路径，显示从塔到消费者的数据流 | | **消费者节点** | 运行时端点 —— 每张卡片实时显示节点状态 | | **状态 HUD** | 右上角覆盖层，显示实时健康、模式、模型数量、运行时数量 | ### 技术栈 - **React 19** + TypeScript + Vite 8 - **TanStack Query** 用于实时 API 轮询（每 10-30 秒自动刷新） - **Framer Motion** 用于球体脉冲、光束粒子和悬停动画 - **Tailwind CSS v4** 采用玻璃拟态设计令牌（海军蓝/青色/紫色调色板） ## 🗺️ 路线图 - [x] ✅ 控制平面 + 节点架构 - [x] ✅ 仅出站节点注册（无端口转发） - [x] ✅ 用于 AI agent 控制的 MCP 服务器 - [x] ✅ 多节点负载均衡 - [x] ✅ 诊断 CLI 命令（doctor, models, test-chat） - [x] ✅ 增强的浏览器客户端 CORS 处理 - [x] ✅ 用于教室/共享网络部署的 LAN 模式 - [x] ✅ 云兼容性（可选设备配对） - [x] ✅ 聊天补全的流式支持（云端模式） - [x] ✅ HomePilot 角色集成（智能角色路由） - [ ] 🚧 基于标签的路由（将“编码”请求发送到 GPU 节点） - [ ] 🚧 特定模型路由规则 - [x] ✅ Web UI 仪表盘（广播塔可视化） - [ ] 🚧 Prometheus 指标 - [ ] 🚧 支持更多运行时（vLLM, llama.cpp, LM Studio） ## 🤝 贡献我们欢迎贡献！我们需要帮助的领域： - 🔌 更多运行时适配器（vLLM, llama.cpp 等） - 🎨 用于管理的 Web UI - 📊 更好的监控/指标 - 🔒 安全增强 - 📖 文档改进 **如何贡献：** 1. Fork 仓库 2. 创建分支 (`git checkout -b feature/amazing`) 3. 进行更改 4. 添加测试 5. 提交 PR ## 📄 许可证 Apache License 2.0 - 详见 [LICENSE](LICENSE) ## 🙏 构建技术 - [FastAPI](https://fastapi.tiangolo.com/) — 现代异步 Web 框架 - [Ollama](https://ollama.ai/) — 本地运行 LLM - [WebSockets](https://websockets.readthedocs.io/) — 实时节点连接 - [SQLModel](https://sqlmodel.tiangolo.com/) — 具有 Python 类型的数据库 ## 💬 支持 - 📖 [文档](docs/) - 🐛 [报告 Bug](https://github.com/ruslanmv/ollabridge/issues) - 💡 [请求功能](https://github.com/ruslanmv/ollabridge/issues) - 💬 [讨论](https://github.com/ruslanmv/ollabridge/discussions) ## 🌟 Star 历史如果 OllaBridge 帮助了您，请给它一个 star！⭐ ## 兼容 HomePilot

OllaBridge 是 [HomePilot](https://github.com/ruslanmv/HomePilot) 角色的推荐网关。将 `persona:*` 和 `personality:*` 模型路由到 HomePilot，同时通过 Ollama 提供本地 LLM 服务 —— 全部通过单一 OpenAI 兼容端点。

OllaBridge Architecture

连接 [3D Avatar Chatbot](https://github.com/ruslanmv/3D-Avatar-Chatbot)，获得具有口型同步、手势和语音的沉浸式 VR 角色体验。

3D Avatar + HomePilot Pipeline

**为本地优先 AI 社区用 ❤️ 打造** **停止支付云端 token 费用。使用您自己的算力。**

标签：AI开发工具, AI智能体, AI风险缓解, API代理, Beacon Object File, DeepSeek, DLL 劫持, GPU云计算, LLM, LLM评估, MCP, Mixtral, Ollama, OpenAI兼容API, Python, Unmanaged PE, 内网穿透, 分布式计算, 大语言模型, 工作站, 异常处理, 无后门, 本地模型部署, 模型网关, 模型路由, 熵值分析, 生产级环境, 私有化部署, 自动化攻击, 自愈系统, 远程访问, 逆向工具, 防御规避, 零配置