shiwenwen/hope-agent

GitHub: shiwenwen/hope-agent

一款具备持久记忆与跨设备交接能力的桌面 AI 助手，支持服务化常驻部署在 NAS 或云端。

Stars: 1261 | Forks: 108

Hope Agent

跨端交接、越用越懂你的桌面 AI 助手，也能服务化常驻、跑在云上
会记忆 · 能成长 · 深度融合 · 在你所有的聊天里随叫随到

简体中文 · English

**Hope Agent** 想把 AI 助手做得更简单、更稳定，也更省维护。同一份会话能在你的设备和聊天之间随手交接，并在日复一日的使用里自己变好——跨会话记忆持续累积、空闲时自己整理、做过的事沉淀成可复用的技能。一个原生安装包，主流大模型 GUI 模板内置齐全，填完 API Key 就能开聊；桌面端还能在你授权后观察并控制本机电脑（暂时仅 macOS）；同时它也能以服务形态常驻 NAS / 自家服务器 / 云主机，在 IM 渠道里随叫随到。 ## 目录 - [缘起](#缘起) - [亮点](#亮点) - [快速开始](#快速开始) - [下载安装](#下载安装) - [自托管（Docker）](#自托管docker) - [开发者](#开发者) - [运行模式](#运行模式) - [生态一览](#生态一览) - [项目结构](#项目结构) - [文档](#文档) - [贡献](#贡献) - [社区](#社区) - [致谢](#致谢) - [Star History](#star-history) - [License](#license) ## 缘起我们希望 AI 助手能真正**打开就能用**——下载安装即用，不用先装运行时、学命令行，也不用为看不懂配置、服务半夜崩掉没人管而操心；同时它还应该**走到哪都能接着用**。Hope Agent 不只是桌面 GUI，它还能以 HTTP/WS 服务常驻，放在 NAS、自家服务器或云主机上 7×24 跑着，同时接入 IM 渠道、对接 IDE（ACP）；但我们相信最顺手的入口仍然是桌面，所以在**桌面 GUI 和系统深度融合**上投入了最多的精力，同时把性能、稳定性和交互细节一起打磨好。核心目标很朴素：降低使用和维护成本，让简单场景足够顺手，让长期运行也足够稳定。也希望它能陪着你长期用下去——同一份会话跨设备、跨入口接续，让工作随你切换平台而不中断，记忆和技能慢慢累积下来。 ## 亮点 ### 🎯 日常使用

🖥️ 桌面原生 GUI	macOS / Linux / Windows 三端原生应用，下载即用。12 种界面语言（简/繁中、英、日、韩、西、葡、俄、阿、土、越、马），深色主题与精心调校的字体排版。
🧙 傻瓜式 Provider 配置	39 个内置 Provider 模板，覆盖 206 个预设模型。Anthropic / OpenAI / Gemini / Codex / OpenRouter / DeepSeek / Kimi / Qwen / 豆包 / GLM / MiniMax / xAI / Mistral / Cerebras / DeepInfra / 腾讯混元 / Ollama 一站式覆盖；同一 Provider 支持多 API Key 自动轮换，遇到限流或额度用尽无缝切换下一把钥匙。
🦙 本地小模型一键安装	不用账号、不用 API Key、不用终端——设置 → 模型页面按硬件挑一个能跑得动的 Qwen3.6 / Gemma 4 尺寸，一键完成 Ollama 安装、模型下载、Provider 注册与切换。同一流程也覆盖本地 Embedding 模型。
💬 12 个 IM 渠道一站接入	Telegram、Discord、Slack、飞书、Google Chat、LINE、QQ Bot、Signal、iMessage、IRC、WeChat、WhatsApp。图片 / 语音 / 文件入站自动转多模态上下文；工具审批直接在聊天窗按按钮决定；每个群聊 / 账号可绑定独立 Agent 和权限策略。
🤝 对话随手交接，跨端不掉线	同一份会话能在桌面、浏览器、IM 之间随手交接——出门前在电脑上聊到一半，地铁里掏出手机用 Telegram 接着说，回家打开桌面应用它已经把外面 IM 期间的聊天捋好了。同一份记忆 / 工具状态 / Plan / 工作目录跟着走，另一端不用重新介绍上下文。`/handover` 把当前桌面会话推到指定 IM 聊天，`/session <id>` 在 IM 端反向接管；桌面正在跑的对话还会流式镜像到 IM，模型边写边在 Telegram / 飞书 / Slack 里打字。
🌐 独立服务 · 浏览器即客户端	不止是桌面应用——可以完全脱离 GUI 单独作为服务运行。一条命令 `hope-agent server start` 就能起一个 HTTP/WS 守护进程，`server install` 注册成 launchd / systemd 开机自启，放家里 NAS / 云服务器 / 旧笔记本上 24 小时在线。Server 内嵌完整 Web GUI（前端用 `rust-embed` 打进二进制），手机、平板、浏览器、另一台电脑打开 `http://<server>:port` 就是完整 React 界面——不用装客户端、不用配前端。Bearer Token 鉴权 + SSRF 三档策略保证公网暴露也可控；会话、记忆、Cron、IM 渠道全在服务端跑，客户端只是窗口。
🔁 三种运行模式同核	桌面 GUI（默认）、HTTP/WS 守护进程 + 内嵌 Web GUI（浏览器直连）、ACP stdio（给 IDE 当 agent 后端）。三种模式共用 Rust `ha-core` 核心库，零 Tauri 依赖——同一份代码既能当桌面 app，也能当服务器，也能嵌进 IDE。

### 🧠 记忆与学习

🧠 跨会话持久记忆	SQLite + FTS5 全文检索 + 向量语义检索三位一体。记忆可按全局 / 项目 / Agent 三层 scope 组织；system prompt 注入按联合预算分配，不会因为某一层过长挤掉其他层。
🕶 无痕对话	会话级开关，首条消息就能无痕。开启后当前对话不注入任何记忆或跨会话感知，也不自动收集记忆；只有你明确说“记住这个”或“回忆一下”时，才会主动调用记忆工具。
💤 离线"做梦"整理	空闲时自动跑一遍"过去这两天最有价值的记忆是哪些"，把入选条目 pin 住并写成 markdown 日记，可在设置 → Dream Diary 回看。每天工作完帮你把今天学到的知识沉淀下来，下次对话用得上。
🔍 主动召回 + 反省画像	每轮对话开始前，按你刚打的那句话主动捞出最相关的记忆注入 prompt（Active Memory）；另外反省式地从历史对话里提炼沟通风格 / 工作习惯 / 长期偏好，单独以"用户画像"段落进 prompt，越用越懂你。
🛠 会成长的技能系统	执行完复杂任务后自动生成技能草稿（Draft），你审核通过下次就能复用。技能支持条件激活（比如只在编辑 Python 文件时加载）、fork 子 Agent 执行、工具白名单隔离；兼容 agentskills.io 开放标准，社区技能即插即用。
👁 跨会话行为感知	它知道你别的对话里在做什么。每轮对话开始前自动感知其他活跃会话的最近动作、目标、摩擦点，需要时把相关信息同步到当前会话——不打扰主线，只在上下文相关时出现。默认零 LLM 成本的结构化模式，可选切到 LLM 自然语言摘要模式。
💾 长对话不失忆	上下文五层渐进式压缩，不管聊多久前文都不会被强切丢失。tool 调用配对永远不拆散；摘要过的消息还会自动从磁盘恢复最近编辑过的文件内容，省去你反复粘贴的麻烦。与 Prompt Caching 配合，长会话的 API 成本明显低于朴素调用。

### 🛠 工作流 & 工具

📋 Plan Mode 计划执行	面对复杂任务先出一份可修改 / 可承接的计划书，5 态状态机管理执行进度，计划文件按 agent / session 物理隔离不会跨会话串戏。计划可跨会话存档，下次继续只要一句"继续上次的计划"。侧栏 Plans 历史查看器支持跨会话只读浏览所有 Plan（含已 `/plan exit` 归档），按 Agent / 状态筛选、版本切换、一键跳转所属会话；详情面板可一键以 `@plan:<short_id>:v<version>` 形式注入到当前对话。执行期间严格按白名单工具操作，避免模型跑飞。
📁 Project 项目容器	把相关会话归到同一项目下，继承项目级记忆 / 项目指令 / 共享文件。上传的文件自动文本抽取并三层注入（目录清单 / 小文件自动内联 / 大文件按需读取），不用手动 @ 文件也不怕吃爆上下文。
🖱️ 电脑控制	暂时仅支持 macOS。Agent 可以借助已授权的辅助功能与屏幕录制权限观察当前桌面、识别 AX 元素与窗口，并执行打开 / 切换 App、点击、输入、滚动、拖拽、菜单、对话框、窗口移动 / 缩放 / 关闭等操作。右侧 Mac Control 面板实时镜像桌面状态；所有有副作用的动作都接入统一工具审批。
👥 Agent Team 多 Agent 协作	在设置里预置团队模板（成员角色、绑定 Agent、默认任务模板），模型按需一句话就能组建专家团。成员间可互发消息、协同推进，完成后自动把 transcript 汇总回主对话。
🗓 自然语言定时任务	"每天早 8 点给我写日报"、"每周一整理上周待办"、"工作日每小时扫一次邮箱"——到点自动跑，结果可选投递到任一 IM 渠道。Cron 在守护进程 / 桌面 GUI 下都能稳定运行。
📊 Dashboard + Recap 复盘	内置数据大盘：成本 / Token / 活跃度热力图 / 健康度四维可视化，新增 Plan 子板（状态分布、完成率、按 Agent / Project 分组、30 天创建趋势、平均执行时长）。`/recap` 深度复盘一键跑过去 N 天会话，生成 11 个 AI 章节报告（含 Agent 工具优化建议、记忆与技能推荐、成本优化等），可导出独立 HTML 分享。
🔌 MCP 客户端（OAuth 2.1）	内置 Model Context Protocol 客户端，四种 transport 全支持：stdio / Streamable HTTP / SSE / WebSocket。完整 OAuth 2.1 + PKCE 流程（自动 discovery、RFC 7591 动态注册、loopback 回调），凭据 0600 原子写落盘，Notion / Linear 等标准 OAuth server 可一键授权；所有出站 URL 硬过 SSRF 策略。GUI 里一键从 `claude_desktop_config.json` 导入，工具自动以 `mcp__<server>__<tool>` 接入主对话；另配 `mcp_resource` / `mcp_prompt` 工具访问被动数据，长跑工具自动后台化。
🔧 工具箱	电脑控制（暂时仅 macOS）、可控浏览器（8-action 高层表面，chat 右侧实时镜像面板所见即所得，Chrome 自动跟随 agent 操作；CDP 直连 chromiumoxide，零运行时依赖）、Canvas 画布、AI 画图（7 个 Provider）、Web 搜索（8 个 Provider failover）、bash 执行（可选 Docker 沙箱隔离）、文件读写 / grep / find、URL 预览、崩溃日志、自诊断。
📑 飞书工作空间深度集成	40 个 `feishu_*` tool 覆盖 docx 云文档（建/读/改）、bitable 多维表格（CRUD + view + dashboard）、drive 云盘（上下传 ≤20MB，本地路径走 protected-path 审批）、wiki 知识库链接解析、approval 审批（创建/查询/撤销）、calendar 日历（建会/邀人/改/删）、contact 联系人（查用户/部门）、hire 招聘（岗位/人才库/投递）。复用已配的飞书 IM channel 凭据，配套 `skills/feishu` 技能教模型 OKR 周报 / 排会议 / 撤审批等典型工作流。
⚡ 后台跑长任务	耗时的 shell 命令 / Web 搜索 / AI 画图可以让 Agent "丢到后台跑"，立即返回 `job_id` 继续对话不阻塞。后台完成后结果自动注入回主对话，也可以让模型主动 `job_status` poll 结果。再长的任务都不会卡住你的聊天窗。

### 🛡 安全与本地化

🔒 工具审批 + Docker 沙箱	敏感工具调用走审批门控（支持超时后自动 deny / proceed 策略，也支持渠道级自动批准）；高危的 bash / 文件写入可选择跑在 Docker 沙箱里隔离执行。给 Agent 高权限也不怕翻车。
🏠 本地优先 · 零第三方中转	所有数据在 `~/.hope-agent/`：配置、会话、记忆、附件、技能、日志全部本地 SQLite / 文件存储；API Key 直连模型厂商。服务模式下 Bearer Token 鉴权 + SSRF 三档策略，远程访问也可控。
🛟 配置自动快照 · 一键回滚	任何配置变更都自动快照到本地 `backups/autosave/`，保留最近 50 份。就算模型通过设置工具帮你改乱了参数，也能随时还原到任意历史时间点。
♻️ 崩溃自愈 · 三层保活	父子进程 Guardian 监控子进程异常退出，指数退避（1s → 3s → 9s → 15s → 30s）自动拉起；连续崩溃 5 次自动备份配置 + LLM 自诊断 + 尝试自动修复，崩溃历史在「设置 → 崩溃历史」里可回看。`server install` 后再叠加 launchd `KeepAlive` / systemd `Restart=on-failure` OS 级二次保险——即使 Guardian 本身被 `kill -9`，操作系统也会把它拉回来。Cron / IM 渠道 / MCP 连接各自独立 watchdog 自动重连。

## 快速开始 ### 下载安装 #### macOS ##### Homebrew（推荐） brew tap shiwenwen/hope-agent brew install --cask hope-agent ##### 手动安装（DMG）到 [Releases](https://github.com/shiwenwen/hope-agent/releases) 下载 `Hope.Agent_*.dmg`，拖到「应用程序」即可。 Apple Silicon 与 Intel Mac 均提供原生构建（arm64 / x64 DMG），Homebrew 与手动下载都会按你的硬件自动选对版本。 ##### 启动方式 - **桌面 GUI**：Launchpad / 应用程序文件夹（点 Hope Agent 图标），或终端 `open -a "Hope Agent"` / `hope-agent` - **后台服务（HTTP/WS daemon）**：`hope-agent server start` - **ACP（IDE 集成）**：`hope-agent acp` #### Windows ##### Scoop（推荐） scoop bucket add hope-agent https://github.com/shiwenwen/scoop-hope-agent scoop install hope-agent ##### 手动安装（installer）到 [Releases](https://github.com/shiwenwen/hope-agent/releases) 下载 `Hope.Agent_*-setup.exe` 双击安装。**Windows 端尚未完成充分测试**，欢迎反馈问题。当前仅 x64。 ##### 启动方式 - **桌面 GUI**：Start 菜单点「Hope Agent」启动，或 PowerShell `hope-agent` - **后台服务（HTTP/WS daemon）**：`hope-agent server start`（PowerShell / cmd） - **ACP（IDE 集成）**：`hope-agent acp` #### Linux ##### Arch Linux / Manjaro（AUR） yay -S hope-agent-bin # 或 paru / 任意 AUR helper 预编译二进制版（沿用 GitHub Release 的 `.deb`），不从源码编译。 ##### Debian / Ubuntu（apt） curl -fsSL https://shiwenwen.github.io/hope-agent-linux-repo/pubkey.gpg | \ sudo gpg --dearmor -o /usr/share/keyrings/hope-agent.gpg echo "deb [signed-by=/usr/share/keyrings/hope-agent.gpg] https://shiwenwen.github.io/hope-agent-linux-repo/apt stable main" | \ sudo tee /etc/apt/sources.list.d/hope-agent.list sudo apt update sudo apt install hope-agent ##### Fedora / RHEL / CentOS（dnf / yum） sudo curl -fsSL https://shiwenwen.github.io/hope-agent-linux-repo/rpm/hope-agent.repo \ -o /etc/yum.repos.d/hope-agent.repo sudo dnf install hope-agent # 或 sudo yum install hope-agent openSUSE 用户： sudo zypper addrepo https://shiwenwen.github.io/hope-agent-linux-repo/rpm/hope-agent.repo sudo zypper install hope-agent ##### 手动安装（AppImage / deb / rpm）到 [Releases](https://github.com/shiwenwen/hope-agent/releases) 下载（包名含架构后缀，按你的机器选 `_amd64` / `_arm64` 或 `.x86_64` / `.aarch64`）： - AppImage：`Hope.Agent_*.AppImage` —— `chmod +x` 后直接运行 - Debian / Ubuntu：`Hope.Agent_*.deb` —— `sudo dpkg -i Hope.Agent_*.deb` - Fedora / RHEL：`Hope.Agent_*.rpm` —— `sudo rpm -i Hope.Agent_*.rpm` 提供 amd64 (x86_64) 与 arm64 (aarch64) 两种原生构建，覆盖普通 PC、树莓派 4/5、Apple Silicon 跑 Asahi Linux、Graviton / Ampere 云主机。apt 与 dnf 都会按 `dpkg --print-architecture` / `$basearch` 自动选对版本。 ##### 启动方式 - **桌面 GUI**：应用菜单点「Hope Agent」启动，或终端 `hope-agent` - **后台服务（HTTP/WS daemon）**：`hope-agent server start` - **ACP（IDE 集成）**：`hope-agent acp` #### 首次启动 & 自动更新 1. 首次启动向导：**选 Provider 模板 → 填 API Key / Codex OAuth 登录 → 开聊** 2. 桌面应用内置 GitHub Releases 自动更新，应用内 **设置 → 关于** 检查更新并一键安装；或者直接在对话里说「升级」或「检查更新」 3. 通过 Homebrew / AUR / Scoop 装的版本同样走应用内置 updater；包管理器视角的版本号会保持初装时的，不影响功能 ### 自托管（Docker）把 Hope Agent 跑在家用 NAS / VPS / homelab 上、用浏览器访问 Web GUI 的场景： docker run -d \ --name hope-agent \ -p 127.0.0.1:8420:8420 \ -v hope-data:/data \ ghcr.io/shiwenwen/hope-agent:latest 容器跑起来后浏览器打开，按 Onboarding 向导配 Provider API Key。镜像覆盖 `linux/amd64` + `linux/arm64`（含 Apple Silicon / 树莓派），随每次 Release Tag 自动构建。要用 docker compose / 配合 Ollama 本地 LLM / 暴露到 LAN / 反向代理与 TLS / 升级流程，见 [`docs/deployment/docker.md`](docs/deployment/docker.md)。 ### 开发者 git clone https://github.com/shiwenwen/hope-agent.git cd hope-agent pnpm install pnpm tauri dev # 桌面开发模式（前端 + Rust 热重载） # 其他常用命令 pnpm typecheck # 前端类型检查（tsc -b） pnpm lint # Lint pnpm tauri build # 打生产包本地开发时如果想在浏览器里看“网页版”并实时刷新，运行 `pnpm tauri dev` 后打开 `http://localhost:1420`。这是 Vite dev server，和 Tauri 窗口共用前端热更新；`http://localhost:8420` 是内嵌 HTTP/WS 服务提供的静态 Web GUI（来自 `dist/` / embedded bundle），用于模拟打包后的浏览器入口，不会跟随源码 HMR。若本地 Server 开了 API Key，`1420` 页面请求 `8420` 可能返回 401，开发时可先在设置里临时清空 Server API Key 后重启。 ## 运行模式 | 模式 | 启动方式 | 场景 | | --------------------------- | -------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 桌面 GUI | 双击图标 / `pnpm tauri dev` | 功能最全的入口：完整 GUI 体验，并内嵌 HTTP/WS 服务，桌面在用的同时可对外提供接入 | | Server + Web GUI（HTTP/WS） | 通过 `server start` 子命令；`server install` 可注册成 launchd / systemd 开机自启 | 无 GUI 守护进程，24 小时在线，IM 渠道 / Cron 不断线；**前端 React UI 通过 `rust-embed` 内嵌进 server 二进制，浏览器打开 `http://:port` 即得完整 Web GUI**，手机 / 平板 / 任意电脑都能直连 | | ACP（stdio） | 通过 `acp` 子命令 | IDE 直连，兼容 ACP 协议的编辑器把 Hope Agent 当 agent 后端调 | 三种模式共用同一套 `ha-core` 核心逻辑；配置、会话、记忆全部落在 `~/.hope-agent/` 下。 ## 生态一览

📦 模型 Provider	39 个模板 · 206 个预设模型国际 · Anthropic · OpenAI · Codex · Google Gemini · OpenRouter · Azure OpenAI · Groq · Together AI · Fireworks · Perplexity · xAI Grok · Mistral · Cohere 国内 · DeepSeek · Moonshot (Kimi) · 通义千问 (Qwen) · 豆包 (火山引擎) · 智谱 GLM · MiniMax · 小米 MiMo 本地 · Ollama · 任意 OpenAI 兼容端点
💬 IM 渠道	12 个 · Telegram · Discord · Slack · 飞书 · Google Chat · LINE · QQ Bot · Signal · iMessage · IRC · WeChat · WhatsApp
🌐 界面语言	12 种 · 简体中文 · 繁體中文 · English · 日本語 · 한국어 · Español · Português · Русский · العربية · Türkçe · Tiếng Việt · Bahasa Melayu

## 项目结构 Cargo Workspace 三 Crate 架构，核心业务逻辑全部在 `ha-core`： crates/ ha-core/ Rust 核心库（零 Tauri 依赖）— 所有业务逻辑在这里 ha-server/ axum HTTP/WS 守护进程（薄壳） src-tauri/ Tauri 桌面 Shell（薄壳） src/ React 19 + TypeScript 前端 skills/ 内置技能（随应用发行）完整的模块拓扑、架构约定、编码规范见 [AGENTS.md](AGENTS.md)。 ## 文档详见 [docs/](docs/)。 ## 贡献主分支处于活跃开发阶段，欢迎 issue / PR。贡献前请先读一遍 [AGENTS.md](AGENTS.md) 的 "架构约定" 和 "编码规范" 两节。常用命令： pnpm tauri dev # 桌面开发 cargo check --workspace # Rust 依赖 / 类型检查 cargo test -p ha-core -p ha-server # 核心测试 node scripts/sync-i18n.mjs --check # 检查翻译缺失 ## 社区 - 🐛 [Issues](https://github.com/shiwenwen/hope-agent/issues) — Bug 报告、功能请求 - 💡 [Discussions](https://github.com/shiwenwen/hope-agent/discussions) — 用法分享、想法讨论、提问答疑 - ⭐ 如果 Hope Agent 帮到了你，欢迎在 GitHub 上点个 Star - 📮 路线图、正式文档站和更多社区渠道正在筹备中 ## 致谢 - [openclaw](https://github.com/openclaw/openclaw)：在本地 AI 助手方向上的启发 - [Ollama](https://ollama.com/)：本地大模型一键安装能力建立在 Ollama 的本地运行时与 OpenAI 兼容端点之上；Hope Agent 仅作 GUI 层包装，Qwen / Gemma 等模型由 Ollama 模型库分发 - [ClawHub](https://www.clawhub.com/) / [SkillHub](https://skillhub.cn/)：为 Hope Agent 提供公开的 skill 搜索与发现来源 - [Hermes Agent](https://github.com/NousResearch/hermes)（间接溯源 [obra/superpowers](https://github.com/obra/superpowers)）：部分内置编程方法论 skill 改编自此（MIT），详见 [THIRD_PARTY_NOTICES.md](THIRD_PARTY_NOTICES.md) - [Tauri](https://tauri.app/)、[axum](https://github.com/tokio-rs/axum)、[React](https://react.dev/)、[shadcn/ui](https://ui.shadcn.com/)、[Streamdown](https://github.com/streamdown/streamdown)、[Radix UI](https://www.radix-ui.com/) 等开源基础设施 - 所有为这个项目做过反馈、测试、提交 issue 的朋友 ## License [MIT](LICENSE)

标签：Rust, Tauri, 人工智能, 可视化界面, 桌面助手, 用户模式Hook绕过, 网络流量审计, 通知系统