shiwenwen/hope-agent
GitHub: shiwenwen/hope-agent
Stars: 930 | Forks: 79
Hope Agent
跨端交接、越用越懂你的桌面 AI 助手,也能服务化常驻、跑在云上
会记忆 · 能成长 · 深度融合 · 在你所有的聊天里随叫随到
简体中文 · English
**Hope Agent** 想把 AI 助手做得更简单、更稳定,也更省维护。同一份会话能在你的设备和聊天之间随手交接,并在日复一日的使用里自己变好——跨会话记忆持续累积、空闲时自己整理、做过的事沉淀成可复用的技能。一个原生安装包,主流大模型 GUI 模板内置齐全,填完 API Key 就能开聊;桌面端还能在你授权后观察并控制本机电脑(暂时仅 macOS);同时它也能以服务形态常驻 NAS / 自家服务器 / 云主机,在 IM 渠道里随叫随到。 ## 目录 - [缘起](#缘起) - [亮点](#亮点) - [快速开始](#快速开始) - [下载安装](#下载安装) - [自托管(Docker)](#自托管docker) - [开发者](#开发者) - [运行模式](#运行模式) - [生态一览](#生态一览) - [项目结构](#项目结构) - [文档](#文档) - [贡献](#贡献) - [社区](#社区) - [致谢](#致谢) - [Star History](#star-history) - [License](#license) ## 缘起 我们希望 AI 助手能真正**打开就能用**——下载安装即用,不用先装运行时、学命令行,也不用为看不懂配置、服务半夜崩掉没人管而操心;同时它还应该**走到哪都能接着用**。Hope Agent 不只是桌面 GUI,它还能以 HTTP/WS 服务常驻,放在 NAS、自家服务器或云主机上 7×24 跑着,同时接入 IM 渠道、对接 IDE(ACP);但我们相信最顺手的入口仍然是桌面,所以在**桌面 GUI 和系统深度融合**上投入了最多的精力,同时把性能、稳定性和交互细节一起打磨好。核心目标很朴素:降低使用和维护成本,让简单场景足够顺手,让长期运行也足够稳定。也希望它能陪着你长期用下去——同一份会话跨设备、跨入口接续,让工作随你切换平台而不中断,记忆和技能慢慢累积下来。 ## 亮点 ### 🎯 日常使用| 🖥️ 桌面原生 GUI | macOS / Linux / Windows 三端原生应用,下载即用。12 种界面语言(简/繁中、英、日、韩、西、葡、俄、阿、土、越、马),深色主题与精心调校的字体排版。 |
| 🧙 傻瓜式 Provider 配置 | 39 个内置 Provider 模板,覆盖 206 个预设模型。Anthropic / OpenAI / Gemini / Codex / OpenRouter / DeepSeek / Kimi / Qwen / 豆包 / GLM / MiniMax / xAI / Mistral / Cerebras / DeepInfra / 腾讯混元 / Ollama 一站式覆盖;同一 Provider 支持多 API Key 自动轮换,遇到限流或额度用尽无缝切换下一把钥匙。 |
| 🦙 本地小模型一键安装 | 不用账号、不用 API Key、不用终端——设置 → 模型页面按硬件挑一个能跑得动的 Qwen3.6 / Gemma 4 尺寸,一键完成 Ollama 安装、模型下载、Provider 注册与切换。同一流程也覆盖本地 Embedding 模型。 |
| 💬 12 个 IM 渠道一站接入 | Telegram、Discord、Slack、飞书、Google Chat、LINE、QQ Bot、Signal、iMessage、IRC、WeChat、WhatsApp。图片 / 语音 / 文件入站自动转多模态上下文;工具审批直接在聊天窗按按钮决定;每个群聊 / 账号可绑定独立 Agent 和权限策略。 |
| 🤝 对话随手交接,跨端不掉线 | 同一份会话能在桌面、浏览器、IM 之间**随手交接**——出门前在电脑上聊到一半,地铁里掏出手机用 Telegram 接着说,回家打开桌面应用它已经把外面 IM 期间的聊天捋好了。同一份记忆 / 工具状态 / Plan / 工作目录跟着走,另一端不用重新介绍上下文。/handover 把当前桌面会话推到指定 IM 聊天,/session <id> 在 IM 端反向接管;桌面正在跑的对话还会**流式镜像到 IM**,模型边写边在 Telegram / 飞书 / Slack 里打字。 |
| 🌐 独立服务 · 浏览器即客户端 | 不止是桌面应用——可以完全脱离 GUI 单独作为服务运行。一条命令 hope-agent server start 就能起一个 HTTP/WS 守护进程,server install 注册成 launchd / systemd 开机自启,放家里 NAS / 云服务器 / 旧笔记本上 24 小时在线。Server 内嵌完整 Web GUI(前端用 rust-embed 打进二进制),手机、平板、浏览器、另一台电脑打开 http://<server>:port 就是完整 React 界面——不用装客户端、不用配前端。Bearer Token 鉴权 + SSRF 三档策略保证公网暴露也可控;会话、记忆、Cron、IM 渠道全在服务端跑,客户端只是窗口。 |
| 🔁 三种运行模式同核 | 桌面 GUI(默认)、HTTP/WS 守护进程 + 内嵌 Web GUI(浏览器直连)、ACP stdio(给 IDE 当 agent 后端)。三种模式共用 Rust ha-core 核心库,零 Tauri 依赖——同一份代码既能当桌面 app,也能当服务器,也能嵌进 IDE。 |
| 🧠 跨会话持久记忆 | SQLite + FTS5 全文检索 + 向量语义检索三位一体。记忆可按全局 / 项目 / Agent 三层 scope 组织;system prompt 注入按联合预算分配,不会因为某一层过长挤掉其他层。 |
| 🕶 无痕对话 | 会话级开关,首条消息就能无痕。开启后当前对话不注入任何记忆或跨会话感知,也不自动收集记忆;只有你明确说“记住这个”或“回忆一下”时,才会主动调用记忆工具。 |
| 💤 离线"做梦"整理 | 空闲时自动跑一遍"过去这两天最有价值的记忆是哪些",把入选条目 pin 住并写成 markdown 日记,可在设置 → Dream Diary 回看。每天工作完帮你把今天学到的知识沉淀下来,下次对话用得上。 |
| 🔍 主动召回 + 反省画像 | 每轮对话开始前,按你刚打的那句话主动捞出最相关的记忆注入 prompt(Active Memory);另外反省式地从历史对话里提炼沟通风格 / 工作习惯 / 长期偏好,单独以"用户画像"段落进 prompt,越用越懂你。 |
| 🛠 会成长的技能系统 | 执行完复杂任务后自动生成技能草稿(Draft),你审核通过下次就能复用。技能支持条件激活(比如只在编辑 Python 文件时加载)、fork 子 Agent 执行、工具白名单隔离;兼容 agentskills.io 开放标准,社区技能即插即用。 |
| 👁 跨会话行为感知 | 它知道你别的对话里在做什么。每轮对话开始前自动感知其他活跃会话的最近动作、目标、摩擦点,需要时把相关信息同步到当前会话——不打扰主线,只在上下文相关时出现。默认零 LLM 成本的结构化模式,可选切到 LLM 自然语言摘要模式。 |
| 💾 长对话不失忆 | 上下文五层渐进式压缩,不管聊多久前文都不会被强切丢失。tool 调用配对永远不拆散;摘要过的消息还会自动从磁盘恢复最近编辑过的文件内容,省去你反复粘贴的麻烦。与 Prompt Caching 配合,长会话的 API 成本明显低于朴素调用。 |
| 📋 Plan Mode 计划执行 | 面对复杂任务先出一份可修改 / 可承接的计划书,5 态状态机管理执行进度,计划文件按 agent / session 物理隔离不会跨会话串戏。计划可跨会话存档,下次继续只要一句"继续上次的计划"。侧栏 Plans 历史查看器支持跨会话只读浏览所有 Plan(含已 /plan exit 归档),按 Agent / 状态筛选、版本切换、一键跳转所属会话;详情面板可一键以 @plan:<short_id>:v<version> 形式注入到当前对话。执行期间严格按白名单工具操作,避免模型跑飞。 |
| 📁 Project 项目容器 | 把相关会话归到同一项目下,继承项目级记忆 / 项目指令 / 共享文件。上传的文件自动文本抽取并三层注入(目录清单 / 小文件自动内联 / 大文件按需读取),不用手动 @ 文件也不怕吃爆上下文。 |
| 🖱️ 电脑控制 | 暂时仅支持 macOS。Agent 可以借助已授权的辅助功能与屏幕录制权限观察当前桌面、识别 AX 元素与窗口,并执行打开 / 切换 App、点击、输入、滚动、拖拽、菜单、对话框、窗口移动 / 缩放 / 关闭等操作。右侧 Mac Control 面板实时镜像桌面状态;所有有副作用的动作都接入统一工具审批。 |
| 👥 Agent Team 多 Agent 协作 | 在设置里预置团队模板(成员角色、绑定 Agent、默认任务模板),模型按需一句话就能组建专家团。成员间可互发消息、协同推进,完成后自动把 transcript 汇总回主对话。 |
| 🗓 自然语言定时任务 | "每天早 8 点给我写日报"、"每周一整理上周待办"、"工作日每小时扫一次邮箱"——到点自动跑,结果可选投递到任一 IM 渠道。Cron 在守护进程 / 桌面 GUI 下都能稳定运行。 |
| 📊 Dashboard + Recap 复盘 | 内置数据大盘:成本 / Token / 活跃度热力图 / 健康度四维可视化,新增 Plan 子板(状态分布、完成率、按 Agent / Project 分组、30 天创建趋势、平均执行时长)。/recap 深度复盘一键跑过去 N 天会话,生成 11 个 AI 章节报告(含 Agent 工具优化建议、记忆与技能推荐、成本优化等),可导出独立 HTML 分享。 |
| 🔌 MCP 客户端(OAuth 2.1) | 内置 Model Context Protocol 客户端,四种 transport 全支持:stdio / Streamable HTTP / SSE / WebSocket。完整 OAuth 2.1 + PKCE 流程(自动 discovery、RFC 7591 动态注册、loopback 回调),凭据 0600 原子写落盘,Notion / Linear 等标准 OAuth server 可一键授权;所有出站 URL 硬过 SSRF 策略。GUI 里一键从 claude_desktop_config.json 导入,工具自动以 mcp__<server>__<tool> 接入主对话;另配 mcp_resource / mcp_prompt 工具访问被动数据,长跑工具自动后台化。 |
| 🔧 工具箱 | 电脑控制(暂时仅 macOS)、可控浏览器(8-action 高层表面,chat 右侧实时镜像面板所见即所得,Chrome 自动跟随 agent 操作;CDP 直连 chromiumoxide,零运行时依赖)、Canvas 画布、AI 画图(7 个 Provider)、Web 搜索(8 个 Provider failover)、bash 执行(可选 Docker 沙箱隔离)、文件读写 / grep / find、URL 预览、崩溃日志、自诊断。 |
| 📑 飞书工作空间深度集成 | 40 个 feishu_* tool 覆盖 docx 云文档(建/读/改)、bitable 多维表格(CRUD + view + dashboard)、drive 云盘(上下传 ≤20MB,本地路径走 protected-path 审批)、wiki 知识库链接解析、approval 审批(创建/查询/撤销)、calendar 日历(建会/邀人/改/删)、contact 联系人(查用户/部门)、hire 招聘(岗位/人才库/投递)。复用已配的飞书 IM channel 凭据,配套 skills/feishu 技能教模型 OKR 周报 / 排会议 / 撤审批等典型工作流。 |
| ⚡ 后台跑长任务 | 耗时的 shell 命令 / Web 搜索 / AI 画图可以让 Agent "丢到后台跑",立即返回 job_id 继续对话不阻塞。后台完成后结果自动注入回主对话,也可以让模型主动 job_status poll 结果。再长的任务都不会卡住你的聊天窗。 |
| 🔒 工具审批 + Docker 沙箱 | 敏感工具调用走审批门控(支持超时后自动 deny / proceed 策略,也支持渠道级自动批准);高危的 bash / 文件写入可选择跑在 Docker 沙箱里隔离执行。给 Agent 高权限也不怕翻车。 |
| 🏠 本地优先 · 零第三方中转 | 所有数据在 ~/.hope-agent/:配置、会话、记忆、附件、技能、日志全部本地 SQLite / 文件存储;API Key 直连模型厂商。服务模式下 Bearer Token 鉴权 + SSRF 三档策略,远程访问也可控。 |
| 🛟 配置自动快照 · 一键回滚 | 任何配置变更都自动快照到本地 backups/autosave/,保留最近 50 份。就算模型通过设置工具帮你改乱了参数,也能随时还原到任意历史时间点。 |
| ♻️ 崩溃自愈 · 三层保活 | 父子进程 Guardian 监控子进程异常退出,指数退避(1s → 3s → 9s → 15s → 30s)自动拉起;连续崩溃 5 次自动备份配置 + LLM 自诊断 + 尝试自动修复,崩溃历史在「设置 → 崩溃历史」里可回看。server install 后再叠加 launchd KeepAlive / systemd Restart=on-failure OS 级二次保险——即使 Guardian 本身被 kill -9,操作系统也会把它拉回来。Cron / IM 渠道 / MCP 连接各自独立 watchdog 自动重连。 |
| 📦 模型 Provider |
39 个模板 · 206 个预设模型 国际 · Anthropic · OpenAI · Codex · Google Gemini · OpenRouter · Azure OpenAI · Groq · Together AI · Fireworks · Perplexity · xAI Grok · Mistral · Cohere 国内 · DeepSeek · Moonshot (Kimi) · 通义千问 (Qwen) · 豆包 (火山引擎) · 智谱 GLM · MiniMax · 小米 MiMo 本地 · Ollama · 任意 OpenAI 兼容端点 |
| 💬 IM 渠道 | 12 个 · Telegram · Discord · Slack · 飞书 · Google Chat · LINE · QQ Bot · Signal · iMessage · IRC · WeChat · WhatsApp |
| 🌐 界面语言 | 12 种 · 简体中文 · 繁體中文 · English · 日本語 · 한국어 · Español · Português · Русский · العربية · Türkçe · Tiếng Việt · Bahasa Melayu |
标签:通知系统