moorcheh-ai/memanto

GitHub: moorcheh-ai/memanto

Memanto 是一款开源的 AI Agent 持久化记忆工具，让 Claude Code、Cursor 等编程助手能够跨会话保持上下文，无需向量数据库即可实现高效记忆存储与检索。

Stars: 1010 | Forks: 319

你的 agent 总是忘记一切。Memanto 解决这个问题。

为 Claude Code、Cursor、Codex 及其他 14 个 agent 提供持久化记忆。100% 免费，开源，完全在你的本地机器上运行——无需 API 密钥，无需 vector database，无需费心维护 backend。

AI Agent 都喜爱的记忆！

## 什么是 MEMANTO？ **MEMANTO 是一个记忆 agent。它会记忆、召回并回答——从而让你的 agent 能够实现长期目标并避免混乱。** 如今的大多数记忆工具都是被动的基础设施：agent 必须去查询它们，解析结果，然后自己决定下一步该做什么。MEMANTO 的构建方式与众不同。它是一个主动的记忆 agent，其设计灵感来源于询问 agent 关于自身记忆需求时所发现的缺口——包含三个操作（`remember`、`recall`、`answer`），让你的 agent 在跨会话时保持持久的上下文，同时具备最先进的检索能力和零摄入延迟。

Memanto in action

Without Memanto

With Memanto Connected

## 2 分钟快速开始适用于 macOS、Linux 和 Windows。 **选项 A —— 完全本地（无账号，无 API 密钥）：** ``` pip install memanto memanto # choose "On-Prem" — guides through Docker + Ollama setup ``` 需要 Docker。一切都在你的机器上运行并保留。 **选项 B —— 免费云端（无需银行卡，约 60 秒）：** ``` pip install memanto memanto # choose "Cloud" — paste your free Moorcheh API key ``` 从以下地址获取你的免费 API：https://console.moorcheh.ai/api-keys 你可以随时使用 `memanto config backend` 在本地和云端之间切换。 ## 你将获得什么 - **不再需要在每次上下文重置后重新解释你的代码库。** Memanto 可跨会话持久化，你的 agent 可以从中断的地方继续。 - **减少因重复上下文而消耗的 token。** 仅在相关时才会检索记忆，从而让上下文窗口发挥更大作用。 - **记忆在存储后即刻可被搜索。** 零索引等待，写入时无需承担额外的 LLM 提取开销。 - **一次 `pip install` 即可。** 无需配置 vector DB，无需 schema，无需 rerankers，也无需费心维护 backend 服务。 - **零闲置成本。** 云端在空闲时会自动缩减至零。本地版本仅在使用时运行。 ## 集成兼容 Claude Code、Cursor、Codex、Windsurf、Cline、Continue、Goose、GitHub Copilot 等等。查看[完整列表 →](https://docs.memanto.ai/integrations/overview) ``` memanto connect # integrates in one command #eg: memanto connect claude-code ``` ## 六大缺口大多数记忆工具都是被动的基础设施——agent 必须去查询它们，解析结果，然后自己决定下一步该做什么。Memanto 是一个主动的记忆 agent，其设计正是基于模型自身指出的缺口： | # | 缺口 | MEMANTO 如何应对 | | --- | --- | --- | | 1 | **静态注入** —— 记忆以数据块形式存在，无法按相关性查询 | 可查询，而非仅注入 | | 2 | **无时间衰减** —— 6 个月前的偏好与昨天的截止日期权重相同 | 版本控制、近期信号、时间查询 | | 3 | **无来源记录** —— 无法区分明确事实、推断模式或过时信息 | 每条记忆都附带置信度和来源 metadata | | 4 | **扁平记忆** —— 情景、语义和程序性记忆全部折叠在同一层 | 分类且分层的 —— 包含 13 种内置记忆类别 | | 5 | **无回写** —— 矛盾信息会默默共存 | 冲突检测，显式版本控制，拒绝静默覆盖 | | 6 | **索引延迟** —— 强制性的 LLM 提取，图谱构建瓶颈 | 零开销摄入，写入时即刻可用 | ## 基准测试 - **LongMemEval 得分 89.8%，LoCoMo 得分 87.1%** —— 优于 Mem0、Zep 和 Letta。[公开数据集 →](https://huggingface.co/moorcheh) - **三个原语，而非两个**：`remember`、`recall` 和 `answer` 基于记忆生成 LLM 扎实的回答，无需额外的 API 密钥。 - **单次查询检索。** 无需多阶段 pipeline，无需 graph schema，无需 rerankers。 - **类型化语义记忆。** 13 个类别 —— `instruction`、`fact`、`decision`、`goal`、`preference`、`relationship` 等等。 ## 架构 Memanto 的检索能力由 [Moorcheh](https://moorcheh.ai) 驱动，这是一个信息论语义引擎。它可以作为本地 Docker 容器运行（免费，无需账号），或作为免费云服务运行（包含 10 万次免费操作），由 `memanto` CLI 为你统一管理。

MEMANTO architecture

### 本地部署

MEMANTO architecture

## 为什么选择 Moorcheh？ Moorcheh 是支撑 Memanto 检索的语义引擎。与依赖近似搜索并需要索引 pipeline 的 vector database 不同，Moorcheh 采用信息论方法，能够返回精确结果且零索引延迟——写入一条记忆，它立即可被搜索。这意味着 Memanto 不需要单独的 vector DB、embedding pipeline 或 reranking 阶段。Moorcheh 引擎对于本地用户以本地 Docker 容器形式运行（无需账号），或作为带有免费额度的托管云服务运行。无论哪种方式，它都是隐形的——一切都由 `memanto` CLI 负责处理。 ## 设置与演示

## CLI 参考 | 功能 | 命令 | 作用 | |---|---|---| | 系统状态仪表盘 | `memanto status` | 查看环境、配置、服务器健康状况、活动会话以及已注册的 agent。 | | 本地 REST API + Web UI | `memanto serve`, `memanto ui` | 在本地运行 MEMANTO REST API 并打开交互式浏览器 UI。（对于 CLI 使用是可选的）。 | | Agent 生命周期管理 | `memanto agent ...` | 创建/列出/删除 agent，激活/停用会话，并运行 `agent bootstrap` 获取智能快照。 | | 大规模记忆捕获 | `memanto remember` | 存储带有 metadata 的单条记忆，或从 JSON 批量摄入最多 100 条记录。 | | 单条记忆删除 | `memanto forget` | 确认后从活动 agent 中删除一条错误或过时的记忆，或使用 `--force` 跳过提示直接删除。 | | 文件上传至记忆 | `memanto upload` | 直接将文档（.pdf, .docx, .xlsx, .json, .txt, .csv, .md）上传至 agent 的记忆 namespace——内容通过 `recall` 立即可被搜索。 | | 高级检索模式 | `memanto recall` | 运行标准搜索以及带有过滤器的时间查询（`--as-of`, `--changed-since`）。 | | 基于记忆的精准问答 | `memanto answer` | 利用检索到的记忆上下文生成 RAG 回答。 | | 日常智能工作流 | `memanto daily-summary`, `memanto conflicts` | 生成摘要，检测矛盾，并以交互方式解决冲突。 | | 会话与自动化控制 | `memanto session ...`, `memanto schedule ...` | 检查会话并启用计划的每日摘要运行。 | | 记忆文件 pipeline | `memanto memory export`, `memanto memory sync` | 导出结构化记忆 Markdown 并将 `MEMORY.md` 同步到项目中。 | | 配置检查 | `memanto config show` | 检查 API 密钥状态、活动 agent/会话、服务器设置以及计划时间。 | | 多 agent 生态系统集成 | `memanto connect ...` | 连接/移除/列出针对 Claude Code、Codex、Cursor、Windsurf、Antigravity、Gemini CLI、Cline、Continue、OpenCode、Goose、Roo、GitHub Copilot 和 Augment 的集成（本地或全局）。 | 有关完整的命令参考，请查阅 [CLI 用户指南](https://docs.memanto.ai/cli)。 ### 支持的记忆类型 `instruction`、`fact`、`decision`、`goal`、`commitment`、`preference`、`relationship`、`context`、`event`、`learning`、`observation`、`artifact`、`error` 使用记忆类型对你存储的内容进行分类，从而使检索更清晰、更可控： - 使用特定类型保存：`memanto remember "User prefers concise answers" --type preference` - 搜索时按类型过滤：`memanto recall "user communication style" --type preference` ## REST API Memanto 暴露了基于会话的 REST API 以供编程访问。在本地启动服务器： ``` memanto serve ``` 完整的 endpoint 参考可在 [docs.memanto.ai/api](https://docs.memanto.ai/api) 以及服务器运行时的 `http://localhost:8000/docs` 查看。 ## 研究 [Memanto：面向长周期 Agent 的基于信息论检索的类型化语义记忆](https://huggingface.co/papers/2604.22085) ``` @misc{abtahi2026memantotypedsemanticmemory, title={Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents}, author={Seyed Moein Abtahi and Rasa Rahnema and Hetkumar Patel and Neel Patel and Majid Fekri and Tara Khani}, year={2026}, eprint={2604.22085}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2604.22085}, } ``` ## 支持有问题或反馈？我们随时提供帮助： - **文档**：[https://docs.memanto.ai](https://docs.memanto.ai) - **Discord**：[加入我们的 Discord 服务器](https://discord.gg/CyxRFQSQ3p) - **邮箱**：support@moorcheh.ai - **X / Twitter**：[@moorcheh_ai](https://x.com/moorcheh_ai) **MIT 许可证**

标签：AI智能体, AI风险缓解, DLL 劫持, SOC Prime, 大语言模型, 开发工具, 持久化记忆, 文档结构分析, 本地部署, 请求拦截, 逆向工具