moorcheh-ai/memanto
GitHub: moorcheh-ai/memanto
Memanto 是一款开源的 AI Agent 持久化记忆工具,让 Claude Code、Cursor 等编程助手能够跨会话保持上下文,无需向量数据库即可实现高效记忆存储与检索。
Stars: 1010 | Forks: 319
你的 agent 总是忘记一切。Memanto 解决这个问题。
为 Claude Code、Cursor、Codex 及其他 14 个 agent 提供持久化记忆。100% 免费,开源,完全在你的本地机器上运行——无需 API 密钥,无需 vector database,无需费心维护 backend。
AI Agent 都喜爱的记忆!

## 什么是 MEMANTO?
**MEMANTO 是一个记忆 agent。它会记忆、召回并回答——从而让你的 agent 能够实现长期目标并避免混乱。**
如今的大多数记忆工具都是被动的基础设施:agent 必须去查询它们,解析结果,然后自己决定下一步该做什么。MEMANTO 的构建方式与众不同。它是一个主动的记忆 agent,其设计灵感来源于询问 agent 关于自身记忆需求时所发现的缺口——包含三个操作(`remember`、`recall`、`answer`),让你的 agent 在跨会话时保持持久的上下文,同时具备最先进的检索能力和零摄入延迟。
Memanto in action
Without Memanto
With Memanto Connected
## 2 分钟快速开始
适用于 macOS、Linux 和 Windows。
**选项 A —— 完全本地(无账号,无 API 密钥):**
```
pip install memanto
memanto # choose "On-Prem" — guides through Docker + Ollama setup
```
需要 Docker。一切都在你的机器上运行并保留。
**选项 B —— 免费云端(无需银行卡,约 60 秒):**
```
pip install memanto
memanto # choose "Cloud" — paste your free Moorcheh API key
```
从以下地址获取你的免费 API:https://console.moorcheh.ai/api-keys
你可以随时使用 `memanto config backend` 在本地和云端之间切换。
## 你将获得什么
- **不再需要在每次上下文重置后重新解释你的代码库。** Memanto 可跨会话持久化,你的 agent 可以从中断的地方继续。
- **减少因重复上下文而消耗的 token。** 仅在相关时才会检索记忆,从而让上下文窗口发挥更大作用。
- **记忆在存储后即刻可被搜索。** 零索引等待,写入时无需承担额外的 LLM 提取开销。
- **一次 `pip install` 即可。** 无需配置 vector DB,无需 schema,无需 rerankers,也无需费心维护 backend 服务。
- **零闲置成本。** 云端在空闲时会自动缩减至零。本地版本仅在使用时运行。
## 集成
兼容 Claude Code、Cursor、Codex、Windsurf、Cline、Continue、Goose、GitHub Copilot 等等。查看[完整列表 →](https://docs.memanto.ai/integrations/overview)
```
memanto connect
# integrates in one command
#eg: memanto connect claude-code
```
## 六大缺口
大多数记忆工具都是被动的基础设施——agent 必须去查询它们,解析结果,然后自己决定下一步该做什么。Memanto 是一个主动的记忆 agent,其设计正是基于模型自身指出的缺口:
| # | 缺口 | MEMANTO 如何应对 |
| --- | --- | --- |
| 1 | **静态注入** —— 记忆以数据块形式存在,无法按相关性查询 | 可查询,而非仅注入 |
| 2 | **无时间衰减** —— 6 个月前的偏好与昨天的截止日期权重相同 | 版本控制、近期信号、时间查询 |
| 3 | **无来源记录** —— 无法区分明确事实、推断模式或过时信息 | 每条记忆都附带置信度和来源 metadata |
| 4 | **扁平记忆** —— 情景、语义和程序性记忆全部折叠在同一层 | 分类且分层的 —— 包含 13 种内置记忆类别 |
| 5 | **无回写** —— 矛盾信息会默默共存 | 冲突检测,显式版本控制,拒绝静默覆盖 |
| 6 | **索引延迟** —— 强制性的 LLM 提取,图谱构建瓶颈 | 零开销摄入,写入时即刻可用 |
## 基准测试
- **LongMemEval 得分 89.8%,LoCoMo 得分 87.1%** —— 优于 Mem0、Zep 和 Letta。[公开数据集 →](https://huggingface.co/moorcheh)
- **三个原语,而非两个**:`remember`、`recall` 和 `answer` 基于记忆生成 LLM 扎实的回答,无需额外的 API 密钥。
- **单次查询检索。** 无需多阶段 pipeline,无需 graph schema,无需 rerankers。
- **类型化语义记忆。** 13 个类别 —— `instruction`、`fact`、`decision`、`goal`、`preference`、`relationship` 等等。
## 架构
Memanto 的检索能力由 [Moorcheh](https://moorcheh.ai) 驱动,这是一个信息论语义引擎。它可以作为本地 Docker 容器运行(免费,无需账号),或作为免费云服务运行(包含 10 万次免费操作),由 `memanto` CLI 为你统一管理。
### 本地部署
## 为什么选择 Moorcheh?
Moorcheh 是支撑 Memanto 检索的语义引擎。与依赖近似搜索并需要索引 pipeline 的 vector database 不同,Moorcheh 采用信息论方法,能够返回精确结果且零索引延迟——写入一条记忆,它立即可被搜索。
这意味着 Memanto 不需要单独的 vector DB、embedding pipeline 或 reranking 阶段。Moorcheh 引擎对于本地用户以本地 Docker 容器形式运行(无需账号),或作为带有免费额度的托管云服务运行。无论哪种方式,它都是隐形的——一切都由 `memanto` CLI 负责处理。
## 设置与演示
## CLI 参考
| 功能 | 命令 | 作用 |
|---|---|---|
| 系统状态仪表盘 | `memanto status` | 查看环境、配置、服务器健康状况、活动会话以及已注册的 agent。 |
| 本地 REST API + Web UI | `memanto serve`, `memanto ui` | 在本地运行 MEMANTO REST API 并打开交互式浏览器 UI。(对于 CLI 使用是可选的)。 |
| Agent 生命周期管理 | `memanto agent ...` | 创建/列出/删除 agent,激活/停用会话,并运行 `agent bootstrap` 获取智能快照。 |
| 大规模记忆捕获 | `memanto remember` | 存储带有 metadata 的单条记忆,或从 JSON 批量摄入最多 100 条记录。 |
| 单条记忆删除 | `memanto forget` | 确认后从活动 agent 中删除一条错误或过时的记忆,或使用 `--force` 跳过提示直接删除。 |
| 文件上传至记忆 | `memanto upload` | 直接将文档(.pdf, .docx, .xlsx, .json, .txt, .csv, .md)上传至 agent 的记忆 namespace——内容通过 `recall` 立即可被搜索。 |
| 高级检索模式 | `memanto recall` | 运行标准搜索以及带有过滤器的时间查询(`--as-of`, `--changed-since`)。 |
| 基于记忆的精准问答 | `memanto answer` | 利用检索到的记忆上下文生成 RAG 回答。 |
| 日常智能工作流 | `memanto daily-summary`, `memanto conflicts` | 生成摘要,检测矛盾,并以交互方式解决冲突。 |
| 会话与自动化控制 | `memanto session ...`, `memanto schedule ...` | 检查会话并启用计划的每日摘要运行。 |
| 记忆文件 pipeline | `memanto memory export`, `memanto memory sync` | 导出结构化记忆 Markdown 并将 `MEMORY.md` 同步到项目中。 |
| 配置检查 | `memanto config show` | 检查 API 密钥状态、活动 agent/会话、服务器设置以及计划时间。 |
| 多 agent 生态系统集成 | `memanto connect ...` | 连接/移除/列出针对 Claude Code、Codex、Cursor、Windsurf、Antigravity、Gemini CLI、Cline、Continue、OpenCode、Goose、Roo、GitHub Copilot 和 Augment 的集成(本地或全局)。 |
有关完整的命令参考,请查阅 [CLI 用户指南](https://docs.memanto.ai/cli)。
### 支持的记忆类型
`instruction`、`fact`、`decision`、`goal`、`commitment`、`preference`、`relationship`、`context`、`event`、`learning`、`observation`、`artifact`、`error`
使用记忆类型对你存储的内容进行分类,从而使检索更清晰、更可控:
- 使用特定类型保存:`memanto remember "User prefers concise answers" --type preference`
- 搜索时按类型过滤:`memanto recall "user communication style" --type preference`
## REST API
Memanto 暴露了基于会话的 REST API 以供编程访问。在本地启动服务器:
```
memanto serve
```
完整的 endpoint 参考可在 [docs.memanto.ai/api](https://docs.memanto.ai/api) 以及服务器运行时的 `http://localhost:8000/docs` 查看。
## 研究
[Memanto:面向长周期 Agent 的基于信息论检索的类型化语义记忆](https://huggingface.co/papers/2604.22085)
```
@misc{abtahi2026memantotypedsemanticmemory,
title={Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents},
author={Seyed Moein Abtahi and Rasa Rahnema and Hetkumar Patel and Neel Patel and Majid Fekri and Tara Khani},
year={2026},
eprint={2604.22085},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2604.22085},
}
```
## 支持
有问题或反馈?我们随时提供帮助:
- **文档**:[https://docs.memanto.ai](https://docs.memanto.ai)
- **Discord**:[加入我们的 Discord 服务器](https://discord.gg/CyxRFQSQ3p)
- **邮箱**:support@moorcheh.ai
- **X / Twitter**:[@moorcheh_ai](https://x.com/moorcheh_ai)
**MIT 许可证**标签:AI智能体, AI风险缓解, DLL 劫持, SOC Prime, 大语言模型, 开发工具, 持久化记忆, 文档结构分析, 本地部署, 请求拦截, 逆向工具