yichuan-w/LEANN

GitHub: yichuan-w/LEANN

一个能在个人设备上高效运行、极度节省存储空间且保护隐私的向量数据库,用于对本地各类数据进行检索增强生成。

Stars: 11480 | Forks: 1023

LEANN Logo

yichuan-w/LEANN | Trendshift

Python Versions CI Status Platform MIT License MCP Integration Join Slack

Take Survey

We track zero telemetry. This survey is the ONLY way to tell us if you want
GPU Acceleration or More Integrations next.
👉 Click here to cast your vote (2 mins)

💬 加入我们的 Slack 社区!

我们非常欢迎你成为 LEANN 社区的一份子!
👉 加入 LEANN Slack
如果邀请链接已过期或你加入遇到问题,请提交一个 issue,我们会帮助你加入!

世界上最小的向量索引。用 LEANN 进行万物 RAG!

LEANN 是一个创新性的向量数据库,旨在普及个人人工智能。将你的笔记本电脑转变为强大的 RAG 系统,能够索引和检索数百万文档,同时比传统解决方案**减少 97% 的存储空间**,且**不损失准确性**。 LEANN 通过*基于图的选择性重计算*与*保留高度的剪枝*技术实现这一目标,它按需计算嵌入向量,而非全部存储。[示意图 →](#️-architecture--how-it-works) | [论文 →](https://arxiv.org/abs/2506.08276) **准备好进行万物 RAG 了吗?** 将你的笔记本电脑转变为个人 AI 助手,它可以语义搜索你的**[文件系统](#-personal-data-manager-process-any-documents-pdf-txt-md)**、**[电子邮件](#-your-personal-email-secretary-rag-on-apple-mail)**、**[浏览器历史](#-time-machine-for-the-web-rag-your-entire-browser-history)**、**[聊天记录](#-wechat-detective-unlock-your-golden-memories)**([微信](#-wechat-detective-unlock-your-golden-memories)、[iMessage](#-imessage-history-your-personal-conversation-archive))、**[智能体记忆](#-chatgpt-chat-history-your-personal-ai-conversation-archive)**([ChatGPT](#-chatgpt-chat-history-your-personal-ai-conversation-archive)、[Claude](#-claude-chat-history-your-personal-ai-conversation-archive))、**[实时数据](#mcp-integration-rag-on-live-data-from-any-platform)**([Slack](#slack-messages-search-your-team-conversations)、[Twitter](#-twitter-bookmarks-your-personal-tweet-library))、**[代码库](#-claude-code-integration-transform-your-development-workflow)**\* 或外部知识库(例如 6000 万份文档)——所有操作均在你的笔记本电脑上完成,零云成本,完全隐私。 \* Claude Code 仅支持基本的 `grep` 式关键词搜索。**LEANN** 是一个可无缝集成的**语义搜索 MCP 服务,完全兼容 Claude Code**,无需更改工作流程即可解锁智能检索。🔥 查看[简易设置 →](packages/leann-mcp/README.md) ## 为什么选择 LEANN?

LEANN vs Traditional Vector DB Storage Comparison

🔒 **隐私:** 你的数据永不离开你的笔记本电脑。没有 OpenAI,没有云服务,没有“服务条款”。 🪶 **轻量级:** 基于图的重计算消除了繁重的嵌入存储,而智能图剪枝和 CSR 格式最大限度地减少了图存储开销。始终更少存储,更少内存占用! 📦 **可移植:** 以最小的成本在不同设备之间(甚至与他人)传输你的整个知识库——你的个人 AI 记忆随你而行。 📈 **可扩展性:** 轻松处理那些会让传统向量数据库崩溃的杂乱个人数据,轻松管理你不断增长的个性化数据和智能体生成的记忆! ✨ **无精度损失:** 使用 97% 更少的存储,保持与重量级解决方案相同的搜索质量。 ## 安装 ### 📦 前置条件:安装 uv 如果你没有 [uv](https://docs.astral.sh/uv/getting-started/installation/#installation-methods),请先安装它。通常,你可以使用以下命令安装: ``` curl -LsSf https://astral.sh/uv/install.sh | sh ``` ### 🚀 快速安装 克隆仓库以访问所有示例并尝试精彩应用, ``` git clone https://github.com/yichuan-w/LEANN.git leann cd leann ``` 然后从 [PyPI](https://pypi.org/project/leann/) 安装 LEANN 以便立即运行它们: ``` uv venv source .venv/bin/activate uv pip install leann # 仅限CPU(Linux):使用`cpu`附加组件(例如`leann[cpu]`) ```