alibaba/zvec

GitHub: alibaba/zvec

Zvec 是基于阿里 Proxima 引擎构建的轻量级进程内向量数据库,无需服务器即可实现毫秒级向量相似性搜索。

Stars: 8428 | Forks: 474

zvec logo

Code Coverage Main PyPI Release Python Versions License

alibaba%2Fzvec | Trendshift

🚀 快速开始 | 🏠 首页 | 📚 文档 | 📊 基准测试 | 🎮 Discord

**Zvec** 是一个开源的进程内向量数据库 —— 轻量级、极速,旨在直接嵌入到应用程序中。它基于 **Proxima**(阿里巴巴久经实战的向量搜索引擎)构建,以极简的设置提供生产级、低延迟、可扩展的相似性搜索。 ## 💫 功能特性 - **极速**: 在毫秒级内搜索数十亿个向量。 - **简单易用**: [安装](#-installation)并在几秒钟内开始搜索。无需服务器,无需配置,毫不费力。 - **稠密 + 稀疏向量**: 支持稠密和稀疏 embeddings,原生支持单次调用中的多向量查询。 - **混合搜索**: 结合语义相似性与结构化过滤器,获取精准结果。 - **随处运行**: 作为进程内库,Zvec 可以在代码运行的任何地方运行 —— 笔记本、服务器、CLI 工具,甚至边缘设备。 ## 📦 安装 ### [Python](https://pypi.org/project/zvec/) **系统要求**: Python 3.10 - 3.12 ``` pip install zvec ``` ### [Node.js](https://www.npmjs.com/package/@zvec/zvec) ``` npm install @zvec/zvec ``` ### ✅ 支持的平台 - Linux (x86_64, ARM64) - macOS (ARM64) ### 🛠️ 从源码构建 如果您希望从源码构建 Zvec,请查阅 [从源码构建](https://zvec.org/en/docs/build/) 指南。 ## ⚡ 一分钟示例 ``` import zvec # 定义 collection schema schema = zvec.CollectionSchema( name="example", vectors=zvec.VectorSchema("embedding", zvec.DataType.VECTOR_FP32, 4), ) # 创建 collection collection = zvec.create_and_open(path="./zvec_example", schema=schema) # 插入文档 collection.insert([ zvec.Doc(id="doc_1", vectors={"embedding": [0.1, 0.2, 0.3, 0.4]}), zvec.Doc(id="doc_2", vectors={"embedding": [0.2, 0.3, 0.4, 0.1]}), ]) # 按 vector 相似度搜索 results = collection.query( zvec.VectorQuery("embedding", vector=[0.4, 0.3, 0.3, 0.1]), topk=10 ) # 结果:{'id': str, 'score': float, ...} 列表,按相关性排序 print(results) ``` ## 📈 规模化性能 Zvec 提供卓越的速度和效率,非常适合要求苛刻的生产工作负载。 Zvec Performance Benchmarks 有关详细的基准测试方法、配置和完整结果,请参阅我们的 [基准测试文档](https://zvec.org/en/docs/benchmarks/)。 ## 🤝 加入社区
保持更新并获取支持 —— 扫描或点击:
| 💬 钉钉 | 📱 微信 | 🎮 Discord | |:---:|:---:|:---:| | | | [![Discord](https://img.shields.io/badge/Discord-Join%20Server-5865F2?style=for-the-badge&logo=discord&logoColor=white)](https://discord.gg/rKddFBBu9z) | | 扫码加入 | 扫码加入 | 点击加入 |
## ❤️ 贡献 我们欢迎并感谢社区的贡献!无论是修复 bug、添加功能还是改进文档,您的帮助都会让 Zvec 变得更好。 查看我们的 [贡献指南](./CONTRIBUTING.md) 开始参与吧!
标签:ANN, Apex, DLL 劫持, DNS解析, Embedding, LangChain, LLM, MITM代理, Proxima, RAG, Ruby, Unmanaged PE, 人工智能, 代码示例, 低延迟, 向量搜索, 向量数据库, 大语言模型, 嵌入式数据库, 开源项目, 推荐系统, 数据分析, 机器学习, 检索增强生成, 用户模式Hook绕过, 相似度搜索, 知识库, 语义检索, 轻量级, 近似最近邻, 进程内数据库, 逆向工具, 阿里开源, 非结构化数据