microsoft/DiskANN
GitHub: microsoft/DiskANN
DiskANN 是一套专为海量数据设计的近似最近邻搜索算法库,通过图结构索引实现了可扩展、低延迟且支持实时更新与过滤的向量检索能力。
Stars: 1757 | Forks: 399
# DiskANN
[](https://github.com/microsoft/DiskANN/actions/workflows/push-test.yml)
[](https://pypi.org/project/diskannpy/)
[](https://pepy.tech/project/diskannpy)
[](https://opensource.org/licenses/MIT)
[](https://papers.nips.cc/paper/9527-rand-nsg-fast-accurate-billion-point-nearest-neighbor-search-on-a-single-node.pdf)
[](https://arxiv.org/abs/2105.09613)
[](https://harsha-simhadri.org/pubs/Filtered-DiskANN23.pdf)
DiskANN 是一套用于大规模向量搜索的可扩展、准确且具有成本效益的近似最近邻搜索算法,支持实时更新和简单过滤。
此代码基于 Microsoft 的 [DiskANN](https://aka.ms/AboutDiskANN) 构想。
主分支现在包含一个用 Rust 重构的项目。
本项目已采用 [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/)。
更多信息请参阅 [Code of Conduct FAQ](https://opensource.microsoft.com/codeofconduct/faq/) 或
有任何其他问题或评论,请联系 [opencode@microsoft.com](mailto:opencode@microsoft.com)。
请参阅 [guidelines](CONTRIBUTING.md) 了解如何为本项目做出贡献。
## 旧版 C++ 代码
较旧的 C++ 代码保留在 `cpp_main` 分支上,但不再进行积极开发或维护。
旧版 C++ 代码是从 [NSG](https://github.com/ZJULearning/nsg) 算法的代码中分叉出来的。
如果您在软件中使用了 C++ 版本,请引用以下内容:
```
@misc{diskann-github,
author = {Simhadri, Harsha Vardhan and Krishnaswamy, Ravishankar and Srinivasa, Gopal and Subramanya, Suhas Jayaram and Antonijevic, Andrija and Pryce, Dax and Kaczynski, David and Williams, Shane and Gollapudi, Siddarth and Sivashankar, Varun and Karia, Neel and Singh, Aditi and Jaiswal, Shikhar and Mahapatro, Neelam and Adams, Philip and Tower, Bryan and Patel, Yash}},
title = {{DiskANN: Graph-structured Indices for Scalable, Fast, Fresh and Filtered Approximate Nearest Neighbor Search}},
url = {https://github.com/Microsoft/DiskANN},
version = {0.6.1},
year = {2023}
}
```
标签:ANN, Apex, C++, DiskANN, NSG算法, Rust, 信息检索, 可视化界面, 向量搜索, 向量数据库, 图索引, 大规模检索, 实时更新, 搜索引擎, 数据擦除, 数据结构, 机器学习, 深度学习检索, 相似度搜索, 算法优化, 网络流量审计, 过滤搜索, 近似最近邻, 逆向工具, 通知系统, 高性能计算