ai-dynamo/dynamo

GitHub: ai-dynamo/dynamo

NVIDIA推出的数据中心级分布式LLM推理服务框架,解决大模型在多节点多GPU环境下的编排调度与吞吐优化问题。

Stars: 6188 | Forks: 890

标签:AI基础设施, Apache 2.0, C++, CUDA, DLL 劫持, LLM, Python, Rust, Unmanaged PE, 云计算, 低延迟, 分布式推理, 分布式系统, 可视化界面, 响应大小分析, 大语言模型, 子域名突变, 异构计算, 微服务架构, 推理优化, 推理引擎, 推理服务框架, 数据中心, 数据擦除, 无后门, 模型服务, 模型编排, 深度学习部署, 生成式AI, 索引, 网络流量审计, 规则引擎, 请求拦截, 负载均衡, 逆向工具, 通知系统, 通知系统, 高吞吐