英伟达: DeepSeek - R1模型的NIM微服务在build.nvidia.com提供预览每秒提供多达3,872 tokens

AI世纪 2025-01-31

2025-01-31

1 月 31 日消息，英伟达今日宣布，-R1 模型现已在上作为 NIM 微服务预览版提供。-R1 NIM 微服务可以在单个 HGX H200 系统上每秒提供多达 3,872 。

据介绍，开发人员可以测试和试验应用程序编程接口（API），该接口预计将很快作为可下载的 NIM 微服务提供，这是 AI 软件平台的一部分。

-R1 NIM 微服务通过支持行业标准 API 简化了部署。企业可以通过在其首选的加速计算基础设施上运行 NIM 微服务来最大限度地提高安全性和数据隐私。将 AI 与 NeMo软件结合使用，企业还将能够为专用 AI 代理创建自定义的 -R1 NIM 微服务。

注意到，为方便各种规模的企业部署 AI 服务，英伟达于 2024 年 3 月 3 月推出了 NIM（）云原生微服务。

NIM 是一套经过优化的云原生微服务，旨在缩短上市时间，并简化生成式 AI 模型在云、数据中心和 GPU 加速工作站的任何位置的部署。它使用行业标准 API，抽象化 AI 模型开发和生产包装的复杂性，从而扩展开发者池。

NVIDIA

英伟达: DeepSeek - R1模型的NIM微服务在build.nvidia.com提供预览 每秒提供多达3,872 tokens