面向开发者的 NVIDIA Riva

NVIDIA® Riva 是一个 GPU 加速库,用于构建完全可定制的实时多语言语音和翻译流水线。结合 NVIDIA Nemotron™ 语音模型,Riva 提供自动语音识别(ASR)、文本转语音(TTS)和神经机器翻译(NMT),并可部署在各类云环境、数据中心、边缘或嵌入式设备中。随着语音逐渐成为 AI 智能体的主要交互方式,Riva 使组织能够集成以语音为核心、直观易用的 AI 智能体,从而实现多语言的自然理解与响应。

试用 API文档论坛


NVIDIA Riva 的工作原理

语音和翻译 AI 微服务可将口语转换为文本 (语音识别) ,将书面语言转换为口语 (语音合成) ,以及将口语或书面语言从一种语言转换为另一种语言 (翻译) 。预训练 AI 模型基于庞大的数据集进行训练,并可在自定义数据集上进行微调,从而加速特定领域模型的开发。这些微服务完全容器化,针对本地或云端的实时性能和离线高吞吐量进行了优化,并且可以快速扩展到数百和数千个并行流。

 A workflow diagram showing speech and translation AI microservices

快速入门指南

获取部署预训练模型以及如何与之交互的分步说明。

开始使用

入门博客

了解 Riva 的架构、主要功能和组件。

阅读博客

教程

了解如何构建一个语音驱动的 AI 智能体,该智能体将 NVIDIA Nemotron 流式 ASR 模型与多模态检索增强生成(RAG)、安全防护机制以及长上下文推理相结合。

阅读博客

视频演示

了解如何构建一个支持语音的 AI 智能体,该智能体集成了 NVIDIA Nemotron 超低延迟流式模型,用于实现实时自动语音识别。

观看视频

如何开始使用 NVIDIA Riva

使用合适的工具和技术全面构建和部署 可定制的多语种语音和翻译 AI 应用。

A decorative image of building AI application with NVIDIA NIM APIs

试用

通过基于 UI 的门户体验 Riva,借助 NVIDIA 管理的端点进行探索和原型设计,可通过 build.nvidia.com 免费获取。

立即试用
A decorative image of deploying with NVIDIA AI Enterprise

部署

获取使用现有基础架构试用 NVIDIA AI Enterprise 90 天的免费许可证。

申请 90 天许可证

开发入门套件

通过访问教程、notebook、论坛版本说明和内容全面文档,开始使用 Riva 开发您的语音和翻译 AI 应用。

自动语音识别

借助 NVIDIA 超级计算机上经过数千小时音频预训练的先进模型,实现阿拉伯语、英语、法语、德语、印地语、意大利语、日语、韩语、普通话、葡萄牙语、俄语和西班牙语的高转录准确性。

文本转语音

自定义英语、德语、意大利语、普通话和西班牙语 TTS 工作流,以获得您想要的语音和语调。

神经网络机器翻译

将高度准确的文本转文本、语音转文本或语音转语音翻译 (多达 32 种语言) 集成到您的对话式应用流程中。


NVIDIA Riva 学习资源库


更多资源

A decorative image representing Developer Community

探索社区

img-alt-text

获取培训和认证

A decorative image representing Inception for Startups

了解面向初创公司的计划


AI 伦理

    NVIDIA 的平台和应用框架使开发者能够构建各种 AI 应用。在选择或创建要部署的模型时,始终考虑潜在的算法偏差。与模型的开发者合作,确保其满足相关行业和用例的要求;提供必要的说明和文档以了解错误率、置信区间和结果;并确保模型按预期的条件和方式使用。

    及时了解 NVIDIA 近期发布的语音和翻译 AI 新闻。

    注册