面向开发者的 NVIDIA Riva
NVIDIA® Riva 是一个 GPU 加速库,用于构建完全可定制的实时多语言语音和翻译流水线。结合 NVIDIA Nemotron™ 语音模型,Riva 提供自动语音识别(ASR)、文本转语音(TTS)和神经机器翻译(NMT),并可部署在各类云环境、数据中心、边缘或嵌入式设备中。随着语音逐渐成为 AI 智能体的主要交互方式,Riva 使组织能够集成以语音为核心、直观易用的 AI 智能体,从而实现多语言的自然理解与响应。
NVIDIA Riva 的工作原理
语音和翻译 AI 微服务可将口语转换为文本 (语音识别) ,将书面语言转换为口语 (语音合成) ,以及将口语或书面语言从一种语言转换为另一种语言 (翻译) 。预训练 AI 模型基于庞大的数据集进行训练,并可在自定义数据集上进行微调,从而加速特定领域模型的开发。这些微服务完全容器化,针对本地或云端的实时性能和离线高吞吐量进行了优化,并且可以快速扩展到数百和数千个并行流。
如何开始使用 NVIDIA Riva
使用合适的工具和技术全面构建和部署 可定制的多语种语音和翻译 AI 应用。
开发入门套件
NVIDIA Riva 学习资源库
更多资源
AI 伦理
NVIDIA 的平台和应用框架使开发者能够构建各种 AI 应用。在选择或创建要部署的模型时,始终考虑潜在的算法偏差。与模型的开发者合作,确保其满足相关行业和用例的要求;提供必要的说明和文档以了解错误率、置信区间和结果;并确保模型按预期的条件和方式使用。
及时了解 NVIDIA 近期发布的语音和翻译 AI 新闻。