1. [主题](https://developer.nvidia.cn/topics/)
2. [AI](https://developer.nvidia.cn/topics/ai/)
3. 
对话式 AI

# 对话式 AI

[对话式 AI](https://www.nvidia.cn/deep-learning-ai/solutions/conversational-ai/)利用机器学习开发基于语音的应用，允许人类使用语音与设备、机器和计算机进行自然交互。

滚动至资源：

[学习资料库](#library)

主要主题：

- 
语音转文本 (STT)  

- 
文本转语音 (TTS)
- 
自动语音
- 
识别 (ASR)

- 
检索增强
- 
生成技术 (RAG)
- 
大语言
- 
模型 (LLM)

[![ A workflow diagram showing how NVIDIA Conversational AI works](https://developer.download.nvidia.com/images/conversational-ai/conversational-ai-how-it-works.jpg &quot; A workflow diagram showing how NVIDIA Conversational AI works&quot;)](https://developer.download.nvidia.com/images/conversational-ai/conversational-ai-how-it-works.jpg)

单击放大

## 对话式 AI 的工作原理

当您向应用程序提出问题时，音频波形在在[自动语音识别 (ASR)](https://www.nvidia.cn/glossary/speech-to-text/) 阶段转换为文本。它将语音音频信号转换为文本，以供后续组件处理。然后解释这个问题使用[检索增强型生成技术](https://www.nvidia.cn/glossary/retrieval-augmented-generation/)增强的[大型语言模型](https://www.nvidia.cn/glossary/large-language-models/)生成响应。最后，文本将转换为语音信号，以便在语音会话期间为用户生成音频[文本转语音 (TTS)](https://www.nvidia.cn/glossary/text-to-speech/)也称为语音合成。

## 探索对话式 AI 工具和技术

### NVIDIA Riva  

[NVIDIA Riva](https://www.nvidia.cn/ai-data-science/products/riva/) 包括自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT)。

[Riva 入门](/riva)

### NVIDIA NeMo  

[NVIDIA NeMo](https://www.nvidia.cn/ai-data-science/products/nemo/) 包括用于开发和部署自定义生成式 AI 的工具，包括大语言模型 (LLM)、多模态、视觉和语音[翻译](https://docs.nvidia.com/nemo-framework/user-guide/latest/nemotoolkit/nlp/machine_translation/machine_translation.html) AI。

[NeMo 入门](https://docs.nvidia.com/nemo-framework/user-guide/latest/nemotoolkit/)

### NVIDIA NIM  

[NVIDIA NIM](https://www.nvidia.cn/ai/) 微服务是一套易于使用的微服务，旨在跨任何云或数据中心加速部署生成式 AI 模型。

[开始使用 NIM](/nim)

## 对话式 AI 学习资料库


