在 AI Workbench 中使用 RAG 应用
安装并使用 AI Workbench,克隆并运行一个可复现的 RAG 应用
基本思路
本教程演示如何使用 NVIDIA AI Workbench 设置并运行一个智能检索增强生成 (RAG) 项目。您将使用 AI Workbench 克隆并运行一个预构建的智能 RAG 应用程序,该应用程序能够智能地路由查询、评估响应的相关性和合理性,并迭代执行评估和生成循环。该项目使用 Gradio Web 界面,并且可以与 NVIDIA 托管的 API 端点或自托管模型配合使用。
您将完成
您将拥有一个功能齐全的智能体 RAG 应用程序,该应用程序运行在 NVIDIA AI Workbench 中,并可通过 Web 界面提交查询并接收智能响应。该系统将演示高级 RAG 功能,包括查询路由、响应评估和迭代优化,让您亲身体验 AI Workbench 的开发环境和复杂的 RAG 架构。
前置知识
对检索增强生成(RAG)概念有基本的了解
了解 API 密钥及其生成方式
能够熟练使用 Web 应用程序和浏览器界面
对容器化开发环境的基本了解
先决条件
- 硬件要求:
NVIDIA Grace Blackwell GB10 超级芯片系统
软件要求:
NVIDIA AI Workbench 已安装或准备安装
免费 NVIDIA API 密钥:在此生成 NGC API Keys
免费 Tavily API 密钥:在此生成 Tavily
用于克隆代码库和访问 API 的互联网连接
用于访问 Gradio 界面的 Web 浏览器
验证命令
请确认您的 DGX Spark 系统上是否存在 NVIDIA AI Workbench 应用程序。
请确认您的 API 密钥有效且为最新密钥。
时间和风险
预计时间:30-45分钟(包括必要时的 AI Workbench 安装)
- 风险等级:低 - 使用预构建的容器和已建立的 API
回滚:只需从 AI Workbench 中删除克隆的项目即可移除所有组件。不会在 AI Workbench 环境之外进行任何系统更改。
- 最后更新时间:2025 年 10 月 28 日
少量文字编辑
第 1 步 – 安装 NVIDIA AI Workbench
在 DGX Spark 系统上安装 AI Workbench 并完成初始设置向导。
在您的 DGX Spark 上,打开 NVIDIA AI Workbench 应用,然后单击“开始”。安装”。
安装向导将提示进行身份验证。
等待自动安装完成(几分钟)。
安装完成后,点击“开始使用”。
注意:
如果您遇到 “An error occurred ... container tool failed to reach ready state. try again: docker is not running”,请重启 DGX Spark,然后重新打开 NVIDIA AI Workbench。
第 2 步 – 验证 API 密钥要求
接下来,请确保您已拥有所需的两个 API 密钥后再继续操作。请妥善保管这些密钥。
Tavily API 密钥: https://tavily.com/
NVIDIA API 密钥: https://build.nvidia.com/settings/api-keys (我们建议使用 hotmail.com 邮箱注册。)
请确保此密钥具备 Public API Endpoints 权限
请准备好这两个密钥,以备下一步使用。
第 3 步 - 克隆 Agentic RAG 项目
然后,您将从 GitHub 克隆预构建的 Agentic RAG 项目到您的 AI Workbench 环境中。
从 AI Workbench 登录页面,选择
本地
位置(如果尚未选择),然后点击右上角的“克隆项目”。
将此 Git 仓库 URL 粘贴到克隆对话框中:
https://github.com/NVIDIA/workbench-example-agentic-rag
点击“克隆”开始克隆和构建过程。
第 4 步 - 配置项目密钥
您可以配置 Agentic RAG 应用运行所需的 API 密钥。
项目构建过程中,请根据出现的黄色警告横幅配置 API 密钥:
输入 NVIDIA_API_KEY
点击黄色横幅中的“配置”按钮
输入 TAVILY_API_KEY
保存配置
请等待项目构建完成后再继续。
第 5 步 - 启动聊天应用程序
您现在可以启动基于 Web 的聊天界面,与 Agentic RAG 系统进行交互。
导航至 Environment > Project Container > Apps > Chat,然后启动 Web 应用程序。
浏览器窗口将自动打开并加载 Gradio 聊天界面。
第 6 步 - 测试基本功能
通过提交示例查询来验证 Agentic RAG 系统是否正常工作。
在聊天应用中,点击或输入示例查询,例如:
How do I add an integration in the CLI?
等待系统处理并做出响应。响应虽然较为笼统,但应体现出智能化的路由与评估的能力。
第 7 步 - 验证项目
通过测试核心功能来确认您的设置是否正常工作。
请确认以下组件功能正常:
Web 应用程序加载正常
示例查询返回响应
未出现 API 身份验证错误
推理过程在界面中的 “Monitor” 选项下可见。
第 8 步 - 完成可选的快速入门
您可以通过上传数据、检索上下文和测试自定义查询来评估高级功能。
子步骤 A:上传示例数据集 完成应用内的快速入门说明,上传示例数据集并测试改进的基于 RAG 的响应。
子步骤 B:测试自定义数据集(可选)上传自定义数据集,调整路由器提示词,并提交自定义查询以测试自定义功能。
第 9 步 - 清理和回滚
如有需要,您可以删除该项目。
警告:
这将永久删除项目及其所有相关数据。
要彻底删除该项目:
在 AI Workbench 中,点击项目旁边的三个点。
- 选择“删除项目”
出现提示时确认删除
注意:
所有更改均在 AI Workbench 内完成。未在 AI Workbench 环境之外进行任何系统级修改。
第 10 步 - 后续步骤
要彻底删除该项目:
修改项目代码中的组件提示
- 上传不同文档以测试路由和自定义功能
尝试不同的查询类型和复杂度级别
查看“监控”选项卡中的智能体推理日志,以了解决策过程。
考虑自定义 Gradio 用户界面或将代理 RAG 组件集成到您自己的项目中。
错误 | 原因 | 修复 |
|---|---|---|
Tavily API Error | 互联网连接或 DNS 问题 | 等待并重试查询 |
401 Unauthorized | API 密钥错误或格式错误 | 替换 Project Secrets 中的密钥并重新启动 |
403 Unauthorized | API 密钥缺少权限 | 生成具有访问权限的新密钥 |
Agentic loop timeout | 复杂查询超出时间限制 | 尝试更简单的查询或重试。 |
有关最新已知问题,请查看 DGX Spark 用户指南。