在 AI Workbench 中使用 RAG 应用

安装并使用 AI Workbench,克隆并运行一个可复现的 RAG 应用

基本思路

本教程演示如何使用 NVIDIA AI Workbench 设置并运行一个智能检索增强生成 (RAG) 项目。您将使用 AI Workbench 克隆并运行一个预构建的智能 RAG 应用程序,该应用程序能够智能地路由查询、评估响应的相关性和合理性,并迭代执行评估和生成循环。该项目使用 Gradio Web 界面,并且可以与 NVIDIA 托管的 API 端点或自托管模型配合使用。

您将完成

您将拥有一个功能齐全的智能体 RAG 应用程序,该应用程序运行在 NVIDIA AI Workbench 中,并可通过 Web 界面提交查询并接收智能响应。该系统将演示高级 RAG 功能,包括查询路由、响应评估和迭代优化,让您亲身体验 AI Workbench 的开发环境和复杂的 RAG 架构。

前置知识

  • 对检索增强生成(RAG)概念有基本的了解

  • 了解 API 密钥及其生成方式

  • 能够熟练使用 Web 应用程序和浏览器界面

  • 对容器化开发环境的基本了解

先决条件

  • 硬件要求:
    • NVIDIA Grace Blackwell GB10 超级芯片系统

  • 软件要求:

    • NVIDIA AI Workbench 已安装或准备安装

    • 免费 NVIDIA API 密钥:在此生成 NGC API Keys

    • 免费 Tavily API 密钥:在此生成 Tavily

    • 用于克隆代码库和访问 API 的互联网连接

    • 用于访问 Gradio 界面的 Web 浏览器

验证命令

  • 请确认您的 DGX Spark 系统上是否存在 NVIDIA AI Workbench 应用程序。

  • 请确认您的 API 密钥有效且为最新密钥。

时间和风险

  • 预计时间:30-45分钟(包括必要时的 AI Workbench 安装)

  • 风险等级:低 - 使用预构建的容器和已建立的 API
  • 回滚:只需从 AI Workbench 中删除克隆的项目即可移除所有组件。不会在 AI Workbench 环境之外进行任何系统更改。

  • 最后更新时间:2025 年 10 月 28 日
    • 少量文字编辑

第 1 步 – 安装 NVIDIA AI Workbench

在 DGX Spark 系统上安装 AI Workbench 并完成初始设置向导。

在您的 DGX Spark 上,打开 NVIDIA AI Workbench 应用,然后单击“开始”。安装”。

  1. 安装向导将提示进行身份验证。

  2. 等待自动安装完成(几分钟)。

  3. 安装完成后,点击“开始使用”。

注意:

如果您遇到 “An error occurred ... container tool failed to reach ready state. try again: docker is not running”,请重启 DGX Spark,然后重新打开 NVIDIA AI Workbench。

第 2 步 – 验证 API 密钥要求

接下来,请确保您已拥有所需的两个 API 密钥后再继续操作。请妥善保管这些密钥。

请准备好这两个密钥,以备下一步使用。

第 3 步 - 克隆 Agentic RAG 项目

然后,您将从 GitHub 克隆预构建的 Agentic RAG 项目到您的 AI Workbench 环境中。

从 AI Workbench 登录页面,选择 本地 位置(如果尚未选择),然后点击右上角的“克隆项目”。

将此 Git 仓库 URL 粘贴到克隆对话框中: https://github.com/NVIDIA/workbench-example-agentic-rag

点击“克隆”开始克隆和构建过程。

第 4 步 - 配置项目密钥

您可以配置 Agentic RAG 应用运行所需的 API 密钥。

项目构建过程中,请根据出现的黄色警告横幅配置 API 密钥:

  1. 输入 NVIDIA_API_KEY

  2. 点击黄色横幅中的“配置”按钮

  3. 输入 TAVILY_API_KEY

  4. 保存配置

请等待项目构建完成后再继续。

第 5 步 - 启动聊天应用程序

您现在可以启动基于 Web 的聊天界面,与 Agentic RAG 系统进行交互。

导航至 Environment > Project Container > Apps > Chat,然后启动 Web 应用程序。

浏览器窗口将自动打开并加载 Gradio 聊天界面。

第 6 步 - 测试基本功能

通过提交示例查询来验证 Agentic RAG 系统是否正常工作。

在聊天应用中,点击或输入示例查询,例如:
How do I add an integration in the CLI?

等待系统处理并做出响应。响应虽然较为笼统,但应体现出智能化的路由与评估的能力。

第 7 步 - 验证项目

通过测试核心功能来确认您的设置是否正常工作。

请确认以下组件功能正常:

  • Web 应用程序加载正常

  • 示例查询返回响应

  • 未出现 API 身份验证错误

  • 推理过程在界面中的 “Monitor” 选项下可见。

第 8 步 - 完成可选的快速入门

您可以通过上传数据、检索上下文和测试自定义查询来评估高级功能。

子步骤 A:上传示例数据集 完成应用内的快速入门说明,上传示例数据集并测试改进的基于 RAG 的响应。

子步骤 B:测试自定义数据集(可选)上传自定义数据集,调整路由器提示词,并提交自定义查询以测试自定义功能。

第 9 步 - 清理和回滚

如有需要,您可以删除该项目。

警告:

这将永久删除项目及其所有相关数据。

要彻底删除该项目:

  1. 在 AI Workbench 中,点击项目旁边的三个点。

  2. 选择“删除项目”
  3. 出现提示时确认删除

注意:

所有更改均在 AI Workbench 内完成。未在 AI Workbench 环境之外进行任何系统级修改。

第 10 步 - 后续步骤

要彻底删除该项目:

  • 修改项目代码中的组件提示

  • 上传不同文档以测试路由和自定义功能
  • 尝试不同的查询类型和复杂度级别

  • 查看“监控”选项卡中的智能体推理日志,以了解决策过程。

考虑自定义 Gradio 用户界面或将代理 RAG 组件集成到您自己的项目中。

错误
原因
修复
Tavily API Error
互联网连接或 DNS 问题
等待并重试查询
401 Unauthorized
API 密钥错误或格式错误
替换 Project Secrets 中的密钥并重新启动
403 Unauthorized
API 密钥缺少权限
生成具有访问权限的新密钥
Agentic loop timeout
复杂查询超出时间限制
尝试更简单的查询或重试。

有关最新已知问题,请查看 DGX Spark 用户指南


资源

DGX Spark 文档

DGX Spark 论坛