DGX 控制面板

查看 DGX 系统并启动 JupyterLab

基本思路

DGX Dashboard 是一款运行于 DGX Spark 本地的 Web 应用程序,提供系统更新、资源查看和集成 JupyterLab 环境的图形界面。用户可以通过应用程序启动在本地访问 DGX Dashboard,也可以通过 NVIDIA Sync 或 SSH 隧道远程访问。远程工作时,DGX Dashboard 是更新系统软件包和固件的最便捷方式。

您将完成

您将学习如何在 DGX Spark 设备上访问和使用 DGX 控制面板。完成本教程后,您将能够启动预配置 Python 环境的 JupyterLab 实例、查看 GPU 性能、管理系统更新,并使用 stable diffusion 运行示例 AI 工作负载。您还将了解多种访问方法,包括桌面快捷方式、NVIDIA Sync 和手动 SSH 隧道。

前置知识

  • SSH 连接和端口转发的基本终端用法

  • 了解 Python 环境和 Jupyter notebook

先决条件

硬件要求:

  • NVIDIA Grace Blackwell GB10 超级芯片系统

软件要求:

  • NVIDIA DGX OS

  • 已安装 NVIDIA Sync(用于远程访问)或已配置 SSH 客户端

辅助文件

  • SDXL 的 Python 代码可以在 GitHub 上找到。

时间和风险

  • 时长:完整演示(包括示例 AI 工作负载)需要 15-30 分钟。

  • 风险等级:低 - Web 界面操作对系统影响极小

  • 回滚:通过控制面板界面停止 JupyterLab 实例;正常使用期间不会对系统进行永久性更改。

  • 最后更新时间:2025年 11 月 21 日
    • 少量文字编辑

第 1 步 – 访问 DGX 控制面板

请选择以下方法之一访问 DGX 控制面板 Web 界面:

选项 A:桌面快捷方式(本地访问)

如果您可以本地访问 DGX Spark 设备:

  1. 登录到 DGX Spark 设备的 Ubuntu 桌面环境

  2. 点击屏幕左下角,打开Ubuntu应用程序启动器。

  3. 点击应用程序启动器中的 DGX 控制面板快捷方式

  4. Dashboard将在您的默认浏览器中打开。http://localhost:11000

选项 B:NVIDIA Sync(推荐用于远程访问)

如果您的本地计算机上安装了 NVIDIA Sync:

  1. 点击系统托盘中的 NVIDIA Sync 图标

  2. 从设备列表中选择您的 DGX Spark 设备

  3. 点击“Connect”

  4. 点击“DGX Dashboard”启动控制面板

  5. 仪表盘将在您的默认浏览器中打开。http://localhost:11000 使用自动 SSH 隧道

没有 NVIDIA Sync?点击此处安装

选项 C:手动SSH隧道

如果要在不使用 NVIDIA Sync 的情况下进行手动远程访问,则必须首先手动配置 SSH 隧道

如果您想远程访问 JupyterLab,则必须为 Dashboard 服务器(端口 11000)和 JupyterLab 都打开一个隧道。每个用户帐户都会被分配一个不同的 JupyterLab 端口号。

  1. 请通过 SSH 连接到您的 DGX Spark 并运行以下命令,检查您分配的 JupyterLab 端口:

  2. cat /opt/nvidia/dgx-dashboard-service/jupyterlab_ports.yaml
  3. 找到您的用户名并记下分配的端口号。

  4. 创建包含这两个端口的新 SSH 隧道:

ssh -L 11000:localhost:11000 -L <ASSIGNED_PORT>:localhost:<ASSIGNED_PORT> <USERNAME>@<SPARK_DEVICE_IP>

替换 <USERNAME> 为您的 DGX Spark 设备名,<SPARK_DEVICE_IP> 为设备的 IP 地址。

替换 <ASSIGNED_PORT> 为 YAML 文件的端口号。

打开您的网络浏览器并导航至 http://localhost:11000。

第 2 步 – 登录 DGX Dashboard

Dashboard在浏览器加载完毕后:

  1. 请在用户名栏中输入您的 DGX Spark 系统用户名。

  2. 请在密码字段中输入您的系统密码。

  3. 点击“Login”即可访问仪表盘界面

您应该会看到主仪表板,其中包含 JupyterLab 管理、系统监控和设置面板。

第 3 步 - 启动 JupyterLab 实例

创建并启动 JupyterLab 环境:

  1. 点击右侧面板中的“开始”按钮

  2. 监控其状态,使其依次经历以下过程:Starting → Preparing → Running

  3. 等待状态显示为“Running”(首次启动可能需要几分钟时间)

  4. 如果提示”Running”后 JupyterLab 没有自动在浏览器打开(可能是弹出窗口被阻止),您可以点击“Open In Browser”按钮。

启动时,会自动创建一个默认工作目录(/home//jupyterlab)并设置虚拟环境。您可以通过查看目录中的 requirements.txt 浏览已安装的软件包。

未来,如需更改工作目录并创建新的独立环境,您可以先点击“停止”按钮,然后将路径修改为新工作目录,再次点击“启动”按钮即可完成设置。

第 4 步 - 测试示例 AI 工作负载

运行一个简单的 Stable Diffusion XL 图像生成示例来验证您的设置:

  1. 在 JupyterLab 中,创建一个新的笔记本:File → New → Notebook

  2. 点击“Python 3 (ipykernel)”创建笔记本

  3. 添加一个新单元格,并粘贴以下代码:

import warnings
warnings.filterwarnings('ignore', message='.*cuda capability.*')
import tqdm.auto
tqdm.auto.tqdm = tqdm.std.tqdm

from diffusers import DiffusionPipeline
import torch
from PIL import Image
from datetime import datetime
from IPython.display import display

# --- Model setup ---
MODEL_ID = "stabilityai/stable-diffusion-xl-base-1.0"
dtype = torch.float16 if torch.cuda.is_available() else torch.float32

pipe = DiffusionPipeline.from_pretrained(
    MODEL_ID,
    torch_dtype=dtype,
    variant="fp16" if dtype==torch.float16 else None,
)
pipe = pipe.to("cuda" if torch.cuda.is_available() else "cpu")

# --- Prompt setup ---
prompt = "a cozy modern reading nook with a big window, soft natural light, photorealistic"
negative_prompt = "low quality, blurry, distorted, text, watermark"

# --- Generation settings ---
height = 1024
width = 1024
steps = 30
guidance = 7.0

# --- Generate ---
result = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    num_inference_steps=steps,
    guidance_scale=guidance,
    height=height,
    width=width,
)

# --- Save to file ---
image: Image.Image = result.images[0]
display(image)
image.save(f"sdxl_output.png")
print(f"Saved image as sdxl_output.png")

第 5 步 - 监控 GPU 利用率

图像生成过程中:

  1. 切换回浏览器中的 DGX 控制面板选项卡。

  2. 在监控面板中查看 GPU 监测数据。

第 6 步 - 停止 JupyterLab 实例

课程结束后:

  1. 返回 DGX Dashboard主选项卡

  2. 单击 JupyterLab 面板中的“Stop”按钮。

  3. 确认状态已从“Running”更改为“Stopped”。

第 7 步 - 管理系统更新

如果有系统更新可用,将会通过横幅或在“设置”页面上显示。

在“Settings”页面的“Updates”选项卡下:

  1. 点击“Update”打开确认对话框

  2. 点击“Update Now”以开始更新过程

  3. 等待更新完成并重启设备。

重要提示:

系统更新将升级软件包、固件(如有),并触发重启。请在继续操作前保存您的工作。

第 8 步 - 清理和还原

若要清理资源并将系统恢复到初始状态:

  1. 通过 dashboard 停止所有正在运行的 JupyterLab 实例。

  2. 删除 JupyterLab 工作目录

重要提示:

如果您运行了系统更新,则只能通过系统备份或恢复介质恢复。

正常使用 dashboard 期间,系统不会发生任何永久性更改。

第 9 步 - 后续步骤

DGX Dashboard 配置完成后,您可以:

  • 为不同的项目创建额外的 JupyterLab 环境

  • 使用 dashboard 管理系统维护和更新

错误
原因
修复
用户无法运行更新
用户不在 sudo 组中
将用户添加到 sudo 组:sudo usermod -aG sudo
然后运行 newgrp docker
JupyterLab 无法启动
当前虚拟环境存在问题
在 JupyterLab 面板中更改工作目录并启动一个新实例
SSH 隧道连接被拒绝
IP 地址或端口错误
验证 Spark 设备 IP 地址并确保 SSH 服务正在运行
监控中未显示 GPU
驱动程序问题
使用以下命令检查 GPU 状态nvidia-smi

有关最新已知问题,请查看 DGX Spark 用户指南


资源

DGX Spark 文档

DGX Spark 论坛