DGX 控制面板
查看 DGX 系统并启动 JupyterLab
基本思路
DGX Dashboard 是一款运行于 DGX Spark 本地的 Web 应用程序,提供系统更新、资源查看和集成 JupyterLab 环境的图形界面。用户可以通过应用程序启动在本地访问 DGX Dashboard,也可以通过 NVIDIA Sync 或 SSH 隧道远程访问。远程工作时,DGX Dashboard 是更新系统软件包和固件的最便捷方式。
您将完成
您将学习如何在 DGX Spark 设备上访问和使用 DGX 控制面板。完成本教程后,您将能够启动预配置 Python 环境的 JupyterLab 实例、查看 GPU 性能、管理系统更新,并使用 stable diffusion 运行示例 AI 工作负载。您还将了解多种访问方法,包括桌面快捷方式、NVIDIA Sync 和手动 SSH 隧道。
前置知识
SSH 连接和端口转发的基本终端用法
了解 Python 环境和 Jupyter notebook
先决条件
硬件要求:
NVIDIA Grace Blackwell GB10 超级芯片系统
软件要求:
NVIDIA DGX OS
已安装 NVIDIA Sync(用于远程访问)或已配置 SSH 客户端
辅助文件
-
SDXL 的 Python 代码可以在 GitHub 上找到。
时间和风险
时长:完整演示(包括示例 AI 工作负载)需要 15-30 分钟。
风险等级:低 - Web 界面操作对系统影响极小
回滚:通过控制面板界面停止 JupyterLab 实例;正常使用期间不会对系统进行永久性更改。
- 最后更新时间:2025年 11 月 21 日
少量文字编辑
第 1 步 – 访问 DGX 控制面板
请选择以下方法之一访问 DGX 控制面板 Web 界面:
选项 A:桌面快捷方式(本地访问)
如果您可以本地访问 DGX Spark 设备:
登录到 DGX Spark 设备的 Ubuntu 桌面环境
点击屏幕左下角,打开Ubuntu应用程序启动器。
点击应用程序启动器中的 DGX 控制面板快捷方式
Dashboard将在您的默认浏览器中打开。http://localhost:11000
选项 B:NVIDIA Sync(推荐用于远程访问)
如果您的本地计算机上安装了 NVIDIA Sync:
点击系统托盘中的 NVIDIA Sync 图标
从设备列表中选择您的 DGX Spark 设备
点击“Connect”
点击“DGX Dashboard”启动控制面板
仪表盘将在您的默认浏览器中打开。http://localhost:11000 使用自动 SSH 隧道
没有 NVIDIA Sync?点击此处安装。
选项 C:手动SSH隧道
如果要在不使用 NVIDIA Sync 的情况下进行手动远程访问,则必须首先手动配置 SSH 隧道。
如果您想远程访问 JupyterLab,则必须为 Dashboard 服务器(端口 11000)和 JupyterLab 都打开一个隧道。每个用户帐户都会被分配一个不同的 JupyterLab 端口号。
请通过 SSH 连接到您的 DGX Spark 并运行以下命令,检查您分配的 JupyterLab 端口:
找到您的用户名并记下分配的端口号。
创建包含这两个端口的新 SSH 隧道:
cat /opt/nvidia/dgx-dashboard-service/jupyterlab_ports.yaml
ssh -L 11000:localhost:11000 -L <ASSIGNED_PORT>:localhost:<ASSIGNED_PORT> <USERNAME>@<SPARK_DEVICE_IP>
替换 <USERNAME> 为您的 DGX Spark 设备名,<SPARK_DEVICE_IP> 为设备的 IP 地址。
替换 <ASSIGNED_PORT> 为 YAML 文件的端口号。
打开您的网络浏览器并导航至 http://localhost:11000。
第 2 步 – 登录 DGX Dashboard
Dashboard在浏览器加载完毕后:
请在用户名栏中输入您的 DGX Spark 系统用户名。
请在密码字段中输入您的系统密码。
点击“Login”即可访问仪表盘界面
您应该会看到主仪表板,其中包含 JupyterLab 管理、系统监控和设置面板。
第 3 步 - 启动 JupyterLab 实例
创建并启动 JupyterLab 环境:
点击右侧面板中的“开始”按钮
监控其状态,使其依次经历以下过程:Starting → Preparing → Running
等待状态显示为“Running”(首次启动可能需要几分钟时间)
如果提示”Running”后 JupyterLab 没有自动在浏览器打开(可能是弹出窗口被阻止),您可以点击“Open In Browser”按钮。
启动时,会自动创建一个默认工作目录(/home//jupyterlab)并设置虚拟环境。您可以通过查看目录中的 requirements.txt 浏览已安装的软件包。
未来,如需更改工作目录并创建新的独立环境,您可以先点击“停止”按钮,然后将路径修改为新工作目录,再次点击“启动”按钮即可完成设置。
第 4 步 - 测试示例 AI 工作负载
运行一个简单的 Stable Diffusion XL 图像生成示例来验证您的设置:
在 JupyterLab 中,创建一个新的笔记本:File → New → Notebook
点击“Python 3 (ipykernel)”创建笔记本
添加一个新单元格,并粘贴以下代码:
import warnings
warnings.filterwarnings('ignore', message='.*cuda capability.*')
import tqdm.auto
tqdm.auto.tqdm = tqdm.std.tqdm
from diffusers import DiffusionPipeline
import torch
from PIL import Image
from datetime import datetime
from IPython.display import display
# --- Model setup ---
MODEL_ID = "stabilityai/stable-diffusion-xl-base-1.0"
dtype = torch.float16 if torch.cuda.is_available() else torch.float32
pipe = DiffusionPipeline.from_pretrained(
MODEL_ID,
torch_dtype=dtype,
variant="fp16" if dtype==torch.float16 else None,
)
pipe = pipe.to("cuda" if torch.cuda.is_available() else "cpu")
# --- Prompt setup ---
prompt = "a cozy modern reading nook with a big window, soft natural light, photorealistic"
negative_prompt = "low quality, blurry, distorted, text, watermark"
# --- Generation settings ---
height = 1024
width = 1024
steps = 30
guidance = 7.0
# --- Generate ---
result = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=steps,
guidance_scale=guidance,
height=height,
width=width,
)
# --- Save to file ---
image: Image.Image = result.images[0]
display(image)
image.save(f"sdxl_output.png")
print(f"Saved image as sdxl_output.png")第 5 步 - 监控 GPU 利用率
图像生成过程中:
切换回浏览器中的 DGX 控制面板选项卡。
在监控面板中查看 GPU 监测数据。
第 6 步 - 停止 JupyterLab 实例
课程结束后:
返回 DGX Dashboard主选项卡
单击 JupyterLab 面板中的“Stop”按钮。
确认状态已从“Running”更改为“Stopped”。
第 7 步 - 管理系统更新
如果有系统更新可用,将会通过横幅或在“设置”页面上显示。
在“Settings”页面的“Updates”选项卡下:
点击“Update”打开确认对话框
点击“Update Now”以开始更新过程
等待更新完成并重启设备。
重要提示:
系统更新将升级软件包、固件(如有),并触发重启。请在继续操作前保存您的工作。
第 8 步 - 清理和还原
若要清理资源并将系统恢复到初始状态:
通过 dashboard 停止所有正在运行的 JupyterLab 实例。
删除 JupyterLab 工作目录
重要提示:
如果您运行了系统更新,则只能通过系统备份或恢复介质恢复。
正常使用 dashboard 期间,系统不会发生任何永久性更改。
第 9 步 - 后续步骤
DGX Dashboard 配置完成后,您可以:
为不同的项目创建额外的 JupyterLab 环境
使用 dashboard 管理系统维护和更新
错误 | 原因 | 修复 |
|---|---|---|
用户无法运行更新 | 用户不在 sudo 组中 | 将用户添加到 sudo 组:sudo usermod -aG sudo 然后运行 newgrp docker |
JupyterLab 无法启动 | 当前虚拟环境存在问题 | 在 JupyterLab 面板中更改工作目录并启动一个新实例 |
SSH 隧道连接被拒绝 | IP 地址或端口错误 | 验证 Spark 设备 IP 地址并确保 SSH 服务正在运行 |
监控中未显示 GPU | 驱动程序问题 | 使用以下命令检查 GPU 状态nvidia-smi |
有关最新已知问题,请查看 DGX Spark 用户指南。