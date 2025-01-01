第 1 步 – 验证系统先决条件



请确认您的 NVIDIA Spark 系统满足要求并已配置 GPU 访问权限。



# Verify GPU access nvidia-smi # Verify ARM64 architecture uname -m # Check Docker GPU support docker run --gpus all --rm nvcr.io/nvidia/cuda:13.0.1-runtime-ubuntu24.04 nvidia-smi

如果您看到 permission denied 错误（例如尝试连接到 Docker 守护进程套接字时出现权限被拒绝的错误），请将您的用户添加到 docker 组，这样您就不需要使用 sudo 运行命令了。



sudo usermod -aG docker $USER newgrp docker

第 2 步 – 克隆 playbook 库



git clone https://github.com/NVIDIA/dgx-spark-playbooks

第 3 步 - 构建 Docker 镜像

重要提示： 该命令将下载基础镜像并在本地构建容器以支持此环境。



cd dgx-spark-playbooks/nvidia/jax/assets docker build -t jax-on-spark .

第 4 步 - 启动 Docker 容器



在 Docker 容器中运行 JAX 开发环境，并启用 GPU 支持和端口转发以访问 marimo。



docker run --gpus all --rm -it \ --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 \ -p 8080:8080 \ jax-on-spark

第 5 步 - 访问 marimo 界面



连接到 marimo notebook 以开始 JAX 教程。



# Access via web browser # Navigate to: http://localhost:8080

界面将加载目录显示和对 marimo 的简要介绍。



第 6 步 - 完成 JAX 入门教程



请学习入门材料，了解 JAX 编程模型与 NumPy 的差异。



前往并完成 JAX 入门 notebook ，内容包括：

JAX 编程模型基础知识



与 NumPy 的主要区别



绩效评估技术



第 7 步 - 实现 NumPy 基准版本



完成基于 NumPy 的自组织映射 (SOM) 实现，以建立性能基准。



完成NumPy SOM notebook 中的示例，以：



理解 SOM 训练算法



使用熟悉的 NumPy 操作实现该算法



记录性能指标以供对比



第 8 步 - 优化 JAX 实现



通过不断迭代改进 JAX 实现，以期获得性能提升。



完成 JAX SOM notebook各部分：



NumPy 实现的基本 JAX 移植



性能优化的 JAX 版本



GPU 加速的并行 JAX 实现



比较所有版本之间的性能



第 9 步 - 验证性能提升



这些 notebook 将向您展示如何检查每个 SOM 训练实现的性能；您会发现 JAX 实现比 NumPy 基准性能有所提高（有些甚至快得多）。



在随机颜色数据上直观检查 SOM 训练输出，以确认算法的正确性。



第 10 步 - 后续步骤



将 JAX 优化技术应用于您自己的 NumPy 机器学习代码。



# Example: Profile your existing NumPy code python -m cProfile your_numpy_script.py # Then adapt to JAX and compare performance

尝试将您最喜欢的 NumPy 算法适配到 JAX，并测量其在 Blackwell GPU 架构上的性能提升。

