NVIDIA Alpamayo

NVIDIA Alpamayo 是一组先进的开放式视觉‑语言‑动作(VLA)模型族,可与开源的 AlpaSim 模拟器和 Physical AI 开放数据集协同工作。这个完整且开放的工具链旨在加速新一代智能车辆的开发,并通过类人推理,更安全、更高效地应对复杂的长尾驾驶场景。

探索 Alpamayo 1HuggingFace 上的 Alpamayo


面向开发者的 Alpamayo

NVIDIA Alpamayo 1 为构建具备“思考”能力的自动驾驶系统提供了强大的基础,将链式思维推理精确轨迹规划紧密衔接起来。 作为基于 NVIDIA Cosmos™ Reason 打造的开放式研究基础模型,您可以使用这一模型来:

  • 为驾驶构建可解释性:通过生成可读的推理轨迹,解释车辆在复杂“长尾”场景中为何做出特定决策,从而突破传统“黑盒”路径规划的局限。

  • 微调和蒸馏:利用 Alpamayo 模型的 100 亿参数作为教师模型,对其进行微调并蒸馏为更小的、可在运行时部署的模型。

  • 在高保真闭环中进行评估:将模型直接部署到 AlpaSim 框架Physical AI 开放数据集中,根据 minADEAlpaSim 评分等真实世界指标对实验性自动驾驶应用进行基准测试。

Alpamayo 工具

Alpamayo 1 现已在 GitHub 和 Hugging Face 上提供,用于训练和评估模型的数据子集可在开放式 NVIDIA 物理 AI 数据集中获取。NVIDIA 还发布了用于评估 Alpamayo 1 的开源 AlpaSim 框架。

详细了解用于自动驾驶的推理 VLA 模型

OSS (Github)

GitHub 上的代码

访问完整的 Python 代码库,包括推理脚本、交互式 Notebook 以及用于加载和运行 10B 参数模型的工具。

了解详情
Model

模型权重 (基于 Hugging Face)

访问安全传感器模型权重,该权重将包含 82 亿个参数的 Cosmos Reason 主干与包含 23 亿个参数的动作专家相结合。它专门针对 NVIDIA GPU 进行了优化 (需要至少 24 GB VRAM) 。

了解详情
Dataset

NVIDIA 物理 AI 开放数据集

从 25 个国家 地区的 7 个摄像头、激光雷达和多达 10 个雷达中查找 1727 小时的驾驶数据 ( 100 TB) ,实现 360 ° 同步覆盖。

了解详情
OSS (Github)

AlpaSim 仿真框架

探索基于 Python 的完整测试平台,在 AI 决策直接影响车辆动力学和未来传感器输入的被动环境中评估辅助驾驶解决策略。

了解详情
Video

视频:用于自动驾驶的 VLA 模型推理

此视频会议将探讨端到端 (E2E) 自动驾驶的新进展,这是行业向可扩展的 AI 驱动的 L4 级解决方案迈进的关键主题。

观看视频
Research

NVIDIA 智能汽车 Research Group

由 Marco Pavone 博士领导的 NVIDIA Research 智能汽车研究组的主页,包括更多支持研究论文。

了解详情

可在论文 Alpamayo‑R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail 中了解更多内容。

资源

硬件

了解 NVIDIA DRIVE® 硬件,包括从何处购买 NVIDIA DRIVE AGX Thor™ 开发者套件。

软件

下载 NVIDIA DriveOS™ SDK、参考操作系统和相关软件堆栈,包括 NVIDIA DriveWorks、CUDA®、cuDNN 和 TensorRT™。

培训

通过教程、网络会议、教学材料等扩展您的知识。

支持

在我们的开发者论坛中提出问题并获取答案。