NVIDIA 开源项目

参与开源社区可以加速创新,使开发人员更轻松地协作和构建。 NVIDIA 为重要的开源项目做出了贡献,包括 Docker、JAX、Kubernetes、Linux 内核、PyTorch、TensorFlow 和通用场景描述 (USD),并领导了多个领域的创新开源项目。 NVIDIA 还积极为全球开放标准机构做出贡献并与之合作。

探索下面的创新开源项目,了解有关加速应用程序的更多信息。

全部

Apache

Apache Spark

GPU 加速的 Apache Spark,用于数据分析、机器学习和深度学习管道

NVIDIA

Apex

PyTorch 扩展:在 PyTorch 中轻松实现混合精度和分布式训练的工具

NVIDIA

AmgX

GPU 上的分布式多网格线性求解器库

NVIDIA

Clara Holoscan SDK

用于医疗设备的硬件和软件混合计算平台

NVIDIA

云原生技术栈

使用 Kubernetes 管理 GPU 工作负载的参考架构

NVIDIA

集合通信库(NCCL)

多 GPU 和多节点通信的优化原语

NVIDIA

容器工具包

允许用户构建和运行 GPU 加速容器。

NVIDIA

CUB

集合通信和实用程序库

NVIDIA

线性代数子例程的 CUDA 模板 (CUTLASS)

用于 CUDA 内核中高性能通用矩阵乘法 (GEMM) 计算的模板集合

NVIDIA

CuPy

用于使用 Python 和 CUDA 进行 GPU 加速计算的开源数组库

NVIDIA

数据加载库(DALI)

深度学习应用中的数据预处理

NVIDIA

深度学习推理加速器 (NVDLA)

用于深度学习推理的开源加速器

NVIDIA

Falcor

一个实时渲染框架

NVIDIA

FasterTransformer

适用于 GPT 和 BERT 模型的高度优化的基于 Transformer 的编码器和解码器组件

NVIDIA

联合学习主动运行时环境 (FLARE)

一个开源、可扩展的 SDK,允许研究人员和数据科学主页将现有的机器学习和深度学习工作流程调整为保护隐私的联合范例

Flang

Flang

针对低级虚拟机 (LLVM) 的 Fortran 编译器

NVIDIA

GPU Operator

自动执行在 Kubernetes 上公开 GPU 所需的软件的生命周期管理。

NVIDIA

K8s Device 插件

一个 NVIDIA 插件,可在 Kubernetes 中启用 GPU 支持

NVIDIA

Kaolin Library

基于 PyTorch 的库,具有用于 3D 深度学习研究的模块化优化功能

NVIDIA

libcu++

CUDA 支持的整个 CPU+GPU 系统的 C++ 标准库

NVIDIA

材料定义语言 (MDL)

物理精确的材料标准和 SDK

NVIDIA

Megatron-LM

正在进行大规模训练 Transformer 模型的研究

NVIDIA

Merlin

用于大规模构建高性能推荐系统的开源框架

NVIDIA

Milano

Milano 是一款用于在您选择的后端自动搜索模型超参数的工具

NVIDIA

Modulus

用于开发物理机器学习模型的神经网络框架

NVIDIA

MONAI

基于 PyTorch 的医疗影像深度学习框架

NVIDIA

Morpheus

开源框架使网络安全开发人员能够创建优化的人工智能管道来过滤、处理和分类大量实时数据

NVIDIA

NeMo

一个端到端、开放且可互操作的框架,用于在任何地方大规模构建、定制和部署生成式人工智能模型。

NVIDIA

NeMo Guardrails

用于轻松开发值得信赖、安全可靠的 LLM 会话系统的工具包。

NVIDIA

Network Operator

自动化软件的生命周期管理,以加速 Kubernetes 上的网络。

NVIDIA

nvcomp

高性能GPU数据压缩库

NVIDIA

ONNX-TensorRT

ONNX 的 TensorRT 后端

NVIDIA

开源 GPU 内核模块

适用于 Linux 的 CUDA GPU 内核模块的开源版本

NVIDIA

Open Seq2Seq

用于对各种序列到序列模型进行高效实验的工具包

NVIDIA

PhysX

先进、真实的物理模拟引擎

PyTorch

PyTorch

一个开源机器学习框架,可加速从研究原型设计到生产部署的过程。

RAPIDS

RAPIDS

一套开源软件库和 API,用于完全在 GPU 上执行数据科学管道。

NVIDIA 社区

rl_games

高性能强化学习库

NVIDIA

ROS GEMs

适用于机器人操作系统 (ROS) 的硬件加速包 - 深度神经网络 (DNN)、感知管道和深度学习软件

NVIDIA

Sionna

用于 6G 物理层研究的开源库

NVIDIA

Tacotron 2

PyTorch 通过根据梅尔频谱图预测调节 WaveNet 实现自然 TTS 合成

TensorFlow

TensorFlow

适合所有人的开源机器学习框架

NVIDIA

TensorFlow-TensorRT

将 TensorFlow 与 TensorRT 集成,只需几行代码即可将 TensorFlow 中的推理速度提高 6 倍

NVIDIA

Thrust

Thrust 是一个类似于 C++ STL 的并行算法库。

NVIDIA

Torch-TensorRT

与 TensorRT 集成到 PyTorch,只需一行代码即可在 PyTorch 中将推理速度提高 4 倍

Pixar

通用场景描述 (OpenUSD)

用于在 3D 世界中描述、组合、模拟和协作的开放且可扩展的生态系统。

NVIDIA

vid2vid

高分辨率逼真的视频到视频翻译

人工智能和深度学习

Apache Spark

Apache Spark

GPU 加速的 Apache Spark,用于数据分析、机器学习和深度学习管道

NVIDIA

Apex

PyTorch 扩展:在 PyTorch 中轻松实现混合精度和分布式训练的工具

NVIDIA

Clara Holoscan SDK

用于医疗设备的硬件和软件混合计算平台

NVIDIA

集合通信库(NCCL)

针对集体多 GPU 通信的优化原语

NVIDIA

数据加载库(DALI)

深度学习应用中的数据预处理

NVIDIA

深度学习示例

Tensor Cores 优化的代码示例

NVIDIA

深度学习推理加速器 (NVDLA)

用于深度学习推理的开源加速器

NVIDIA

联合学习主动运行时环境 (FLARE)

一个开源、可扩展的 SDK,允许研究人员和数据科学家将现有的机器学习和深度学习工作流程调整为保护隐私的联合范例

NVIDIA

Kaolin Library

基于 PyTorch 的库,具有用于 3D 深度学习研究的模块化优化功能

NVIDIA

Merlin

用于大规模构建高性能推荐系统的开源框架

NVIDIA

MONAI

基于 PyTorch 的医疗影像深度学习框架

NVIDIA

Morpheus

开源框架使网络安全开发人员能够创建优化的人工智能管道来过滤、处理和分类大量实时数据

NVIDIA

NeMo

一个端到端、开放且可互操作的框架,用于在任何地方大规模构建、定制和部署生成式人工智能模型。

NVIDIA

NeMo Guardrails

用于轻松开发值得信赖、安全可靠的 LLM 会话系统的工具包。

NVIDIA

ONNX-TensorRT

ONNX 的 TensorRT 后端

PyTorch

PyTorch

一个开源机器学习框架,可加速从研究原型设计到生产部署的过程。

Rapids

Rapids

一套开源软件库和 API,用于完全在 GPU 上执行数据科学管道。

NVIDIA

ROS GEMs

适用于机器人操作系统 (ROS) 的硬件加速包 - 深度神经网络 (DNN)、感知管道和深度学习软件

TensorFlow

TensorFlow

适合所有人的开源机器学习框架

NVIDIA

TensorFlow-TensorRT

将 TensorFlow 与 TensorRT 集成,只需几行代码即可将 TensorFlow 中的推理速度提高 6 倍

NVIDIA

Torch-TensorRT

与 TensorRT 集成到 PyTorch,只需一行代码即可在 PyTorch 中将推理速度提高 4 倍

边缘人工智能和机器人

NVIDIA

PhysX

先进、真实的物理模拟引擎

NVIDIA 社区

rl_games

高性能强化学习库

云原生技术

NVIDIA

K8s 设备插件

一个 NVIDIA 插件,可在 Kubernetes 中启用 GPU 支持

NVIDIA

云原生技术栈

使用 Kubernetes 管理 GPU 工作负载的参考架构

NVIDIA

GPU Operator

自动执行在 Kubernetes 上公开 GPU 所需的软件的生命周期管理。

NVIDIA

Network Operator

自动化软件的生命周期管理,以加速 Kubernetes 上的网络。

NVIDIA

容器工具包

允许用户构建和运行 GPU 加速容器。

设计、可视化和仿真

NVIDIA

Falcor

一个实时渲染框架

NVIDIA

材料定义语言 (MDL)

物理精确的材料标准和 SDK

皮克斯

通用场景描述 (OpenUSD)

用于在 3D 世界中描述、组合、模拟和协作的开放且可扩展的生态系统。

高性能计算 (HPC)

NVIDIA

AmgX

GPU 上的分布式多网格线性求解器库

NVIDIA

CUB

集合通信和实用程序库

NVIDIA

线性代数子例程的 CUDA 模板 (CUTLASS)

用于 CUDA 内核中高性能通用矩阵乘法 (GEMM) 计算的模板集合

NVIDIA

CuPy

用于使用 Python 和 CUDA 进行 GPU 加速计算的开源数组库

Flang

Flang

针对低级虚拟机 (LLVM) 的 Fortran 编译器

NVIDIA

libcu++

CUDA 支持的整个 CPU+GPU 系统的 C++ 标准库

NVIDIA

Modulus

用于开发物理机器学习模型的神经网络框架

NVIDIA

NVComp

高性能GPU数据压缩库

NVIDIA

开放 GPU 内核模块

适用于 Linux 的 CUDA GPU 内核模块的开源版本

NVIDIA

Thrust

Thrust 是一个类似于 C++ STL 的并行算法库。

研究

NVIDIA

FasterTransformer

适用于 GPT 和 BERT 模型的高度优化的基于 Transformer 的编码器和解码器组件

NVIDIA

Kaolin Library

基于 PyTorch 的库,具有用于 3D 深度学习研究的模块化优化功能

NVIDIA

Megatron-LM

正在进行大规模训练 Transformer 模型的研究

NVIDIA

Milano

Milano 是一款用于在您选择的后端自动搜索模型超参数的工具

NVIDIA

Open Seq2Seq

用于对各种序列到序列模型进行高效实验的工具包

NVIDIA

PhysX

先进、真实的物理模拟引擎

NVIDIA

Sionna

用于 6G 物理层研究的开源库

NVIDIA

Tacotron 2

PyTorch 通过根据梅尔频谱图预测调节 WaveNet 实现自然 TTS 合成

NVIDIA

vid2vid

高分辨率逼真的视频到视频翻译

许多 NVIDIA 研究项目的源代码均可免费用于研究目的。此外,请访问我们的SDK 术语表页面,获取更全面的 SDK 和库产品列表。