面向开发人员的生成式 AI

生成式 AI 将改变我们所知道的人机交互,允许基于各种输入和输出(包括文本、图像、声音、动画、3D 模型和其他类型的数据)创建新内容。

为了进一步生成 AI 工作负载,开发人员需要一个加速计算平台,从芯片架构和系统软件到加速库和应用程序开发框架进行全栈优化。

了解更多

NVIDIA 全栈生成式 AI 软件生态系统

NVIDIA 提供专为生成式 AI 工作负载而构建的全栈 加速计算平台 。该平台既深入又广泛,提供硬件、软件和服务的组合(全部由 NVIDIA 及其广泛的合作伙伴生态系统构建),以便开发人员能够提供尖端的解决方案。

Diagram showing NVIDIA Full-Stack Generative AI Software Ecosystem
开发人员可以选择直接通过 NVIDIA 产品或通过庞大的产品生态系统,在堆栈的任何层(从基础设施、软件、模型到应用程序)使用 NVIDIA AI 平台。

生成式 AI 系统和应用程序:为特定用例和领域构建有用且强大的应用程序可能需要将 LLM 连接到提示助手、强大的第三方应用程序、矢量数据库和构建护栏系统。这种范式被称为 检索增强生成(RAG) 。通过 NVIDIA NeMo™ Guardrails 等强大的 NVIDIA 产品和 LangChain、LlamaIndex 和 Milvus 等生态系统产品,可以轻松实现这一点。

生成式 AI 服务:通过可通过云轻松提供服务的托管 API 端点,可以轻松大规模访问和提供生成式 AI 基础模型。 OpenAI、Cohere、Google VertexAI、AzureML 等合作伙伴解决方案可以帮助开发人员开始使用生成式 AI API 端点。或者开始使用 NVIDIA AI Foundation 模型

生成 AI 模型:在大型数据集上训练的基础模型可供开发人员轻松开始使用所有模式。一些最流行的开源社区模型包括 Llama2 、Stable Diffusion 和 ESM2。立即体验 NVIDIA AI Foundation 模型和其他模型。


生成 AI 模型: 在大型数据集上训练的基础模型可供开发人员轻松开始使用所有模式。一些最流行的开源社区模型包括 Llama2 、Stable Diffusion 和 ESM2。立即体验 NVIDIA AI Foundation 和其他流行模型。

SDK 和框架: 使用开发人员工具包、SDK 和框架快速开始生成式 AI 开发,其中包括轻松高效地构建、定制和部署 LLM 的最新进展。一些流行的框架包括: NVIDIA NeMo Framework NVIDIA Triton 推理服务器™ 、HuggingFace Transformers 和 DeepSpeed。


SDK 和框架:使用开发人员工具包、SDK 和框架快速开始 LLM 开发,其中包括轻松高效地构建、定制和部署 LLM 的最新进展。一些流行的框架包括: NVIDIA NeMo Framework NVIDIA Triton 推理服务器 、DeepSpeed 和 HuggingFace Accelerate。

库:加速计算基础设施上的特定生成式 AI 计算需要专门为满足 LLM 需求而设计的库和编译器。一些最受欢迎的库包括:XLA、 Megatron-LM CUTLASS CUDA® TensorRT-LLM™ RAFT cuDNN


管理和编排:构建大型模型通常需要数千个 GPU,并且推理也是在多节点、多 GPU 配置上完成的,以解决内存有限的带宽问题。这需要能够在加速基础设施上仔细协调不同 LLM 工作负载的软件。一些管理和编排库包括:Kubernetes、Slurm、Nephele 和 NVIDIA Base Command™

加速基础设施:NVIDIA 加速计算平台提供基础设施,以成本优化的方式为这些应用程序提供支持,无论它们是在数据中心、云端还是在本地台式机和笔记本电脑上运行。强大的平台和技术包括: NVIDIA DGX™平台 NVIDIA HGX™系统 NVIDIA RTX™系统


免费虚拟活动

与 NVIDIA 一起参加 LLM 开发者日

与 NVIDIA 专家一起深入研究大型语言模型应用程序开发的前沿方法。

访问会话

好处

开发人员可以选择直接通过 NVIDIA 产品或通过庞大的产品生态系统,在堆栈的任何层(从基础设施、软件、模型到应用程序)使用 NVIDIA AI 平台。

Decorative image of a comprehensive, full-stack platform

综合的

具有端到端解决方案的全栈平台,专为生成式 AI 而构建。

Decorative image of product availability and choice

可用性和选择

从数据中心到边缘,开发人员在堆栈的所有层都拥有最广泛的产品选择,并得到最大社区的支持。

 Decorative image of state-of-the-art computing performance

最先进的性能

利用最强大的加速器和软件堆栈突破计算边界,并针对生成式 AI 工作负载进行优化。

Decorative image of development workflows

使用方便

使用一套尖端工具、软件和服务简化开发工作流程和管理开销。

Decorative image of a  production-grade software platform

生产级

NVIDIA AI Enterprise 是一个生产级软件平台,为运行任务关键型生成式 AI 工作负载提供支持、安全性、可靠性和可管理性。

通过浏览器尝试最先进的生成式 AI 模型

NVIDIA AI 基础模型和端点

使用 API 或 UI 从浏览器体验最新的生成式 AI 模型,无需进行任何设置,或者从具有 API 端点的企业应用程序体验最新的生成式 AI 模型。

了解更多

获取 NVIDIA 独家资源

A collage of images showing developers accessing AI models, SDKs, and other resources

访问 AI 模型、SDK 和开发人员资源

NVIDIA 开发者计划 提供对不同行业和用例的数百种软件和性能分析工具的访问。加入该计划即可访问生成式 AI 工具、AI 模型、培训、文档、操作指南、专家论坛等。

立即加入
A collage of images showing hands-on technical training and certification programs

获得技术培训

NVIDIA 提供 实践技术培训和认证计划 ,可以扩展您在生成式 AI 等领域的知识和实践技能。

培训 可供组织和个人使用。自定进度的课程和讲师指导的研讨会由 NVIDIA 专家开发和教授,涵盖先进的软件开发技术、领先的框架和 SDK 以及 GPU 开发。

查看培训
A group of developers are working with NVIDIA experts

与 NVIDIA 专家联系

在开始使用时有疑问吗?访问我们的 NVIDIA AI 开发者论坛, 解答您的问题或查看其他开发者的讨论。

访问论坛
NVIDIA Inception program for generative AI startups

加速您的创业

加入 NVIDIA Inception 计划 中的其他创新型生成式 AI 初创公司。 Inception 为初创公司提供最新的开发者资源、NVIDIA 软件和硬件的优惠定价以及接触风险投资界的机会。该计划是免费的,可供各个阶段的科技初创公司使用。

了解更多

最新研究与发展

查看新内容并了解我们的最新突破。

Retrieval-augmented generation enhances generative AI accuracy and reliability

提高生成式 AI 的准确性和可靠性

检索增强生成是一种利用从外部来源检索的信息以及 LLM 的强大功能来构建应用系统的方法。

阅读博客
NVIDIA NeMo Guardrails keeps AI chatbots on track

NeMo Guardrails 让 AI 聊天机器人保持在正轨上

开源软件可帮助开发人员为 AI 聊天机器人添加护栏,以使基于大型语言模型构建的应用程序符合其安全和安保要求。

阅读博客
ChipNeMo programing language chip designers use to tap generative AI

芯片设计人员利用 ChipNeMo 开发生成式 AI

NVIDIA Research 展示了高度专业化的领域如何利用内部数据对 LLM 进行培训,以构建可提高生产力的定制助理。

阅读博客
A virtual room created by NVIDIA Omniverse and other generative AI and LLM tools

构建基于 AI 的生成工具

将 NVIDIA Omniverse™ 与第三方生成式 AI 和 LLM 工具(例如 ChatGPT 或 NVIDIA 的经过微调的 ChatUSD 代理)连接,以加速 3D 工作流程、创建 Python- USD脚本,并帮助创作者和开发人员快速构建虚拟世界。

阅读博客
查看 NVIDIA ChatUSD
Eureka, an AI agent, uses LLMs to train robots for complex tasks

Eureka! NVIDIA 研究突破为机器人学习带来新气象

Eureka 弥合了高级推理(编码)和低级运动控制之间的差距。它是一个开放式代理,为超人类水平的机器人灵活性设计奖励函数。

阅读博客
NVIDIA SteerLM provides one custom LLM for multiple use cases

NVIDIA SteerLM:适用于多种用例的定制 LLM

SteerLM 是一种简单、实用且新颖的技术,只需一次训练即可调整 LLM。它提供更快的训练时间、更低的总拥有成本以及加速计算的优化。

开始使用 SteerLM

加入 NVIDIA 开发者计划,获取生成式 AI 工具和 AI 模型。

立即加入