LLM
2025年 11月 19日
借助 BroRL 中的扩展功能突破强化学习训练限制
在使用可验证奖励的强化学习(RL)训练大语言模型(LLM)时,一个极具挑战性的问题是如何突破性能瓶颈。
2 MIN READ
2025年 11月 17日
融合 AI 与科研的癌症治疗领域开创性科学家
人工智能正在重塑科学研究与创新的方式。科学家可以借助AI生成、汇总、整合并分析科学数据。AI模型能够从人类科学家可能忽略的数据中识别出模式,
2 MIN READ
2025年 11月 13日
通过 Python API 利用 CuTe DSL 实现 CUTLASS C++ 级性能
CuTe,是 CUTLASS 3.x 的核心组件,它提供了统一的代数体系,用于描述数据布局和线程映射,
4 MIN READ
2025年 11月 10日
如何将数学问题的推理速度提升 4 倍
大语言模型能够解决具有挑战性的数学问题。然而,若要实现其大规模高效运行,仅依靠一个强大的模型检查点还远远不够。
3 MIN READ
2025年 11月 7日
使用 ComputeEval 2025.2 对 AI 生成的 CUDA 代码进行 LLM 基准测试
AI 编码助手能否编写高效的 CUDA 代码?为了更准确地衡量并提升其能力,我们构建了 ComputeEval,一个可靠且开源的基准测试工具,
1 MIN READ
2025年 11月 6日
在 PyTorch 中加速大规模混合专家训练
长期以来,训练大规模多专家(MoE)模型一直属于少数具备深厚基础设施和分布式系统专业知识的高级用户。对大多数开发者而言,
2 MIN READ
2025年 11月 6日
利用 NVIDIA cuVS 加速 Faiss 中的 GPU 向量搜索
随着企业收集的非结构化数据日益增多,并更加广泛地应用大语言模型(LLM),对更高效、更具可扩展性系统的需要也愈发迫切。
5 MIN READ
2025年 11月 3日
借助 NVIDIA AI Blueprint 深入解析视频分析
企业组织正日益寻求从视频、音频及其他复杂数据源中提取有价值见解的方法。检索增强生成(RAG)技术使生成式AI系统能够利用专有的企业数据,然而,
3 MIN READ
2025年 10月 30日
在 Microsoft Azure 上利用 NVIDIA Run:ai 简化 AI 基础设施
现代人工智能工作负载,无论是大规模训练还是实时推理,都需要动态访问高性能 GPU 资源。然而,
3 MIN READ
2025年 10月 28日
利用 NVIDIA Nemotron Vision、RAG 和 Guardrail 新模型开发专用 AI 智能体
代理式 AI 是一个由专门的语言模型与视觉模型协同工作的生态系统,负责规划、推理、信息检索以及安全防护。
3 MIN READ
2025年 10月 24日
NVIDIA DGX Spark 的性能如何支持密集型 AI 任务
当今,要求严苛的 AI 开发者工作负载通常需要比台式电脑所能提供的内存更多,也往往需要访问笔记本电脑或 PC 所不具备的软件,
2 MIN READ
2025年 10月 22日
使用 NVIDIA Nemotron 构建您自己的 Bash 计算机使用代理,只需一小时
如果您能够通过自然语言与计算机通信,让计算机在 Bash 终端中执行任务,而无需手动编写任何命令,该怎么办?
5 MIN READ
2025年 10月 20日
在 NVL72 机架级系统上使用 Wide Expert Parallelism 扩展大型 MoE 模型
现代 AI 工作负载已远超单 GPU 推理服务的能力范围。模型并行技术通过在多个 GPU 之间高效划分计算任务,
3 MIN READ
2025年 10月 20日
使用 NVIDIA Nemotron 构建 IT 工单分析 AI 智能体
现代企业组织在运营过程中通过工单系统、事件报告、服务请求和支持上报等途径产生大量数据。这些工单往往蕴含着系统性问题、
2 MIN READ
2025年 10月 15日
通过 NVIDIA Jetson AGX Thor 实现 7 倍生成式 AI 性能,解锁更快速、更智能的边缘模型
NVIDIA 软件生态系统的一大显著优势在于其持续优化的承诺。今年 8 月,NVIDIA 发布了 Jetson AGX Thor,
2 MIN READ
2025年 10月 13日
使用 NVIDIA Dynamo 部署 72B 模型提升 PD 分离性能
在生产环境部署大模型推理服务时,技术团队往往会遇到诸多挑战,例如缺乏成熟的 PD 分离方案、自动扩缩容机制不够灵活、缺乏动态路由,
2 MIN READ