代理式 AI/生成式 AI
2025年 12月 8日
使用 NVFP4 KV 缓存优化大批次与长上下文推理
量化是大规模推理中的关键手段之一。通过降低权重、激活值和KV缓存的精度,可以有效减少内存占用和计算开销,从而显著提升推理吞吐量、降低延迟,
3 MIN READ
2025年 12月 5日
NVIDIA Kaggle 大师夺冠人工智能竞赛
NVIDIA 的研究人员在周五的 Kaggle 竞赛中拔得头筹,这一赛事被业界许多人视为对人类在人工智能(AGI)领域进展的一次实时检验。
1 MIN READ
2025年 12月 4日
借助功率配置文件优化 AI 和 HPC 工作负载的数据中心效率
不断呈指数级增长的计算需求正推动功耗持续上升,使数据中心面临巨大压力。在设施功耗受限的背景下,提升每瓦功耗的计算性能,
2 MIN READ
2025年 12月 3日
如何提升 3D 高斯模拟重建的质量
构建高度逼真的3D仿真环境面临巨大挑战。即便采用3D高斯点阵(3D Gaussian Splatting…
2 MIN READ
2025年 12月 2日
NVIDIA 加速的 Mistral 3 开源模型,实现多规模下的高效与精准
新的 Mistral 3 开放模型系列为开发者和企业提供了卓越的准确性、高效的性能以及灵活的定制功能。
3 MIN READ
2025年 12月 1日
使用 AI 模型蒸馏构建高效的金融数据工作流
量化金融领域的大语言模型(LLM)正被 increasingly 广泛应用于 Alpha 信号挖掘、自动化报告分析以及风险预测等场景。然而,
3 MIN READ
2025年 11月 24日
构建和运行安全的数据驱动型 AI 智能体
随着生成式 AI 的不断发展,企业组织对准确、可靠且基于自身特定业务数据的 AI 智能体的需求日益增长。
3 MIN READ
2025年 11月 19日
借助 BroRL 中的扩展功能突破强化学习训练限制
在使用可验证奖励的强化学习(RL)训练大语言模型(LLM)时,一个极具挑战性的问题是如何突破性能瓶颈。
2 MIN READ
2025年 11月 18日
使用 NVIDIA Nemotron RAG 和 Microsoft SQL Server 2025 在企业数据上构建可扩展的 AI
在 Microsoft Ignite 2025 大会上,随着 Microsoft SQL Server 2025 的发布,
2 MIN READ
2025年 11月 17日
融合 AI 与科研的癌症治疗领域开创性科学家
人工智能正在重塑科学研究与创新的方式。科学家可以借助AI生成、汇总、整合并分析科学数据。AI模型能够从人类科学家可能忽略的数据中识别出模式,
2 MIN READ
2025年 11月 12日
NVIDIA Blackwell 架构席卷 MLPerf Training v5.1 基准测试
NVIDIA Blackwell 架构在 MLPerf Training v5.1 的各项基准测试中均实现了更快的训练速度,
3 MIN READ
2025年 11月 10日
使用 NVIDIA Grove 简化 Kubernetes 上的复杂 AI 推理
NVIDIA Dynamo 的新组件实现分布式推理的高效扩展
2 MIN READ
2025年 11月 10日
在 Kubernetes 上启用 NVIDIA GB200 NVL72 及以上型号的多节点 NVLink
NVIDIA GB200 NVL72 将 AI 基础设施提升至全新高度,在大语言模型训练以及可扩展、低延迟推理工作负载的运行方面实现显著突破。
4 MIN READ
2025年 11月 10日
如何将数学问题的推理速度提升 4 倍
大语言模型能够解决具有挑战性的数学问题。然而,若要实现其大规模高效运行,仅依靠一个强大的模型检查点还远远不够。
3 MIN READ
2025年 11月 10日
生成式 AI 超分辨率利用可扩展的低计算模型加速天气预报
随着AI在天气和气候预测模型中的广泛应用,NVIDIA Earth-2平台提供了基于GPU优化的软件堆栈,以及用于加速解决方案的库和工具。
4 MIN READ