数据中心/云端
2025年 12月 9日
五大 AI 模型优化技术,实现更快速、更智能的推理
随着 AI 模型规模不断扩大,架构日益复杂,研究人员和工程师正持续探索新技术,以优化 AI 系统在生产环境中的性能并降低总体成本。
2 MIN READ
2025年 12月 8日
使用 NVFP4 KV 缓存优化大批次与长上下文推理
量化是大规模推理中的关键手段之一。通过降低权重、激活值和KV缓存的精度,可以有效减少内存占用和计算开销,从而显著提升推理吞吐量、降低延迟,
3 MIN READ
2025年 12月 8日
使用 NVSentinel 自动监控 Kubernetes AI 集群健康状态
Kubernetes 支持生产环境中绝大多数 AI 工作负载。然而,维护 GPU 节点、保障应用稳定运行、持续推进训练任务,
2 MIN READ
2025年 12月 5日
NVIDIA Grace CPU 为现代数据中心提供高带宽和高效率
自2023年首次发布以来,NVIDIA Grace CPU 在数据中心领域实现了快速普及,为多种工作负载的性能与能效树立了新的标杆。
3 MIN READ
2025年 12月 4日
借助功率配置文件优化 AI 和 HPC 工作负载的数据中心效率
不断呈指数级增长的计算需求正推动功耗持续上升,使数据中心面临巨大压力。在设施功耗受限的背景下,提升每瓦功耗的计算性能,
2 MIN READ
2025年 12月 2日
量化投资组合优化助力实时财务决策提速
金融投资组合优化是一项艰巨但至关重要的任务,长期以来始终面临计算速度与模型复杂性之间的权衡难题。
6 MIN READ
2025年 12月 2日
AWS AI 基础设施将与 NVIDIA NVLink Fusion 集成,加速 Trainium4 部署
随着对 AI 需求的不断增长,超大规模数据中心企业正在寻找方法来加速部署专用 AI 基础设施以达到更高的性能。 亚马逊云科技(AWS)在…
2 MIN READ
2025年 12月 1日
使用 AI 模型蒸馏构建高效的金融数据工作流
量化金融领域的大语言模型(LLM)正被 increasingly 广泛应用于 Alpha 信号挖掘、自动化报告分析以及风险预测等场景。然而,
3 MIN READ
2025年 11月 25日
利用 NVIDIA 数据中心监控工具优化 GPU 集群性能
高性能计算(HPC)领域的客户持续快速扩展,生成式AI、大语言模型(LLM)、计算机视觉等应用推动了对GPU资源需求的显著增长。在此背景下,
2 MIN READ
2025年 11月 24日
构建和运行安全的数据驱动型 AI 智能体
随着生成式 AI 的不断发展,企业组织对准确、可靠且基于自身特定业务数据的 AI 智能体的需求日益增长。
3 MIN READ
2025年 11月 18日
使用 NVIDIA Nemotron RAG 和 Microsoft SQL Server 2025 在企业数据上构建可扩展的 AI
在 Microsoft Ignite 2025 大会上,随着 Microsoft SQL Server 2025 的发布,
2 MIN READ
2025年 11月 17日
NVIDIA NVQLink 架构加速计算与量子处理器融合
量子计算正步入一个加速计算与量子处理器深度融合推动技术进步的新阶段。控制和测量量子处理单元(QPU)的硬件面临严峻的计算挑战,
2 MIN READ
2025年 11月 12日
NVIDIA Blackwell 架构席卷 MLPerf Training v5.1 基准测试
NVIDIA Blackwell 架构在 MLPerf Training v5.1 的各项基准测试中均实现了更快的训练速度,
3 MIN READ
2025年 11月 10日
使用 NVIDIA Grove 简化 Kubernetes 上的复杂 AI 推理
NVIDIA Dynamo 的新组件实现分布式推理的高效扩展
2 MIN READ
2025年 11月 10日
在 Kubernetes 上启用 NVIDIA GB200 NVL72 及以上型号的多节点 NVLink
NVIDIA GB200 NVL72 将 AI 基础设施提升至全新高度,在大语言模型训练以及可扩展、低延迟推理工作负载的运行方面实现显著突破。
4 MIN READ
2025年 11月 10日
构建可扩展且容错的 NCCL 应用
NVIDIA 集合通信库(NCCL)提供了一套面向低延迟和高带宽通信的集合操作 API,支持 AI 工作负载从单台主机上的少量 GPU…
5 MIN READ