Benchmark
2025年 12月 15日
NVIDIA CUDA-X 加速 DuckDB 全新 Sirius GPU 引擎,刷新 ClickBench 性能纪录
NVIDIA 正在与威斯康星大学麦迪逊分校合作,通过开源 Sirius 引擎将 GPU 加速分析引入 DuckDB。 DuckDB 因其简洁、
3 MIN READ
2025年 12月 5日
NVIDIA Grace CPU 为现代数据中心提供高带宽和高效率
自2023年首次发布以来,NVIDIA Grace CPU 在数据中心领域实现了快速普及,为多种工作负载的性能与能效树立了新的标杆。
3 MIN READ
2025年 10月 24日
NVIDIA DGX Spark 的性能如何支持密集型 AI 任务
当今,要求严苛的 AI 开发者工作负载通常需要比台式电脑所能提供的内存更多,也往往需要访问笔记本电脑或 PC 所不具备的软件,
2 MIN READ
2025年 10月 24日
在 NVIDIA cuOpt 中使用 GPU 加速的屏障方法求解线性程序
NFL 如何在安排所有常规赛季比赛的同时,避免比赛场地与 Beyoncé 音乐会的时间发生冲突? 医生如何利用单个捐赠的肾脏启动一系列移植,
3 MIN READ
2025年 10月 16日
NVIDIA Blackwell 在 SemiAnalysis InferenceMAX v1 基准测试中取得领先表现
SemiAnalysis 近期推出了 InferenceMAX v1,这是一项全新的开源计划,旨在提供一套全面评估推理硬件性能的方法。
3 MIN READ
2025年 10月 6日
GPU 原生 Velox 和 NVIDIA cuDF 加速大规模数据分析
随着工作负载规模的扩大以及对高效数据处理需求的提升,相比基于 CPU 的系统,采用 GPU 加速的数据库和查询引擎在性价比方面展现出显著优势。
2 MIN READ
2025年 9月 10日
借助 NVIDIA Rivermax 和 NEIO FastSocket,更大限度地提高金融服务的低延迟网络性能
超低延迟与可靠的数据包传输是金融服务、云游戏以及媒体和娱乐等现代应用的关键需求。在这些领域中,
2 MIN READ
2025年 9月 9日
NVIDIA Blackwell Ultra 首次亮相 MLPerf 完成推理新纪录
随着大语言模型(LLM)规模的不断扩大,其智能水平也显著提升,领先开发者推出的开放模型已具备数千亿参数。与此同时,
3 MIN READ
2025年 9月 2日
降低模型部署成本,同时通过 GPU 显存交换保持性能
大规模部署大语言模型(LLM)面临双重挑战:一方面需保障高需求时段的快速响应能力,另一方面又要有效控制 GPU 成本。组织通常面临两难选择:
2 MIN READ
2025年 8月 29日
使用量化感知训练微调 gpt-oss 提高准确性和性能
对于 AI 社界而言,主要的开源基础模型版本带来了独特的架构创新与功能突破,正掀起一股令人振奋的浪潮。作为 OpenAI 实验室自 GPT…
3 MIN READ
2025年 8月 5日
NVIDIA 从云到边缘加速 OpenAI gpt-oss 模型部署,在 NVIDIA GB200 NVL72 上实现 150 万 TPS 推理
自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。
1 MIN READ
2025年 7月 18日
使用 JAX 和 XLA 优化推理工作负载的低延迟通信
在生产环境中使用大语言模型 (LLM) 进行推理需要满足严格的延迟限制。此过程的关键阶段是 LLM 解码,
2 MIN READ
2025年 7月 7日
提出一个维基百科规模的问题:如何利用数百万 token 的实时推理使世界更加智能
现代 AI 应用越来越依赖于将庞大的参数数量与数百万个令牌的上下文窗口相结合的模型。无论是经过数月对话的 AI 智能体、
3 MIN READ
2025年 6月 12日
使用 NVIDIA TensorRT for RTX 运行高性能 AI 应用
NVIDIA TensorRT for RTX 现可作为 SDK 下载,该 SDK 可集成到 Windows 和 Linux 的 C++ 和…
2 MIN READ
2025年 6月 4日
NVIDIA Blackwell 在 MLPerf Training v5.0 中实现高达 2.6 倍的性能提升
创建先进的大语言模型 (LLM) 的过程始于预训练过程。预训练最先进的模型具有很高的计算要求,因为热门的开放权重模型具有数百亿到数千亿个参数,
3 MIN READ
2025年 6月 4日
重现 NVIDIA MLPerf v5.0 的 LLM 基准测试训练成绩
运行 NVIDIA 基准测试时,您的系统需要具备以下内容: 运行 NVIDIA MLPerf 训练基准测试需要:
4 MIN READ