数据科学

2026年 7月 9日

借助 NVIDIA NeMo 生成用于金融 AI 研究的合成数据

金融自然语言处理 (NLP) 的微调 LLM 受到有限且不平衡的数据的限制。现实世界的金融新闻过度代表收益和股票动态，而信用评级变化、

5 MIN READ

2026年 7月 8日

在 NVIDIA GB200 NVL72 上使用 GPU 加速的 Presto 运行低延迟分析工作负载

Presto 是一个开源分布式 SQL 引擎，可对超大型数据集快速运行交互式查询。在 NVIDIA GPU 上，

3 MIN READ

2026年 6月 30日

使用 NVIDIA GQE 设计 GPU 加速的查询引擎

GPU 加速的查询引擎通常会受到内存和 I/ O 带宽的限制。NVIDIA 硬件的进步 (包括高带宽显存 (HBM) 、

4 MIN READ

2026年 6月 23日

使用 NVIDIA BioNeMo Agent Toolkit 打造适用于生命科学发现的 AI 科学家

AI 科学家正在成为科学计算的新界面。这些智能体可以阅读论文、编写代码、生成假设、调用 API、检查文件并对结果进行迭代。

2 MIN READ

2026年 6月 16日

构建您自己的金融智能交易基础模型

现代金融网络上的每一次刷卡、转账和付款都会对人类行为模式进行编码。事务数据是企业掌握的最丰富的信号之一。然而，

3 MIN READ

2026年 6月 16日

如何优化基于 Transformer 的模型以进行低精度训练

Transformer 架构是许多现代大型语言和生成式 AI 模型的支柱。随着这些模型规模的扩大，

3 MIN READ

2026年 6月 15日

使用 NVIDIA BioNeMo Recipes 使用 LoRA 微调生物基础模型

基础模型正在重塑计算生物学。预训练在大量蛋白质或基因组序列的语料库上的模型，如 ESM2 （一种蛋白质语言模型）和 Evo 2 （一种…

4 MIN READ

2026年 6月 9日

借助 NVIDIA DGX Spark Enterprise 可管理性，大规模控制 AI 基础设施的生命周期

随着 AI 基础设施的扩展，企业对运营成熟度的期望与日俱增。组织期望这些系统具备可配置、可观察、安全且可大规模管理的特点，

1 MIN READ

2026年 6月 9日

模型量化：借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎

将量化检查点转换为 NVIDIA TensorRT 引擎可以弥合模型优化与生产部署之间的差距，从而实现更快的推理速度、

4 MIN READ

2026年 6月 9日

借助 AI 智能体和 NVIDIA FLARE Auto-FL 加速联邦学习研究

联邦学习 (FL) 研究通常从一个看似简单的问题开始：我们接下来应该尝试什么？在实验开始之前，新的聚合规则、FedProx 系数、

2 MIN READ

2026年 5月 26日

借助 NVIDIA CompileIQ 自动调整功能提升内核性能

NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一：找到为特定工作负载解锁最佳性能的编译器选项。想象一下，

3 MIN READ

2026年 5月 26日

使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核

开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程，

6 MIN READ

2026年 5月 7日

模型量化：使用 NVIDIA Model Optimizer 进行后训练量化

模型量化是一种有效的方法，可减少显存占用并提升消费级设备（如 NVIDIA GeForce RTX GPU）上的推理性能。

2 MIN READ

2026年 5月 7日

借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试

分布式深度学习依赖于 NVIDIA 集合通信库（NCCL）实现快速可靠的 GPU 间通信。当训练速度变慢时，

3 MIN READ

2026年 4月 30日

使用 AI 智能体自动翻译 GPU 内核：将 cuTile Python 转换为 cuTile.jl

NVIDIA CUDA Tile（cuTile）是一种基于图块的编程模型，可让开发者以图块为单位进行操作（如加载、存储和矩阵乘积累加），

3 MIN READ

2026年 4月 28日

在 NVIDIA BioNeMo 中使用上下文并行性扩展生物分子建模

几十年来，计算生物学一直在简化主义妥协下运作。为了将复杂的生物系统整合到单个 GPU 的有限内存中，

2 MIN READ