Deep dive
2025年 11月 19日
借助 BroRL 中的扩展功能突破强化学习训练限制
在使用可验证奖励的强化学习(RL)训练大语言模型(LLM)时,一个极具挑战性的问题是如何突破性能瓶颈。
2 MIN READ
2025年 11月 18日
使用 NVIDIA Nemotron RAG 和 Microsoft SQL Server 2025 在企业数据上构建可扩展的 AI
在 Microsoft Ignite 2025 大会上,随着 Microsoft SQL Server 2025 的发布,
2 MIN READ
2025年 11月 17日
融合 AI 与科研的癌症治疗领域开创性科学家
人工智能正在重塑科学研究与创新的方式。科学家可以借助AI生成、汇总、整合并分析科学数据。AI模型能够从人类科学家可能忽略的数据中识别出模式,
2 MIN READ
2025年 11月 13日
通过 Python API 利用 CuTe DSL 实现 CUTLASS C++ 级性能
CuTe,是 CUTLASS 3.x 的核心组件,它提供了统一的代数体系,用于描述数据布局和线程映射,
4 MIN READ
2025年 11月 10日
生成式 AI 超分辨率利用可扩展的低计算模型加速天气预报
随着AI在天气和气候预测模型中的广泛应用,NVIDIA Earth-2平台提供了基于GPU优化的软件堆栈,以及用于加速解决方案的库和工具。
4 MIN READ
2025年 11月 7日
构建交互式AI智能体,加速机器学习任务
在开始分析之前,数据科学家通常需要投入大量时间清理和准备大型非结构化数据集,这一过程对编程与统计专业知识要求较高。特征工程、
2 MIN READ
2025年 11月 6日
利用 NVIDIA cuVS 加速 Faiss 中的 GPU 向量搜索
随着企业收集的非结构化数据日益增多,并更加广泛地应用大语言模型(LLM),对更高效、更具可扩展性系统的需要也愈发迫切。
5 MIN READ
2025年 11月 3日
代码执行如何推动代理式 AI 系统中的主要风险
AI 驱动的应用正从被动工具演变为能够生成代码、做出决策并采取自主行动的代理式系统。这一转变带来了严峻的安全挑战。
2 MIN READ
2025年 10月 28日
利用 NVIDIA Nemotron Vision、RAG 和 Guardrail 新模型开发专用 AI 智能体
代理式 AI 是一个由专门的语言模型与视觉模型协同工作的生态系统,负责规划、推理、信息检索以及安全防护。
3 MIN READ
2025年 10月 28日
隆重推出用于 RNA 设计和分析的 CodonFM 开放模型
开放式研究对推动创新至关重要,AI 与科学领域的众多突破正是通过开放式协作实现的。在数字生物学研究领域,
3 MIN READ
2025年 10月 20日
在 NVL72 机架级系统上使用 Wide Expert Parallelism 扩展大型 MoE 模型
现代 AI 工作负载已远超单 GPU 推理服务的能力范围。模型并行技术通过在多个 GPU 之间高效划分计算任务,
3 MIN READ
2025年 10月 15日
面向代理式 AI 和 6G 时代的加速和分布式 UPF
电信行业正快速向AI原生无线接入网(AI-RAN)和以AI为核心的6G方向演进。分布式用户面功能(dUPF)通过去中心化的数据包处理与路由,
4 MIN READ
2025年 10月 14日
借助 QuTip 和 scQubits 中的 NVIDIA cuQuantum 集成加速量子位研究
NVIDIA cuQuantum 是一个软件开发工具包(SDK),可加速电路级(数字)和器件级(模拟)的量子模拟。
2 MIN READ
2025年 10月 9日
从助手到对手:利用代理式 AI 开发者工具
越来越多的开发者开始采用支持人工智能的编码工具,例如 Cursor、OpenAI Codex、Claude Code 和 GitHub…
3 MIN READ
2025年 10月 3日
NVIDIA NV-Tesseract 和 NVIDIA NIM 实现半导体制造智能异常检测
在之前的一篇博客文章中,我们介绍了 NVIDIA NV-Tesseract,这是一系列旨在统一框架内处理多种时间序列任务的模型,涵盖异常检测、
2 MIN READ
2025年 9月 30日
借助 NVIDIA NV-Tesseract-AD 推进行业应用的异常检测
在最近的一篇博客文章中,我们介绍了 NVIDIA NV-Tesseract,这是一系列旨在将异常检测、分类与预测统一到同一框架中的模型。
1 MIN READ