检索增强生成 (RAG)

2026年 3月 5日

NVIDIA Blackwell 刷新金融领域大模型推理 STAC-AI 历史纪录

大语言模型（LLM）通过精密分析大量非结构化数据，生成切实可行的交易见解，正在重塑金融交易格局。这些先进的 AI 系统能够处理金融新闻、

3 MIN READ

2026年 2月 28日

使用 NVIDIA NeMo 构建电信自主网络推理模型

自主网络正迅速成为电信行业的重点任务之一。根据最新的 NVIDIA 电信行业 AI 现状报告，65% 的运营商表示 AI 正在推动网络自动化，

2 MIN READ

2026年 2月 17日

构建 AI 就绪型知识系统：掌握 5 种核心多模态 RAG 功能

企业数据本身具有高度复杂性：现实世界中的文档是多模态的，包含文本、表格、图表与图形、图像、扫描页面、表单以及嵌入式元数据。

3 MIN READ

2026年 2月 4日

如何使用 Nemotron 为 RAG 构建文档处理流程

如果您的 AI 智能体能够像读取文本文件一样轻松地即时解析复杂的 PDF、提取嵌套表格并“查看”图表中的数据，该怎么办？

3 MIN READ

2025年 9月 25日

如何将计算机视觉工作流与生成式 AI 和推理集成

生成式 AI 为分析现有视频流开辟了全新可能。视频分析正从统计物体演进为将原始视频片段转化为实时理解，从而提供更具价值的可行见解。

3 MIN READ

2025年 9月 23日

使用 NVIDIA Nemotron 构建检索增强生成 (RAG) 智能体

与基于 LLM 的传统系统受限于其训练数据不同，检索增强生成 (RAG) 通过整合相关的外部信息来提升文本生成效果。

5 MIN READ

2025年 9月 23日

如何使用 GPU 驱动的 Leiden 在 Python 中加速社区检测

社区检测算法通过识别网络中隐藏的关联实体组，在理解数据方面发挥着重要作用。社交网络分析、推荐系统、GraphRAG、

3 MIN READ

2025年 9月 10日

使用 NVIDIA NIM Operator 3.0.0 部署可扩展的 AI 推理

AI 模型、推理引擎后端以及分布式推理框架在架构、复杂性和规模上持续演进。面对快速的技术变革，

3 MIN READ

2025年 9月 3日

南北向网络：加速企业 AI 工作负载的关键

在 AI 基础架构中，数据为计算引擎提供关键燃料。随着代理式 AI 系统的持续演进，多个模型与服务相互协作，需要获取外部上下文并实时做出决策，

2 MIN READ

2025年 8月 5日

NVIDIA vGPU 19.0 支持 NVIDIA Blackwell GPU 的图形和 AI 虚拟化功能

虚拟化长期以来一直承诺提高效率和可扩展性。然而，由于图形和计算工作负载的需求不断增加，以及需要找到经济高效的解决方案来提高用户密度，

2 MIN READ

2025年 8月 4日

如何使用 NVIDIA Llama Nemotron 模型通过推理增强 RAG 工作流

检索增强生成 (RAG) 系统面临的一大挑战是处理缺乏明确清晰度或带有隐含意图的用户查询。用户通常会以不准确的方式来表达问题。例如，

4 MIN READ

2025年 7月 24日

借助 NVIDIA cuVS 优化索引和实时检索的向量搜索

AI 赋能的搜索需要高性能索引、低延迟检索和无缝可扩展性。NVIDIA cuVS 为开发者和数据科学家带来了 GPU…

2 MIN READ

2025年 7月 23日

在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理

将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ，

2 MIN READ

2025年 7月 23日

PDF 数据提取方法及其在信息检索中的应用

PDF 是共享财务报告、研究论文、技术文档和营销材料等信息的常用文件格式之一。然而，在构建有效的检索增强生成 (RAG) 系统时，

4 MIN READ

2025年 7月 21日

传统 RAG 与代理 RAG——AI 智能体如何通过动态知识实现更高智能

是否曾依赖不知道新高速公路旁路或道路突然关闭的旧 GPS？它可能会让您到达目的地，但不是最有效或最准确的方式。

1 MIN READ

2025年 6月 30日

出色的多模态 RAG：Llama 3.2 NeMo 检索器嵌入模型如何提高工作流准确性

数据远不止于文本，它本质上是多模态的，包括图像、视频、音频等，通常采用复杂的非结构化格式。虽然常见的方法是将 PDF、扫描图像、

2 MIN READ