NVIDIA NeMo 检索器

NVIDIA NeMo™ Retriever 是一组行业领先的 Nemotron RAG 模型，能够实现 50% 更高的准确率、15 倍更快的多模态 PDF 提取速度，以及 35 倍更高的存储效率，帮助企业构建检索增强生成（RAG）流程，从而提供实时业务洞察。NeMo Retriever 属于 NVIDIA NeMo 软件套件的一部分，该套件用于管理 AI 智能体的生命周期，确保数据隐私，并可无缝连接到任意位置的专有数据，助力构建安全的企业级检索系统。NeMo Retriever 是 NVIDIA AI-Q（用于构建智能 AI 智能体的蓝图）和 NVIDIA RAG 蓝图的核心组成部分，使企业能够访问其 AI 数据平台中的知识资源。它为可扩展、可投入生产的检索流程提供了可靠的基础，支持先进的 AI 应用。

NeMo Retriever 微服务为企业级 RAG 应用树立了全新行业标准，在三大视觉文档检索榜单（ViDoRe V1、ViDoRe V2、MTEB 和 MMTEB VisualDocumentRetrieval）中均位列领先位置。

访问代码
 论坛

文档

借助可扩展的数据提取以及高精度嵌入和重排序，构建出色的信息检索工作流和 AI 查询引擎。

摄取

快速提取海量数据，同时提取文本、图形、图表和表格，实现高度准确的检索。

嵌入

提升文本问答检索性能，为许多下游自然语言处理 (NLP) 任务提供高质量嵌入。

重排序

通过微调的重排序模型进一步增强检索性能，在查询大语言模型 (LLM) 时寻找最相关的段落以作为上下文提供。

NVIDIA NeMo 检索器的工作原理

NeMo Retriever 提供用于构建数据提取和信息检索工作流的组件。流程提取结构化和非结构化数据 (例如。文本、图表、表格) ，将其转换为文本，然后过滤掉重复内容。NeMo Retriever 嵌入 NIM 将数据块转换为嵌入，并将其存储在由 NVIDIA cuVS 加速的向量数据库中，以提高索引和搜索的性能和速度。

NeMo Retriever 解析这是一种基于 VLM 的 OCR 微服务，用于文本和表格提取，可保留语义结构，按读取顺序将文档图像转录为文本，对内容类型进行分类，并输出结构化标记以保留空间布局和格式。

提交查询时，系统使用向量相似性搜索检索相关信息，然后使用 NeMo Retriever 重排序 NIM 对结果进行重新排序，以确保准确性。借助最相关的信息，LLM NIM 会生成信息丰富、准确且与上下文相关的回复。您可以使用 NVIDIA API Catalog 中的各种 LLM NIM 微服务来启用其他功能，例如合成数据生成。

A diagram showing how NVIDIA NeMo Retriever works from data ingestion to information retrieval. — *NVIDIA NeMo Retriever NIM 微服务集合用于构建优化的提取和检索工作流，以大规模进行高度准确的信息检索。*

入门资源

详细了解如何使用 NeMo Retriever 构建高效的信息检索工作流。

入门博客

了解信息检索工作流中模型嵌入和重新排序的功能、首要注意事项等。

阅读博客

入门网络会议

提高生产就绪型生成式 AI 工作流的文本检索的准确性和可扩展性，并进行大规模部署。

立即观看

适用于 RAG 的 AI Blueprint

了解使用行业领先的嵌入和重排序模型将 AI 应用连接到企业数据的最佳实践。

试用
蓝图

GTC 上相关入门会议

了解用于创建用于多模态数据提取、提取和检索的代理式和 RAG 工作流的新模型、工具和技术。

观看会议

出色的信息检索性能

NeMo Retriever 微服务可加速多模态文档提取和实时检索，同时降低 RAG 成本并提高准确性。它们支持可靠的多语种跨语言检索，并优化数据平台的存储、性能和适应性，从而实现高效的向量数据库扩展。

错误答案减少 50%

NeMo Retriever 多模态提取召回率 = 5 准确率

A graph showing NeMo Retriever has achieved 2X throughput for fast info retrieval

基于公开可用的 PDF 数据集 (包括文本、图表、表格和信息图) 进行评估。开启 NeMo 检索器提取：nemoretriever-page-elements-v2、nemoretriever-table-structure-v1、nemoretriever-graphic-elements - v1、paddle-ocr
与关闭 NeMo Retriever 的比较：开源替代方案：HW - 1xH100

嵌入吞吐量提高 3 倍

NeMo Retriever Llama 3.2 多语种文本嵌入

A graph showing NeMo Retriever has achieved high accuracy with 30% fewer incorrect answers

此测试的执行要求如下：1xH100 SXM；通道令牌长度：512，批量大小：64，并发客户端请求：5；OSS 替代：与 NeMo Retriever lama-3.2-nv-embedqa-1b-v2 相比的 FP16，NIM：FP8

多模态数据提取吞吐量提高 15 倍

NeMo Retriever Extraction NIM 微服务

A graph showing NeMo Retriever embedding model is a leader on the Massive Text Embedding Benchmark (MTEB) leaderboard

每秒页面数，使用公开可用的 PDF 数据集 (包括文本、图表和表格) 进行评估，并使用 NeMo Retriever 提取 NIM 微服务：与开源替代方案相比，nv-yolox-structured-image-v1、nemoretriever-page-elements-v1、nemoretriever-graphic-elements - v1、nemoretriever-table-structure - v1、PaddleOCR、nv-llama3.2-embedqa-1b-v2；HW - 1xH100