数据中心/云端

借助 GPU 加速和生成式 AI 加速多组分析

NVIDIA Parabricks v4.3 在 NVIDIA GTC 2024 上发布,引入了新的工具和工作流程,为多种组学数据类型带来了加速和新的 AI 技术。除了分析 DNA 和 RNA,您现在还可以利用 GPU 和生成式 AI 的强大功能,以高速和高精度分析甲基化、单细胞和空间组学工作负载。

Parabricks v4.3 还进一步优化了生殖细胞工具,并支持最新的 GPU 架构,进一步缩短了分析时间。

新内容

  • 全新的单细胞和空间组学数据工作流程,整合了整个 NVIDIA 的软件 (包括成像、生成式 AI 和加速数据科学),可实现快速、高精度的分析。
  • BWA-Meth 的加速版本,作为 Parabricks 中的一种新工具,可加速对 DNA 甲基化数据的亚半酸双星测序比对。
  • 进一步优化种系分析,使用 NVIDIA H100 动态编程核心将种系分析缩短到 10 分钟以内,现已成为市场上最快的黄金标准工具 (BWA-MEM 和 GATK)
  • 支持最新的 NVIDIA 数据中心 GPU,包括 NVIDIA Grace Hopper
  • DeepVariant 到 v1.6 的升级版本,支持 NovaSeqX 数据

单细胞和空间组学

有一些技术使研究人员能够在细胞层面理解组学,例如单细胞测序,并通过空间分辨率方法将这些数据放入组织环境中。这些技术作为一种为细胞和组织基础的生物系统建模的方法越来越受欢迎。

这给行业带来了一些新挑战。

首先,单细胞和空间实验所产生的数据规模正在飞速发展。单细胞图谱项目已达到数百万个细胞的数量级,而新一代空间组学仪器所产生的数据量约为 PB 级的成像数据。

其次,对此的分析需要更多的自动化。基于图像的空间方法需要对细胞进行分割,并在多达数十万个细胞中量化表达值。分割是一项并非易事的任务,使用许多方法 (包括人类在环) 在面对新的数据集或细胞类型时指导算法。

最后,生成的数据为获得见解提供了全新的可能性,不仅提供了可用的表达数据,而且图像细胞的形态也为研究人员提供了潜在的有用信息。

空间组学提供商,如 Nanostring,使用 NVIDIA GPU 并在 CosMx SMI 设备上加速计算,以应对这些挑战。

“空间组学技术(CosMx 空间分子成像)现在可以对细胞和组织内的整个转录组进行成像,以前所未有的密度和规模(超过 150 TB/cm²)生成数据。这些数据将在转变我们对健康和疾病的理解方面发挥关键作用,从根本上加速药物研发和空间诊断,”NanoString 首席科学官兼研发高级副总裁 Joseph Beechem 博士说。

“事实上,探索这些图像的真实信息内容需要生成式 AI.我们很高兴继续在数据到信息流程的各个层面上深化与 NVIDIA 的合作。我们邀请所有 AI/ML 社区加入我们,共同参与这场生命科学空间生物学革命。”

为此, NVIDIA Parabricks 现在包含单单元和空间组学参考工作流程 (图 1),以加速计算瓶颈,提供更高水平的准确性,并启用新的分析方法。

An overview of the spatial omics reference workflow, utilizing Vista 2D, BioNeMo, and RAPIDS Single Cell for downstream tasks such as cell type annotation and perturbation prediction
图 1.单单元和空间组学参考工作流程

为了解决单单元和空间表达式输出分析中的瓶颈问题, NVIDIA 最近与柏林的 Charit é 合作,将 NVIDIA RAPIDS 引入 scverse 生态系统,生成了一个新的 RAPIDS-SingleCell 库。该库主要用于加速 Scanpy 的嵌入式替代,在某些情况下,单个 A100 GPU 可实现高达 850 倍的加速。

现在, NVIDIA 将生成式 AI 引入单细胞和空间组学分析,新的细胞成像基础模型能够实现高精度分割 (对于将表达正确归因于正确的细胞非常重要,会影响所有下游任务的准确性),并且能够生成表示细胞形态的嵌入。

我们 NVIDIA BioNeMo 框架 还发布了用于构建和训练单细胞 BERT 模型的功能,这些功能可以应用于单细胞表达数据的微扰预测等生成任务。

现在,所有这些内容都已整合到一个参考工作流程中,并被维护于在公共的  /clara-parabricks-workflows GitHub 库中。

Parabricks v4.3 工具和基准测试

除了在单细胞和空间领域的开发之外,我们还发布了 NVIDIA Parabricks 4.3 版,进一步推进了 Parabricks 的使命,即加速所有测序仪和组学的比对和变异识别。

此版本进一步突破了测序分析的瓶颈,优化了以下行业信赖的工具:

  • BWA-MEM
  • GATK BQSR
  • 标记重复项
  • 单倍型识别程序
  • DeepVariant

通过使用 NVIDIA H100 DPX 指令进行开发,此 Parabricks 版本缩短了端到端分析的运行时间,从而取得了突破性成果。

Oracle Cloud 的工程师已经在创纪录的时间内成功运行了这一工作流程。“我们很高兴 NVIDIA 从硬件和软件的角度持续加速基因组分析,”Oracle 全球 AI 云总监 Dan Spellman 说,“通过使用最新版本的 Parabricks 和 H100,由 Ruzhu Chen 领导的 OCI 的基因组学工程将处理时间缩短到 10 分钟以下。”

Parabricks germline acceleration benchmarks on A40, A100, and H100 with DeepVariant and FQ2BAM.
图 2、 Parabricks germline 工作流程的加速显示,H100 GPU 上的加速高达 108 倍 (左),端到端运行时间仅需 10 分钟 (右)

版本 4.3 中工具的进一步开发包括对 GPU 加速的 Minimap2 的运行时改进,用于对齐 PacBio 数据,以及名为 fq2bam_meth 的 BWA-Meth 的加速版本,用于进行甲基化数据比对。

DNA 甲基化是表观基因组的关键组成部分,在调节不同组织中的基因表达方面发挥着重要作用。对甲基化和表观基因组的研究表明,这些可能是疾病的致病因素,并且可以为心血管疾病测试或液体活检等应用提供关键标记,以便早期检测血液中的癌症。

BWA-Meth 是一种用于准确比对双亚述转换 DNA 读取的工具 (通过将所有非甲基化的细胞因子转化为来揭示甲基化的过程)。与仅使用 CPU (c5.12 xlarge,48 个 CPU 线程) 相比,在 Parabricks 中加速 BWA-Meth 可在 NVIDIA DGX A100 (8 个 NVIDIA A100 GPU) 上实现高达 36 倍的加速,运行在全基因组双亚述测序数据上。

Sequanta 是中国的一家多组学研究和临床服务提供商,其研究人员使用 Parabricks BWA-Meth 已实现比其他比对方法快 21 倍的加速。他们现在能够在 8 个 T4 GPU 上在短短 60 分钟内对甲基化样本进行比对,而其他方法需要 21 个小时。

Diagram shows support for 16 accelerated tools for DNA, RNA, and methylation sequencing.
图 3、 Parabricks v4.3 工具堆栈

了解详情

NVIDIA Parabricks v4.3 提供加速的多组学分析,解决了 DNA、RNA、甲基化、单细胞和空间组学数据方面的挑战。它为单细胞和空间组学提供了参考工作流程,加速了分析并实现了新方法。

通过优化和对行业信赖工具的支持,Parabricks 将运行时间缩短到 10 分钟以下,打破了测序分析的瓶颈。

从 NGC 下载 Parabricks v4.3 容器访问 GitHub 上的参考工作流 以加速多组分析,并获得对生物系统的更深入见解。开始使用 Parabricks 并发挥加速基因组分析的潜力。

 

标签