Vishal Mehta

Vishal 是 NVIDIA 的高级开发技术工程师,专注于 GPU 应用程序的性能优化。他在 GPU 计算领域工作了 10 多年。他热衷于向用户教授 CUDA 和 GPU 计算,并推动 CUDA 编程指南的内容。他的日常活动包括与领域科学家和行业专家合作,以改善他们在 GPU 上的工作负载。

Posts by Vishal Mehta

智能体/生成式 AI

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

在本文中,我们将深入探讨现代 AI 中至关重要的工作负载之一:Flash Attention,您将了解: 环境要求: 9 MIN READ
数据中心/云端

揭开万亿参数大型语言模型 AI 推理部署的神秘面纱

人工智能(AI)正在改变各行各业,解决精准药物发现、自动驾驶汽车开发等重大人类科学挑战, 4 MIN READ
数据中心/云端

深度了解 NVIDIA Grace Hopper 超级芯片架构

NVIDIA Grace Hopper 超级芯片架构 是 高性能计算 ( HPC )和 AI 工作负载的第一个真正的异构加速平台。 6 MIN READ
模拟/建模/设计

NVIDIA Hopper 深入研究架构

今天,在 2022 NVIDIA GTC 主题演讲中, NVIDIA 首席执行官 Jensen Huang 介绍了新的 NVIDIA… 12 MIN READ