对话式人工智能
2024年 11月 22日
Hymba 混合头架构提高小型语言模型性能
Transformer 及其基于注意力的架构,凭借强大的性能、并行化功能以及通过键值 (KV) 缓存进行的长期召回,已成为语言模型 (LM)…
5 MIN READ
2024年 11月 19日
使用 NVIDIA NIM 和 LangChain 创建自定义 Slackbot LLM 智能体
在现代商业的动态世界中,通信和高效的工作流对成功至关重要,人工智能(AI)解决方案已经成为竞争优势。
3 MIN READ
2024年 10月 28日
NVIDIA 中构建 RAG 基问答大语言模型工作流程
利用检索增强生成(RAG)技术快速开发解决方案,助力问答 LLM 工作流程,由此催生出新型系统架构。NVIDIA 将 AI 用于内部运营,
3 MIN READ
2024年 10月 23日
借助 NVIDIA NIM 智能体蓝图创建客户服务 AI 虚拟助理的三大核心组件
在当今快节奏的商业环境中,提供卓越的客户服务已不再是一种好事情,而是一种必要条件。无论是解决技术问题、解决计费问题,还是提供服务更新,
2 MIN READ
2024年 10月 22日
多代理 AI 和 GPU 驱动的声音转文本技术创新
自动音频字幕 (Automated Audio Captioning) 任务的核心是从音频输入中生成自然语言描述。鉴于输入 (音频) 和输出…
2 MIN READ
2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ
2024年 10月 21日
IBM 全新推出的 GRANITE 3.0 生成式 AI 模型:小体积、高准确度、高效率
今天,IBM 发布了第三代 IBM Granite,这是一个开放语言模型和辅助工具的集合。前几代 Granite 专注于特定领域的用例;
2 MIN READ
2024年 10月 16日
借助 NVIDIA 云原生堆栈实现 AI 应用开发简化
在快速发展的 AI 和数据科学领域,对可扩展、高效且灵活的基础设施的需求从未如此高。传统基础设施通常难以满足现代 AI 工作负载的需求,
1 MIN READ
2024年 10月 1日
使用 NVIDIA AI 端点和 Ragas 对医疗 RAG 的评估分析
在快速发展的医学领域,尖端技术的集成对于增强患者护理和推进研究至关重要。其中一项创新是 检索增强生成(RAG),
3 MIN READ
2024年 9月 25日
NVIDIA NIM 智能体蓝图助力 AI 应用打造数字人机交互界面
为客户提供高质量的服务仍然是各行各业企业的首要任务,从回答问题和解决问题到促进在线订单。随着企业在全球范围内扩展运营并扩展产品以竞争,
1 MIN READ
2024年 9月 25日
Llama 3.2 加速部署从边缘到云端实现提速
扩展开源 Meta Llama 模型集合,Llama 3.2 集合包括视觉语言模型(VLM)、小语言模型(SLM)和更新版的 Llama…
2 MIN READ
2024年 9月 24日
借助 NVIDIA NeMo 实现出色的 ASR 模型 10 倍加速
NVIDIA NeMo 持续开发了设定行业基准的 自动语音识别(ASR) 模型,尤其是在 Hugging Face Open ASR 排行榜…
4 MIN READ
2024年 9月 18日
使用 NVIDIA NIM 微服务实现语音和翻译功能,快速赋予应用语音能力
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自行托管的 GPU 加速推理微服务提供容器,用于跨云、
3 MIN READ
2024年 9月 17日
AI 智能体与 OODA 循环策略合力优化数据中心运营效率
对于任何数据中心来说,操作大型、复杂的 GPU 集群都不是件容易的事情!这其中存在着巨大的复杂性。在加速计算数据中心,冷却、电源、网络,
2 MIN READ
2024年 9月 10日
使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型优化器对 LLM 进行训练后量化
随着大语言模型(LLMs)的规模不断扩大,提供易于使用且高效的部署路径变得越来越重要,因为为此类 LLMs 提供服务的成本越来越高。
3 MIN READ
2024年 9月 5日
跨音频类型实现先进的零样本波形音频生成
令人惊叹的音频内容是虚拟世界的重要组成部分。音频生成式 AI 在创建此类内容方面发挥着关键作用,NVIDIA 正在不断突破这一研究领域的极限。
2 MIN READ