Posts by Uttara Kumar
代理式 AI/生成式 AI
2025年 11月 18日
使用 NVIDIA Nemotron RAG 和 Microsoft SQL Server 2025 在企业数据上构建可扩展的 AI
在 Microsoft Ignite 2025 大会上,随着 Microsoft SQL Server 2025 的发布,
2 MIN READ
数据中心/云端
2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理
将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ,
2 MIN READ
数据中心/云端
2025年 3月 20日
借助 NVIDIA TensorRT-LLM 提升 Microsoft Azure AI Foundry 的 Llama 模型性能
微软与 NVIDIA 合作,宣布在其 Azure AI Foundry 平台上实现 Meta Llama 系列模型的变革性性能提升。
1 MIN READ
数据中心/云端
2024年 8月 21日
Google Cloud Run 现已支持 NVIDIA L4 GPU、NVIDIA NIM 及大规模无服务器 AI 推理部署
部署 AI 赋能的应用和服务给企业带来了重大的挑战: 应对这些挑战需要一种全栈方法,该方法可以优化性能、有效管理可扩展性并驾部署的复杂性,
2 MIN READ
网络安全
2023年 5月 31日
使用机密计算保护敏感数据和人工智能模型
快速的数字化转型导致整个企业生成的敏感数据激增。这些数据必须在本地、云中的数据中心中存储和处理,或者在边缘生成敏感和个人身份信息( PII…
3 MIN READ
对话式人工智能
2022年 7月 28日
在 Amazon EC2 上使用 NVIDIA Riva 构建语音支持的人工智能虚拟助手
语音 AI 可以在联络中心协助人类代理,为虚拟助理和数字化身供电,在视频会议中生成实时字幕,等等。在后台,
4 MIN READ