新闻
2026年 3月 23日
在 Kubernetes 上部署解 LLM 推理工作负载
随着大语言模型 (LLM) 推理工作负载的复杂性不断增加,单个单一的服务进程开始达到其极限。预填充和解码阶段具有截然不同的计算配置文件,
4 MIN READ
2026年 3月 11日
隆重推出 Nemotron 3 Super:用于代理式推理的开放式混合式 Mamba-Transformer MoE
代理式 AI 系统需要具有专业深度的模型来自主解决密集的技术问题。它们必须在推理、编码和长上下文分析方面表现出色,同时保持足够的效率,
3 MIN READ
2026年 2月 5日
Painkiller RTX 如何通过生成式 AI 大规模重塑游戏资产
Painkiller RTX为小型团队如何通过集成生成式 AI,在庞大的视觉目标与有限资源之间实现平衡,树立了新的标杆。
2 MIN READ
2020年 10月 5日
推出终极入门 AI 计算机,NVIDIA Jetson Nano 2GB 开发人员套件
今天, NVIDIA 宣布了 Jetson Nano 2GB 开发者套件 ,这是一个理想的教学、学习和开发人工智能和机器人应用的实践平台。
2 MIN READ
2020年 7月 7日
OpenAI 展示 GPT-3,一个 1750 亿参数的语言模型
OpenAI 研究人员最近发布了 研究报告 描述 GPT-3 ,一个由 1750 亿个参数组成的最先进的语言模型。 相比之下,
1 MIN READ
2020年 6月 17日
在适用于 Linux 2 的 Windows 子系统上宣布 CUDA
为响应大众需求,微软 宣布 在 2020 年 5 月的 建造 大会上推出了 建造 ( WSL 2 ) – GPU 加速功能。
6 MIN READ