Posts by Anu Srivastava
精选
2026年 6月 12日
在 NVIDIA 加速基础设施上使用 MiniMax M3 部署长上下文推理和代理式工作流
随着企业 AI 采用的规模扩大,开发者越来越多地不得不将分散的工作流拼接在一起,即分别用于文本、视觉和代码的模型,从而导致复杂性增加、
1 MIN READ
精选
2026年 6月 10日
在 NVIDIA 上运行 DiffusionGemma,实现开发者就绪型高吞吐量文本生成
构建实时 AI (例如聊天助手、copilot 和代理式工作流) 的开发者通常会受到词元-by-词元生成速度的限制。这限制了响应能力,
2 MIN READ
精选
2026年 4月 24日
使用 NVIDIA Blackwell 和 GPU 加速端点构建 DeepSeek V4
DeepSeek 刚刚发布了第四代旗舰模型,推出 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两款产品,
2 MIN READ
精选
2026年 4月 11日
MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程
MiniMax M2.7 的发布为流行的 MiniMax M2.7 模型增加了增强功能,该模型专为代理式线束以及推理、ML 研究工作流程、
2 MIN READ
智能体/生成式 AI
2026年 2月 27日
基于 NVIDIA GPU 加速端点,使用千问3.5 VLM 开发原生多模态智能体
阿里巴巴推出了全新开源 千问3.5 系列,专为构建原生多模态智能体而设计。该系列的首个模型是一款总参数为 397B、
1 MIN READ