Posts by Alexander Zhurkevich
智能体/生成式 AI
2026年 2月 25日
借助 NVIDIA Blackwell Ultra 提升 Softmax 的效率
LLM 上下文长度呈爆炸式增长,架构正朝着更复杂的注意力机制发展,例如多头潜在注意力(MLA)和分组查询注意力(GQA)。因此,
2 MIN READ
计算机视觉/视频分析
2022年 12月 16日
使用 NVIDIA TensorRT 在 Apache Beam 中简化和加速机器学习预测
为大规模运行机器学习模型而加载和预处理数据通常需要将数据处理框架和推理机无缝拼接在一起。 在这篇文章中,
4 MIN READ