Yu Sun

Yu Sun 是 NVIDIA 的研究员和斯坦福大学的博士后。他的研究重点是持续学习,特别是一个名为测试时间训练的概念框架,其中每个测试实例都定义了自己的学习问题。

Posts by Yu Sun

智能体/生成式 AI

重塑大模型内存:以上下文为训练数据,实现测试时学习

我们在新闻中不断看到拥有更大上下文窗口的大型语言模型(LLM),它们承诺能够同时查看完整的对话历史、大量书籍或多个代码库。然而, 1 MIN READ