首页 > 新作

新作

  • 马毅团队新作!微调多模态大模型会灾难性遗忘,让性能大减

    编辑:桃子 好困【新智元导读】马毅教授团队最新研究表明,微调多模态大语言模型(MLLM)将会导致灾难性遗忘。模型灾难性遗忘,成为当前一个关键热门话题,甚至连GPT-4也无法避免。近日,来自UC伯克利、NYU等机构研究人员发现,微调后的多模态大模型,会产生灾难性遗忘。论文地址:https://arxi

  • 何恺明刘壮新作:消除数据集偏差的十年之战

    MIT新晋副教授何恺明,新作新鲜出炉:瞄准一个横亘在AI发展之路上十年之久的问题:数据集偏差。该研究为何恺明在Meta期间与刘壮合作完成,他们在论文中指出:这不禁让人怀疑:我们在消除数据集偏差的战斗中,真的取得了胜利吗?

  • GAN的反击:朱俊彦CVPR新作GigaGAN,出图速度秒杀StableDiffusion

    图像生成是当前 AIGC 领域最热门的方向之一。近期发布的图像生成模型如 DALL・E 2、Imagen、Stable Diffusion 等等,开创了图像生成的新时代,实现了前所未有的图像质量和模型灵活性水平。扩散模型也成为目前占据主导地位的范式。然而,扩散模型依赖于迭代推理,这是一把双刃剑,因为

  • 图灵奖得主YoshuaBengio新作:WereRNNsAllWeNeeded?

    自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshua Bengio 赫然在列。论文标题:Were RNNs

  • 朱玉可团队新作:看一眼就能模仿,大模型让机器人轻松学会撒盐

    在人形机器人领域,有一个非常值钱的问题:既然人形机器人的样子与人类类似,那么它们能使用网络视频等数据进行学习和训练吗?如果可以,那考虑到网络视频的庞大规模,机器人就再也不用担心没有学习资源了。近日,德克萨斯大学奥斯汀分校和 NVIDIA Research 的朱玉可团队公布了他们的一篇 CoRL 20