首页 > 北大

北大

  • 搜索图片有新招了!北大提出图像检索新方法|ECCV2024

    从一大堆图片中精准找图,有新招了!论文已经中了ECCV 2024。北京大学袁粒课题组,联合南洋理工大学实验室,清华自动化所提出了一种新的通用检索任务:通用风格检索(Style-Diversified Retrieval)。一句话,这种检索任务要求模型面对风格多样的查询条件时,依然能精准找图。

  • 语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

    机器之心专栏机器之心编辑部北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中取得了卓越的性能,刷榜多项评估榜单,这标志着多模态学习领域向着「大一统」理念迈进了重要一步。在现代社会,信息传递和交流不再局限

  • 北大在深圳成立科学智能学院:AI+Science双导师

    4月28日消息,北京大学今天宣布,已在深圳研究生院成立科学智能学院。据介绍,科学智能学院面向智能时代科学革命与产业变革的前瞻性布局,培养兼具科学智能素养、跨学科创新能力和国际视野的交叉复合型人才。

  • 北大陈宝权教授:从图形计算到世界模型

    世界模型是当前的热点话题。我这里分享的题目是 “图形计算到世界模型”,作为抛砖引玉,试图挖掘和展示图形计算和世界模型两者之间可能建立的紧密内在联系。GAMES 这个平台上的报告,主要是为了交流,鼓励大胆提出想法,引发讨论,而不是单纯的宣读一些既有成果。所以,我为此做了一些调研和思考,期待通过这个报告

  • 北大AI课十讲,直播!

    ChatGPT出圈New Bing走红AI“黑科技”日益成为社会热点话题面对人工智能日新月异的发展你或许会问我们该怎样认识智能学科?智能学科的研究现状如何?发展趋势又有哪些?北京大学智能学科(智能学院、人工智能研究院、王选计算机研究所)联合北京通用人工智能研究院推出“立心之约——中学生AI微课十讲”

  • 北大最新多模态大模型开源:混合数据集训练,图像视频任务直接用

    训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。具体而言,团队按照提出的新框架,训练了一个新的VLM:Chat-UniVi。

  • 用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

    北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中取得了卓越的性能,刷榜多项评估榜单,这标志着多模态学习领域向着「大一统」理念迈进了重要一步。在现代社会,信息传递和交流不再局限于单一模态。