北京智源人工智能研究院林咏华:国内AI芯片的大模型训练性能与国外约有三年差距
29日讯,北京智源人工智能研究院副院长、总工程师林咏华表示,当前中国AI芯片的大模型集群训练性能,只有个别接近英伟达A100/A800,大多数不到50%。此外是生态差距巨大,我国AI芯片公司有40余家,但中国AI芯片整体的市场占有率加起来不超过10%,各家AI芯片软件各异、生态十分零碎割裂。(蓝鲸记
29日讯,北京智源人工智能研究院副院长、总工程师林咏华表示,当前中国AI芯片的大模型集群训练性能,只有个别接近英伟达A100/A800,大多数不到50%。此外是生态差距巨大,我国AI芯片公司有40余家,但中国AI芯片整体的市场占有率加起来不超过10%,各家AI芯片软件各异、生态十分零碎割裂。(蓝鲸记
编辑 | 白菜叶OpenAI o1 的突破凸显了通过增强推理能力来提高自然语言大模型(LLM)的应用潜力。然而,大多数推理研究都集中在数学任务上,而医学等领域尚未得到充分探索。医学领域虽然不同于数学,但鉴于医疗保健的高标准,它也需要强大的推理能力来提供可靠的答案。
今日有消息称,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。对此,知情人士对记者回应称:字节跳动有加强大模型相关研究的长期计划,但并未决定建立独立机构。另外,前零一万物技术联创黄文灏已加入字节
机器学习出品|虎嗅科技组作者|齐健编辑|陈伊凡头图|智源大会直播“OpenAI会再开源大模型吗?”当智源研究院理事长张宏江向线上参加2023年智源大会的OpenAI首席执行官Sam Altman问及开源问题时,Sam Altman微笑表示,OpenAI未来会开放更多代码,但没有具体的开源时间表。这样
2023年,业界还在卷Scaling Law,不断突破参数规模和数据规模时,微软亚洲研究院张丽团队就选择了另一条路径。早在OpenAI o1发布前,张丽团队就开始探索大模型深度推理能力。System2这个原属认知科学的词汇最早由她及团队引入大模型领域。
近日,在2024年中国移动(600941)全球合作伙伴大会上,中国移动研究院携手中兴通讯(000063)联合展示了实时通信融合AI平台,该平台具备能力插件化、编排智能化、部署敏捷化三大特性,可实现各种AI媒体能力快速加载,从而加快新通话业务创新步伐。
近年来,超大规模的预训练模型成为全球人工智能技术研发的热点。作为大模型发展的风向标,评测基准也受到业界越来越广泛的关注。为更有效评估大模型的通用语言智能,近日,北京智源人工智能研究院(以下简称“智源研究院”)发布机器中文语言能力评测基准
所有测评模型中,讯飞星火智商和效率最高,百度文心一言基础能力最强,商汤商量情商最高。
导语:北京人工智能标准化研究院将围绕人工智能前沿关键技术、行业场景应用、风险防范治理等领域开展全链条标准化研究。IT之家 8 月 26 日消息,IT之家从“北京亦庄”公众号获悉,在 8 月 25(昨)日的 2024 世界机器人大会人工智能赋能未来产业与组织发展论坛上,国内首家人工智能标准化研究机构
品玩12月22日讯,北京智源研究院发布具有370亿参数的多模态大模型 EMU2。据悉,Emu2 表现出强大的多模态上下文学习能力,甚至可以解决需要即时推理的任务,例如视觉提示和基于对象的生成。该模型在少样本设置下的多个多模态理解任务上创造了新记录。研究团队表示,Emu2 可以作为各种多模态任务的基础