速度超高端GPU数百倍,摩尔定律的未来是「光」?
自各家芯片厂商开始将芯片微缩制程作为发展重点开始,业内关于“摩尔定律是否就快走到尽头”的讨论就未停止过。中国工程院院士许居衍曾就下一波芯片技术前瞻主题,针对CMOS和新器件、冯·诺伊曼架构和新兴架构列举了四类技术方向:一类是硅CMOS 技术与冯·诺依曼结合的“硅·冯”范式;一类是能进入跟CMOS雷同
自各家芯片厂商开始将芯片微缩制程作为发展重点开始,业内关于“摩尔定律是否就快走到尽头”的讨论就未停止过。中国工程院院士许居衍曾就下一波芯片技术前瞻主题,针对CMOS和新器件、冯·诺伊曼架构和新兴架构列举了四类技术方向:一类是硅CMOS 技术与冯·诺依曼结合的“硅·冯”范式;一类是能进入跟CMOS雷同
克雷西 发自 凹非寺新火种 | 公众号 QbitAI把Llama 3蒸馏到Mamba,推理速度最高可提升1.6倍!而且性能不减,甚至表现比原始模型还要优异。这是来自Together AI的新作,通过蒸馏将Transformer和Mamba模型结合到了一起,同时还为混合模型涉及了推理加速算法提出Mam
在这个快节奏的软件工程世界,哪怕几毫秒的差异也可能决定用户体验的成败,所以优化语言机器学习模型(LLM)的应用速度和成本是很有必要的事情。
12月19日下午,南方都市报、南都数字经济治理研究中心联合中国政法大学数据法治研究院在北京举办第七届“啄木鸟数据治理论坛”,主题为“数据为本,AI向善”。会上,南都数字经济治理研究中心发布了《生成式AI发展与治理观察报告(2023)》(下称《报告》)。
2月19日消息,据报道,北京市人形机器人创新中心自主研发的“天工”人形机器人在多项关键功能上实现重要技术突破。在户外真实地形测试中,“天工”机器人成功完成了连续攀爬多级阶梯的挑战,并登上了北京通州区海子墙公园的最高点。
10月30日,长安启源A07/A05全面开启上市大规模交付。在新能源市场往往“排队”几个月等待提车的今天,长安启源上市即交付,展现出卓越的体系化能力。自8月27日品牌发布以来,长安启源正不断刷新行业速度。 A07塑造同级顶流实力 作为长安启源首款车型,此次全面开启上市大规模交付的A07,共推
10月20日消息,据媒体报道,NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。
据介绍,这款芯片的设计灵感来源于人脑,可以在14nm芯片上集成3500万PCM(相变存储器)。IBM研发团队在此芯片上进行了语音识别和转录实验,在保障准确率的前提下,速度和能效均有很大提升。
在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共400万个token的流式输入,22.2倍的推理速度提升。
马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了!就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。xAI表示,他们打造PromptIDE的最初目的,是加速其聊天AI机器人Grok的开发——根据官方透露的信息,刚刚开启内测的Grok是xAI创始团队11人爆肝2个月打造