DeepSeek预示算力需求“打骨折”?业界:别只盯着训练AI行业进入推理时代
《科创板日报》12月30日讯 日前,深度求索DeepSeek-V3横空出世,在AI行业内引发巨震,关键原因之一就是预训练成本之低——这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。与此同时,DeepSeek-V3相比其他前沿大模型,性能却足以
《科创板日报》12月30日讯 日前,深度求索DeepSeek-V3横空出世,在AI行业内引发巨震,关键原因之一就是预训练成本之低——这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。与此同时,DeepSeek-V3相比其他前沿大模型,性能却足以
11月21日,在“华为2023可持续发展论坛”上,华为透露,已为全球9000万偏远地区人口提供联接到数字社会的能力。华为董事长梁华称,加快算力基础设施建设,将有力推进数字技术使能各行各业数字化转型升级。 梁华在论坛上表示,以联接和算力为代表的新一代数字基础设施,已经和道路交通等物理基础设施一样,
作者|黄楠编辑|袁斯来在大模型技术浪潮中,Scaling Law被业界遵循为第一性原理,直至科技媒体The Information在独家报道中指出,OpenAI下一代旗舰模型Orion的训练效果或远不及预期:与GPT-4相比,性能提升也许微乎其微。这引发了从业者对大模型发展路径的深度思考:Scali
华为副董事长、轮值董事长、CFO孟晚舟9月20日,华为全联接大会在上海举办。华为副董事长、轮值董事长、CFO孟晚舟在大会上发表主题演讲时表示,当前,人类社会正加速迈向智能世界,数据正在爆炸式增长,智能技术也在突飞猛进。以强大算力为基础的各种模型和算法不断涌现,应用场景日益丰富,创新的“矢量效应”更加
连发13条推文!OpenAI超级对齐负责人Jan Leike,也就是刚刚追随Ilya离开公司的那位,自曝离职的真正原因,以及更多内幕。一来算力不够用,承诺给超级对齐团队的20%缺斤少两,导致团队逆流而行,但也越来越困难。二来安全不重视,对AGI的安全治理问题,优先级不如推出“闪亮的产品”。紧接着,更
中国移动对推理资源的投资不设上限 国内有望迎来算力基建大时代
据华为官网,9月20日,在华为全联接大会2023期间,华为发布《数据中心2030》报告。华为预测,到2030年全球AI计算算力将超过105 ZFLOPS(FP16):AI计算算力成为数据中心发展的最大驱动力和决定性因素。未来5到10年通用大模型的发展有可能使AI对文字、音乐、绘画、语音、图像、视频等
就在北京时间明天(12月14日)22点,英特尔将奉上一场年末AI硬件大戏——主题为“AI Everywhere”(AI无处不在)的新品发布会,正式推出代号Meteor Lake的酷睿Ultra处理器。Meteor Lake是英特尔首款AI PC处理器,
DeepSeek再刷屏!登顶APP下载排行榜,全球算力板块应声下跌,后市如何看?
工业和信息化部工业文化发展中心设计创新服务处负责人、工业元宇宙协同发展组织秘书长柯斌提到,如今,关于人工智能算力、算法、数据集等层面的竞争,事实上已经是世界领先国家之间的国力竞争。积极投身于AI在各行