首页 > AI资讯 > 最新资讯 > 全系模型进入2.0时代快手可灵正式发布2.0模型

全系模型进入2.0时代快手可灵正式发布2.0模型

上海证券报·中国证券网    2025-04-16

  上证报中国证券网讯(记者罗茂林)本周,大模型行业又迎来了一轮新品潮。

  就在大洋彼岸的OpenAI为了市场,选择“后退”,发布4.1版本大模型后;快手在4月15日下午宣布,旗下视频大模型可灵正式迈入2.0时代。

  “我们目前全球用户规模突破2200万,”发布会上,快手高级副总裁、社区科学线负责人盖坤表示,可灵希望让每个人都能用AI讲出好故事,实现更加精准的复杂创意表达。

  值得一提的是,在快手最新的财报上,公司首次披露可灵大模型带动的收入超过1亿元,让资本市场快速嗅到商业化落地的趋势。

  又一款多模态大模型

  4月15日,快手旗下可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布,这也让可灵成为真正意义上的又一款多模态大模型。

  从直观感受来看,此次发布的大模型生成的视频片段,无论从一致性还是精细度上,都较此前有了明显的提升。

  为了更好地帮助创作者准确实现创作意图,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL)。

  “大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤说道。

  基于MVL理念,可灵AI正式推出多模态编辑功能。

  “用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述子)将不只局限于图片和视频,也可以引入其他模态的信息,例如声音、运动轨迹等。

  同时,在可灵2.0大师版上,产品进一步升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能。

  这一模式支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

可灵2.0大师版操作界面

  而从展示效果来看,可控生成与编辑的能力能够更为精细地调整画面,这恰恰是商业化创作必须迈过的门槛。

  用户规模突破2200万

  从数据来看,此次新发布的模型在团队内部的多项胜负率评测中,均稳居业内第一。

  例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。

  “可灵的发布可以说很大程度上改变了资本市场对快手的投资逻辑。”一位市场人士的观点颇具代表性。记者注意到,在最近的几次财报会上,可灵的一举一动都备受投资者的关注。

  据了解,自去年6月发布以来,可灵AI已累计完成超20次迭代。

  截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。

  除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

  盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。

  为了进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。

  据介绍,该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片。

(文章来源:上海证券报·中国证券网)

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。