全系模型进入2.0时代快手可灵正式发布2.0模型

首页 > AI资讯 > 最新资讯 > 全系模型进入2.0时代快手可灵正式发布2.0模型

上海证券报·中国证券网 2025-04-16

　　上证报中国证券网讯（记者罗茂林）本周，大模型行业又迎来了一轮新品潮。

　　就在大洋彼岸的OpenAI为了市场，选择“后退”，发布4.1版本大模型后；快手在4月15日下午宣布，旗下视频大模型可灵正式迈入2.0时代。

　　“我们目前全球用户规模突破2200万，”发布会上，快手高级副总裁、社区科学线负责人盖坤表示，可灵希望让每个人都能用AI讲出好故事，实现更加精准的复杂创意表达。

　　值得一提的是，在快手最新的财报上，公司首次披露可灵大模型带动的收入超过1亿元，让资本市场快速嗅到商业化落地的趋势。

　　又一款多模态大模型

　　4月15日，快手旗下可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布，这也让可灵成为真正意义上的又一款多模态大模型。

　　从直观感受来看，此次发布的大模型生成的视频片段，无论从一致性还是精细度上，都较此前有了明显的提升。

　　为了更好地帮助创作者准确实现创作意图，可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language（MVL）。

　　“大家应该很自然地会感受到文字在表达影像信息时，是不完备的。我们需要有新的方式，能让人真正精准地表达出心中所想。”盖坤说道。

　　基于MVL理念，可灵AI正式推出多模态编辑功能。

　　“用户可以非常直接地把自己的想法用图像等方式作为输入，生成符合自己想法的创意视频。”盖坤介绍，MMW（多模态描述子）将不只局限于图片和视频，也可以引入其他模态的信息，例如声音、运动轨迹等。

　　同时，在可灵2.0大师版上，产品进一步升级视频及图像创作可控生成与编辑能力，上线全新的多模态视频编辑功能。

　　这一模式支持在一段视频的基础之上，通过输入图片或文字，对生成的视频内容实现元素的增加、删减、替换，帮助创作者们实现更加灵活的二次编辑和处理。

可灵2.0大师版操作界面

　　而从展示效果来看，可控生成与编辑的能力能够更为精细地调整画面，这恰恰是商业化创作必须迈过的门槛。

　　用户规模突破2200万

　　从数据来看，此次新发布的模型在团队内部的多项胜负率评测中，均稳居业内第一。

　　例如在文生视频领域，可灵2.0对比谷歌Veo2的胜负比为205%，对比Sora的胜负比达367%，在文字相关性、画面质量、动态质量等维度上显著超越对手。

　　“可灵的发布可以说很大程度上改变了资本市场对快手的投资逻辑。”一位市场人士的观点颇具代表性。记者注意到，在最近的几次财报会上，可灵的一举一动都备受投资者的关注。

　　据了解，自去年6月发布以来，可灵AI已累计完成超20次迭代。

　　截至目前，可灵AI全球用户规模已突破2200万，累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里，可灵AI的月活用户数量增长25倍。

　　除了C端订阅用户，可灵AI也面向B端商家提供API接入等服务。目前，可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

　　盖坤披露，来自世界各地的超1.5万开发者，已将可灵的API应用于不同的行业场景中，累计生成的图像数量约1200万个，生成的视频素材超过4000万个。

　　为了进一步激发AI爱好者们的创作热情，快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。

　　据介绍，该计划将加大对于AIGC创作者的扶持力度，通过千万资金投入、全球宣发、IP打造和保障，以全资出品、联合出品和技术支持等灵活多样的合作方式，让AI好故事走向世界。同时，可灵AI面向全球创作者发出征集邀约，邀请用户共同打造全球首支用户共创AI创意短片。

（文章来源：上海证券报·中国证券网）

Tags:

自然语言处理模型快手

2024-09-27

2024-09-27

2024-09-27

2024-09-26

2024-09-25

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。