正在阅读:

闪电快讯 | 可灵AI全系模型再升级,全球用户数超2200万

扫一扫下载界面新闻APP

闪电快讯 | 可灵AI全系模型再升级,全球用户数超2200万

4月15日,快手2024年财报电话会议的主角——可灵AI,对外公布了最新进展。

4月15日,快手2024年财报电话会议的主角——可灵AI,对外公布了最新进展。

具体来说,可灵AI宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型,前者在动态质量、语义响应、画面美学等维度较此前版本进一步升级,后者在指令遵循、电影质感及艺术风格表现等方面得到显著提升。

自去年6月发布以来,可灵AI已累计完成超过20次迭代,月活用户数量增长25倍。截至目前,其全球用户规模突破2200万;累计生成1.68亿个视频及3.44亿张图片素材。

快手高级副总裁、社区科学线负责人盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍然存在“很多挑战”。因此,为了让每个人都能用AI讲出好故事、实现更加精准的复杂创意表达,必须对基座模型能力进行全方位提升。

而在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能够从视频生成设定的基础方向以及精细控制两个层面,更为精准地实现AI创作者的创意表达。

基于MVL理念,可灵AI推出了多模态编辑功能,这也在全新上线的可灵2.0大师版得到了充分应用。快手副总裁、可灵AI负责人张迪介绍,可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,能够灵活理解用户意图。与此同时,其支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者实现更加灵活的二次编辑和处理。

张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。他介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。

同时,可图2.0也上线了图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就可以一键切换图片的艺术风格,并精准保留原图的语义内容。

电厂体验了可灵2.0大师版的文生视频和图生视频功能,系统提示的平均等待时间多数在20分钟以内。文生视频方面,语义理解偏差较小,运动幅度更为合理;图生视频方面,指令遵循能力升级,审美风格令人惊喜。

除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务,已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。来自世界各地的超1.5万开发者和企业客户,将可灵的API应用于不同行业场景。

此前,快手方面透露,自商业化以来至2025年2月,可灵AI累计创造收入超过1亿元。可灵AI肩负的期待是“力争可灵AI早日成为营收规模全球第一的视频生成AI应用”。可灵AI的商业化与升级进程同步,首次上线开放测试一个月后即上线了会员体系,开始提供付费服务。商业化场景下,AI能力也正在被开放给广告主和电商商家,为之创造增量。2024年第四季度,快手AIGC营销素材日均消耗超过3000万元。

“长期来看,我们希望通过可灵AI的赋能,改造升级现有业务的同时,创造AI视频生成内容的新赛道,保持并升级快手作为短视频生产和消费社区平台的领先地位。”在2024年第四季度及全年业绩报告发布后的电话会议上,快手创始人兼CEO程一笑这样阐述了可灵AI的目标及其之于快手的意义。可灵AI的愿景是让每个人都能用AI讲出好故事。当然,这也是属于快手的“好故事”——现在的每一次升级,都在书写这个故事的文段。

 

本文为转载内容,授权事宜请联系原著作权人。

快手

5.6k
  • 港股科网股走低,美团、小鹏汽车跌超7%
  • 快手可灵AI宣布基座模型升级,全球用户规模超2200万

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

闪电快讯 | 可灵AI全系模型再升级,全球用户数超2200万

4月15日,快手2024年财报电话会议的主角——可灵AI,对外公布了最新进展。

4月15日,快手2024年财报电话会议的主角——可灵AI,对外公布了最新进展。

具体来说,可灵AI宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型,前者在动态质量、语义响应、画面美学等维度较此前版本进一步升级,后者在指令遵循、电影质感及艺术风格表现等方面得到显著提升。

自去年6月发布以来,可灵AI已累计完成超过20次迭代,月活用户数量增长25倍。截至目前,其全球用户规模突破2200万;累计生成1.68亿个视频及3.44亿张图片素材。

快手高级副总裁、社区科学线负责人盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍然存在“很多挑战”。因此,为了让每个人都能用AI讲出好故事、实现更加精准的复杂创意表达,必须对基座模型能力进行全方位提升。

而在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能够从视频生成设定的基础方向以及精细控制两个层面,更为精准地实现AI创作者的创意表达。

基于MVL理念,可灵AI推出了多模态编辑功能,这也在全新上线的可灵2.0大师版得到了充分应用。快手副总裁、可灵AI负责人张迪介绍,可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,能够灵活理解用户意图。与此同时,其支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者实现更加灵活的二次编辑和处理。

张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。他介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。

同时,可图2.0也上线了图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就可以一键切换图片的艺术风格,并精准保留原图的语义内容。

电厂体验了可灵2.0大师版的文生视频和图生视频功能,系统提示的平均等待时间多数在20分钟以内。文生视频方面,语义理解偏差较小,运动幅度更为合理;图生视频方面,指令遵循能力升级,审美风格令人惊喜。

除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务,已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。来自世界各地的超1.5万开发者和企业客户,将可灵的API应用于不同行业场景。

此前,快手方面透露,自商业化以来至2025年2月,可灵AI累计创造收入超过1亿元。可灵AI肩负的期待是“力争可灵AI早日成为营收规模全球第一的视频生成AI应用”。可灵AI的商业化与升级进程同步,首次上线开放测试一个月后即上线了会员体系,开始提供付费服务。商业化场景下,AI能力也正在被开放给广告主和电商商家,为之创造增量。2024年第四季度,快手AIGC营销素材日均消耗超过3000万元。

“长期来看,我们希望通过可灵AI的赋能,改造升级现有业务的同时,创造AI视频生成内容的新赛道,保持并升级快手作为短视频生产和消费社区平台的领先地位。”在2024年第四季度及全年业绩报告发布后的电话会议上,快手创始人兼CEO程一笑这样阐述了可灵AI的目标及其之于快手的意义。可灵AI的愿景是让每个人都能用AI讲出好故事。当然,这也是属于快手的“好故事”——现在的每一次升级,都在书写这个故事的文段。

 

本文为转载内容,授权事宜请联系原著作权人。