正在阅读:

字节剪映海外版Capcut公测,和Soar有哪些区别?

扫一扫下载界面新闻APP

字节剪映海外版Capcut公测,和Soar有哪些区别?

初次见面,Capcut给的印象分实在不高。

文|AI鲸选社  何煦阳

今天两个重磅消息,意味着Sora多了两个强劲对手:

一,字节剪映海外版Capcut的AI生成视频功能开放公测了;

二、Stable Video,对,就是那个AI绘画效果特好的Stable Diffusion,它开发的AI生成视频产品,今天也公测了。

Pika、Runway、Video Poet、Soar,现在又加上Capcut、Stable Video,今年这如泉涌的AI视频产品真的把鲸哥炸得头晕目眩,视频行业要变天!

废话不多说,先摆上俩网址。毕竟还没开放测试的Sora只是期货,Stable Video和Capcut可是实打实地开放公测了,不是传言中的“狼来了”。咱们看看他俩效果如何——

Capcut网址:https://www.capcut.com/editor-tools/ai-video-generator

Stable Video网址:https://www.stablevideo.com/generate

刚点开Capcut,界面左边就是AI视频demo,右上角提醒用户每人有五次免费AI视频生成机会:

需要注意的是,Capcut和Runway、Soar都不一样,不是纯AI视频产品,是剪辑工具,AI视频生成只是功能之一。左上角就有很多功能供用户选择:

这一点值得夸赞的,在产品化方面Capcut做得比其他AI视频产品好,尤其利好广告创作者,剪映自身的剪辑工具属性使它有先天优势。

那就上手体验吧!鲸哥的提示词写了“Minecraft Gameplay”,想拿Capcut生成的视频跟Sora那边的比较一下,结果……

1850分钟?Seriously?鲸哥本来以为真实不需要这么久,结果发现它居然真的在倒数......

没办法了,只能看来看看Capcut的视频demo了。鲸哥把demo放在下面,以飨读者:

整体似乎不错,光影、细节拉满,但要等一天多的时间也太漫长了,不知道是否是今天服务器被挤爆的缘故,可Pika、Runway当时发布时,似乎并没有出现这种状况。

X平台上也有人表示了质疑:

初次见面,Capcut给的印象分实在不高。

而Stable Video(简称SV),在三个月前其实就公开了论文代码权重,当时有程序猿就已经体验过一波。

Stable Video的视频demo是这样的:

在早前宣传的时候,他们号称Stable Diffusion有3D合成能力,支持物体从单一视角到多视角的转化:

按回车进入网站:

很简洁干净的界面,比剪映多了一个图像生成视频的选项,毕竟AI绘画是Stable Diffusion的老本行:

每个人一开始有150点免费额度,图像转视频一次花费10个额度,文本转视频花费11个额度。

还可以调节镜头,锁定、摇镜、360度,俯视都可以:

鲸哥输入提示词想生成视频,却发现系统提示错误......

将提示词改短了些,变成“一对男女在海边看日出”,就成功了,得到了这样一段4s的视频:

不错!虽然简单,但十分高清。

但当鲸哥想继续生成时,系统又显示错误,不知道时因为SV现在语义理解能力还不够,还是服务器爆满。可图生视频却没问题:

对比Sora的Minecraft Gameplay:

SV的ant:

Sora的ant:

可以发现SV最为人称道的是它的清晰度,可两个视频基本上都只是背景在动,画面主体并没有动,更像是图片转变成了一个GIF。

鲸哥尝试选“Orbit”,让镜头360度围绕着蚂蚁旋转,结果四十分钟都没有生成出来,当初说好的3D合成呢......

Sora完全吊打SV,无论是画面的精细程度,主体的运动,镜头的变换......最离谱的是,SV看看Sora生成的Minecraft吧,这才是真正的3D合成!你只动背景算什么呢?

Sora的3D合成效果(或者说物理效果)究竟是怎么来的?OpenAI在此前公布Sora的技术文档曾提到,他们发现视频模型在经过大规模训练后,会表现出许多有趣的新能力。这些能力使 Sora 能够模拟物理世界中的人、动物和环境的某些方面。

也许SV3D合成功能欠缺(也可能是服务器被挤爆)就是因为依然没有满足sacaling law法则,数据和训练未大到让模型涌现出理解物理世界的能力。

Sora的世界模仿能力也非完美,该能力的出现纯粹是规模现象,不能说明有明确的三维、物体特征,比如Sora也无法完美模拟玻璃杯破碎的过程。著名科技大拿杨立昆最近就在X平台上炮轰Sora没有前途,除非使用他提出的物理引擎。

AI视频只会越来越智能。可以想见,未来社交平台上会有大量的AI内容,届时我们所看到的一切都将变得真假难辨。

本文为转载内容,授权事宜请联系原著作权人。

字节跳动

4.4k
  • 科技早报|字节跳动回应向实习生索赔800万 ;OPPO杭州全球总部因方案调整暂时停工
  • 地方新闻精选 | 黑龙江回应村民家监控拍到有东北虎出没 郑州一建筑工人酒后伤人致死

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

字节剪映海外版Capcut公测,和Soar有哪些区别?

初次见面,Capcut给的印象分实在不高。

文|AI鲸选社  何煦阳

今天两个重磅消息,意味着Sora多了两个强劲对手:

一,字节剪映海外版Capcut的AI生成视频功能开放公测了;

二、Stable Video,对,就是那个AI绘画效果特好的Stable Diffusion,它开发的AI生成视频产品,今天也公测了。

Pika、Runway、Video Poet、Soar,现在又加上Capcut、Stable Video,今年这如泉涌的AI视频产品真的把鲸哥炸得头晕目眩,视频行业要变天!

废话不多说,先摆上俩网址。毕竟还没开放测试的Sora只是期货,Stable Video和Capcut可是实打实地开放公测了,不是传言中的“狼来了”。咱们看看他俩效果如何——

Capcut网址:https://www.capcut.com/editor-tools/ai-video-generator

Stable Video网址:https://www.stablevideo.com/generate

刚点开Capcut,界面左边就是AI视频demo,右上角提醒用户每人有五次免费AI视频生成机会:

需要注意的是,Capcut和Runway、Soar都不一样,不是纯AI视频产品,是剪辑工具,AI视频生成只是功能之一。左上角就有很多功能供用户选择:

这一点值得夸赞的,在产品化方面Capcut做得比其他AI视频产品好,尤其利好广告创作者,剪映自身的剪辑工具属性使它有先天优势。

那就上手体验吧!鲸哥的提示词写了“Minecraft Gameplay”,想拿Capcut生成的视频跟Sora那边的比较一下,结果……

1850分钟?Seriously?鲸哥本来以为真实不需要这么久,结果发现它居然真的在倒数......

没办法了,只能看来看看Capcut的视频demo了。鲸哥把demo放在下面,以飨读者:

整体似乎不错,光影、细节拉满,但要等一天多的时间也太漫长了,不知道是否是今天服务器被挤爆的缘故,可Pika、Runway当时发布时,似乎并没有出现这种状况。

X平台上也有人表示了质疑:

初次见面,Capcut给的印象分实在不高。

而Stable Video(简称SV),在三个月前其实就公开了论文代码权重,当时有程序猿就已经体验过一波。

Stable Video的视频demo是这样的:

在早前宣传的时候,他们号称Stable Diffusion有3D合成能力,支持物体从单一视角到多视角的转化:

按回车进入网站:

很简洁干净的界面,比剪映多了一个图像生成视频的选项,毕竟AI绘画是Stable Diffusion的老本行:

每个人一开始有150点免费额度,图像转视频一次花费10个额度,文本转视频花费11个额度。

还可以调节镜头,锁定、摇镜、360度,俯视都可以:

鲸哥输入提示词想生成视频,却发现系统提示错误......

将提示词改短了些,变成“一对男女在海边看日出”,就成功了,得到了这样一段4s的视频:

不错!虽然简单,但十分高清。

但当鲸哥想继续生成时,系统又显示错误,不知道时因为SV现在语义理解能力还不够,还是服务器爆满。可图生视频却没问题:

对比Sora的Minecraft Gameplay:

SV的ant:

Sora的ant:

可以发现SV最为人称道的是它的清晰度,可两个视频基本上都只是背景在动,画面主体并没有动,更像是图片转变成了一个GIF。

鲸哥尝试选“Orbit”,让镜头360度围绕着蚂蚁旋转,结果四十分钟都没有生成出来,当初说好的3D合成呢......

Sora完全吊打SV,无论是画面的精细程度,主体的运动,镜头的变换......最离谱的是,SV看看Sora生成的Minecraft吧,这才是真正的3D合成!你只动背景算什么呢?

Sora的3D合成效果(或者说物理效果)究竟是怎么来的?OpenAI在此前公布Sora的技术文档曾提到,他们发现视频模型在经过大规模训练后,会表现出许多有趣的新能力。这些能力使 Sora 能够模拟物理世界中的人、动物和环境的某些方面。

也许SV3D合成功能欠缺(也可能是服务器被挤爆)就是因为依然没有满足sacaling law法则,数据和训练未大到让模型涌现出理解物理世界的能力。

Sora的世界模仿能力也非完美,该能力的出现纯粹是规模现象,不能说明有明确的三维、物体特征,比如Sora也无法完美模拟玻璃杯破碎的过程。著名科技大拿杨立昆最近就在X平台上炮轰Sora没有前途,除非使用他提出的物理引擎。

AI视频只会越来越智能。可以想见,未来社交平台上会有大量的AI内容,届时我们所看到的一切都将变得真假难辨。

本文为转载内容,授权事宜请联系原著作权人。