扫一扫下载界面新闻APP

其他途径关注界面…

字节剪映海外版Capcut公测，和Soar有哪些区别？

初次见面，Capcut给的印象分实在不高。

文｜AI鲸选社何煦阳

今天两个重磅消息，意味着Sora多了两个强劲对手：

一，字节剪映海外版Capcut的AI生成视频功能开放公测了；

二、Stable Video，对，就是那个AI绘画效果特好的Stable Diffusion，它开发的AI生成视频产品，今天也公测了。

Pika、Runway、Video Poet、Soar，现在又加上Capcut、Stable Video，今年这如泉涌的AI视频产品真的把鲸哥炸得头晕目眩，视频行业要变天！

废话不多说，先摆上俩网址。毕竟还没开放测试的Sora只是期货，Stable Video和Capcut可是实打实地开放公测了,不是传言中的“狼来了”。咱们看看他俩效果如何——

Capcut网址:https://www.capcut.com/editor-tools/ai-video-generator

Stable Video网址：https://www.stablevideo.com/generate

刚点开Capcut，界面左边就是AI视频demo，右上角提醒用户每人有五次免费AI视频生成机会：

需要注意的是，Capcut和Runway、Soar都不一样，不是纯AI视频产品，是剪辑工具，AI视频生成只是功能之一。左上角就有很多功能供用户选择：

这一点值得夸赞的，在产品化方面Capcut做得比其他AI视频产品好，尤其利好广告创作者，剪映自身的剪辑工具属性使它有先天优势。

那就上手体验吧！鲸哥的提示词写了“Minecraft Gameplay”，想拿Capcut生成的视频跟Sora那边的比较一下，结果……

1850分钟？Seriously？鲸哥本来以为真实不需要这么久，结果发现它居然真的在倒数......

没办法了，只能看来看看Capcut的视频demo了。鲸哥把demo放在下面，以飨读者：

整体似乎不错，光影、细节拉满，但要等一天多的时间也太漫长了，不知道是否是今天服务器被挤爆的缘故，可Pika、Runway当时发布时，似乎并没有出现这种状况。

X平台上也有人表示了质疑：

初次见面，Capcut给的印象分实在不高。

而Stable Video（简称SV），在三个月前其实就公开了论文代码权重，当时有程序猿就已经体验过一波。

Stable Video的视频demo是这样的：

在早前宣传的时候，他们号称Stable Diffusion有3D合成能力，支持物体从单一视角到多视角的转化：

按回车进入网站：

很简洁干净的界面，比剪映多了一个图像生成视频的选项，毕竟AI绘画是Stable Diffusion的老本行：

每个人一开始有150点免费额度，图像转视频一次花费10个额度，文本转视频花费11个额度。

还可以调节镜头，锁定、摇镜、360度，俯视都可以：

鲸哥输入提示词想生成视频，却发现系统提示错误......

将提示词改短了些，变成“一对男女在海边看日出”，就成功了，得到了这样一段4s的视频：

不错！虽然简单，但十分高清。

但当鲸哥想继续生成时，系统又显示错误，不知道时因为SV现在语义理解能力还不够，还是服务器爆满。可图生视频却没问题：

对比Sora的Minecraft Gameplay：

SV的ant：

Sora的ant：

可以发现SV最为人称道的是它的清晰度，可两个视频基本上都只是背景在动，画面主体并没有动，更像是图片转变成了一个GIF。

鲸哥尝试选“Orbit”，让镜头360度围绕着蚂蚁旋转，结果四十分钟都没有生成出来，当初说好的3D合成呢......

Sora完全吊打SV，无论是画面的精细程度，主体的运动，镜头的变换......最离谱的是，SV看看Sora生成的Minecraft吧，这才是真正的3D合成！你只动背景算什么呢？

Sora的3D合成效果（或者说物理效果）究竟是怎么来的？OpenAI在此前公布Sora的技术文档曾提到，他们发现视频模型在经过大规模训练后，会表现出许多有趣的新能力。这些能力使 Sora 能够模拟物理世界中的人、动物和环境的某些方面。

也许SV3D合成功能欠缺（也可能是服务器被挤爆）就是因为依然没有满足sacaling law法则，数据和训练未大到让模型涌现出理解物理世界的能力。

Sora的世界模仿能力也非完美，该能力的出现纯粹是规模现象，不能说明有明确的三维、物体特征，比如Sora也无法完美模拟玻璃杯破碎的过程。著名科技大拿杨立昆最近就在X平台上炮轰Sora没有前途，除非使用他提出的物理引擎。

AI视频只会越来越智能。可以想见，未来社交平台上会有大量的AI内容，届时我们所看到的一切都将变得真假难辨。

本文为转载内容，授权事宜请联系原著作权人。

字节跳动

3.9k

科技早报 | 字节跳动28亿元北京拿地；多家游戏公司称行业税率向白酒看齐消息不实3天前
字节跳动28亿元拿地，为北京海淀区蓝景丽家收储项目3天前

视频字节跳动

评论

暂无评论哦，快来评价一下吧！

下载界面新闻

微信公众号

字节剪映海外版Capcut公测，和Soar有哪些区别？

初次见面，Capcut给的印象分实在不高。

AI鲸选社 · 2024/02/23 20:51

文｜AI鲸选社何煦阳

今天两个重磅消息，意味着Sora多了两个强劲对手：

一，字节剪映海外版Capcut的AI生成视频功能开放公测了；

二、Stable Video，对，就是那个AI绘画效果特好的Stable Diffusion，它开发的AI生成视频产品，今天也公测了。

Pika、Runway、Video Poet、Soar，现在又加上Capcut、Stable Video，今年这如泉涌的AI视频产品真的把鲸哥炸得头晕目眩，视频行业要变天！

废话不多说，先摆上俩网址。毕竟还没开放测试的Sora只是期货，Stable Video和Capcut可是实打实地开放公测了,不是传言中的“狼来了”。咱们看看他俩效果如何——

Capcut网址:https://www.capcut.com/editor-tools/ai-video-generator

Stable Video网址：https://www.stablevideo.com/generate

刚点开Capcut，界面左边就是AI视频demo，右上角提醒用户每人有五次免费AI视频生成机会：

需要注意的是，Capcut和Runway、Soar都不一样，不是纯AI视频产品，是剪辑工具，AI视频生成只是功能之一。左上角就有很多功能供用户选择：

这一点值得夸赞的，在产品化方面Capcut做得比其他AI视频产品好，尤其利好广告创作者，剪映自身的剪辑工具属性使它有先天优势。

那就上手体验吧！鲸哥的提示词写了“Minecraft Gameplay”，想拿Capcut生成的视频跟Sora那边的比较一下，结果……

1850分钟？Seriously？鲸哥本来以为真实不需要这么久，结果发现它居然真的在倒数......

没办法了，只能看来看看Capcut的视频demo了。鲸哥把demo放在下面，以飨读者：

整体似乎不错，光影、细节拉满，但要等一天多的时间也太漫长了，不知道是否是今天服务器被挤爆的缘故，可Pika、Runway当时发布时，似乎并没有出现这种状况。

X平台上也有人表示了质疑：

初次见面，Capcut给的印象分实在不高。

而Stable Video（简称SV），在三个月前其实就公开了论文代码权重，当时有程序猿就已经体验过一波。

Stable Video的视频demo是这样的：

在早前宣传的时候，他们号称Stable Diffusion有3D合成能力，支持物体从单一视角到多视角的转化：

按回车进入网站：

很简洁干净的界面，比剪映多了一个图像生成视频的选项，毕竟AI绘画是Stable Diffusion的老本行：

每个人一开始有150点免费额度，图像转视频一次花费10个额度，文本转视频花费11个额度。

还可以调节镜头，锁定、摇镜、360度，俯视都可以：

鲸哥输入提示词想生成视频，却发现系统提示错误......

将提示词改短了些，变成“一对男女在海边看日出”，就成功了，得到了这样一段4s的视频：

不错！虽然简单，但十分高清。

但当鲸哥想继续生成时，系统又显示错误，不知道时因为SV现在语义理解能力还不够，还是服务器爆满。可图生视频却没问题：

对比Sora的Minecraft Gameplay：

SV的ant：

Sora的ant：

可以发现SV最为人称道的是它的清晰度，可两个视频基本上都只是背景在动，画面主体并没有动，更像是图片转变成了一个GIF。

鲸哥尝试选“Orbit”，让镜头360度围绕着蚂蚁旋转，结果四十分钟都没有生成出来，当初说好的3D合成呢......

Sora完全吊打SV，无论是画面的精细程度，主体的运动，镜头的变换......最离谱的是，SV看看Sora生成的Minecraft吧，这才是真正的3D合成！你只动背景算什么呢？

Sora的3D合成效果（或者说物理效果）究竟是怎么来的？OpenAI在此前公布Sora的技术文档曾提到，他们发现视频模型在经过大规模训练后，会表现出许多有趣的新能力。这些能力使 Sora 能够模拟物理世界中的人、动物和环境的某些方面。

也许SV3D合成功能欠缺（也可能是服务器被挤爆）就是因为依然没有满足sacaling law法则，数据和训练未大到让模型涌现出理解物理世界的能力。

Sora的世界模仿能力也非完美，该能力的出现纯粹是规模现象，不能说明有明确的三维、物体特征，比如Sora也无法完美模拟玻璃杯破碎的过程。著名科技大拿杨立昆最近就在X平台上炮轰Sora没有前途，除非使用他提出的物理引擎。

AI视频只会越来越智能。可以想见，未来社交平台上会有大量的AI内容，届时我们所看到的一切都将变得真假难辨。

本文为转载内容，授权事宜请联系原著作权人。