界面新闻记者 |
被戏称为“女儿概念股”的信雅达(600571),在经历连续6个涨停板后,近日股价终于降温,但外界对于AI视频生成工具Pika的关注并未因此而消退。
Pika是一款在硅谷风头正盛的AI视频生成产品,其创始人郭文景(Demi Guo)是一位来自杭州的“95后”年轻女性,同时也是信雅达实控人郭华强之女。
尽管信雅达多次发布公告与Pika“划清界限”,称公司并未投资Pika,也无投资计划,但市场对Pika的信心首先反映在了信雅达的股价上。
团队仅有四个人,不到半年时间完成3轮共计5500万美元的融资,估值飙升至2.5亿美元——这组数字在凸显Pika能力的同时,也从侧面表明AI生成视频产品仍在起步阶段,需要投入大量财力进行基础训练。
此时距离ChatGPT掀起的“聊天机器人”AI风口刚满一年,相关公司之间的淘汰赛也愈发激烈。像Pika这样的初创公司到底是一时突围的幸运儿,还是能走向终点的幸存者?
小团队“大力出奇迹”
抛去A股上市公司实控人之女的身份,郭文景算是一位年轻的技术和学术人才。
她在高中时就进入国际数学奥林匹克竞赛国家集训队,并在2015年获得国际信息学奥林匹克竞赛银牌。此后从国内高中升学进入哈佛大学,在获得数学学士学位后,继续攻读计算机科学硕士学位,后转至斯坦福攻读博士学位。
Pika团队另一位联合创始人同为女性,CTO孟晨琳(Chenlin Meng)在攻读计算机博士学位期间,3年时间里发表了30多篇论文,其中,她参与创作的DDIM(去噪扩散隐模型)论文是AI生图领域的一种重要技术路线。
据《海外独角兽》报道,Pika诞生于一次“失败”的经验。2023年初,郭文景组织了一个小团队参与Runway(目前公认的AI生成视频产品领头羊)比赛,期间她发现想用AI赋能电影创作十分困难,即便几秒钟的内容也要耗费几小时。这让她看见了机会。
今年1月,郭文景产生了创业的想法。当时,Runway还未发布令外界震惊的文生视频产品Gen-1,而郭文景看到了AI视频生成技术进展迅速,“但其他人都没开始做”,即便是已有大量竞品出现的当下,行业里还有诸如流畅度、复杂性等大量问题亟待突破。瓶颈也是机会,团队因此感到兴奋。
公司另一位创始成员陈思禹(Karli Chen)是郭文景的高中同学,同样为技术出身。还有一位较晚加入的成员Matan Cohen-Grumi则是创意出身,其公开职位是创意总监。
4个人,这就是目前Pika团队所有的全职人员。还有一些兼职人员与实习生,大多是来自名校的博士与本科生,一些基础工作则采用外包形式。
Pika的第一个版本今年4月下旬就在Discord上进行了公测,7月Pika测试版在Discord正式推出服务器。11月29日,Pika1.0正式发布,用户可以在网页端排队等候测试名额。截至12月4日,Pika的Discord服务器人数已经增长到超过16万。
Pika成立以来一直在“快进”,但郭文景却在上述报道中表示,“和预期中比起来做得还不够好”。团队本来设定的激进目标是在暑假发布一个新产品,实现百万用户。
“Pika其实证明了一件很核心的事情,他们团队非常小,每个人都有很好的算法经验,同时花了很多钱在模型的训练算力支出上。这意味着(创业公司)新的范式:钱不是花在真的人身上,而是花在GPU上,GPU某种程度就是一个新的人类,它能更不知疲倦地干活,在某种特定任务上干得更有效率,但背后其实需要的是关键算法的指挥。”企业级生成式AI平台猴子无限CEO尹伯昊对界面新闻说。他认为,Pika的核心在于找到了其他竞品没有做到的关键点——让视频画面具有故事性。
他举例说,市面上其他产品是“把一个相对静态的图变得稍微动态了一点”,而Pika则是“强调让单个分镜头有更强的故事性,可能他们已然只有2-3秒。”这个关键算法不是秘密,接下来许多公司都会跟进,但Pika的壁垒在于,投入了足够多的计算资源在它上面。
多模态AI应用对于算力的需求显著高于文字,Pika将大量财力物力注入基础模型侧而非网页端,这导致其本质上更像一家典型的模型层公司,而非应用层公司。在美国风投对基础大模型投资临近关闭的当口,Pika赶上了末班车, “目前Pika的热度能否持续,要看接下来烧钱融资的情况。”一位头部厂商的云计算业务负责人告诉界面新闻。
目前,Pika用户数达到50万,每周生成数百万个视频。截至2023年11月,Pika租用了数百个量级的GPU。
3D数字内容应用平台随幻科技数字化应用业务负责人黄文迪对界面新闻表示,“AI视频生成是一项计算密集型任务,特别是当涉及到高分辨率和高质量输出时。数百量级的GPU可以支持相当数量的并发视频生成任务,这对于初创公司来说通常是足够的。”
在此前披露的采访里,郭文景称Pika有信心成为视频生成行业里技术最强的团队,现阶段第一要务就是招更多的技术人才,并在2024年推出可投入商用的产品。
要保持住领先优势,郭文景还认为,“要不断积累资源,包括用户资源、数据和GPU资源等等。”同时,在视频生成领域,审美与技术一样重要,所以团队做产品会把技术与设计能力结合,逐渐形成壁垒。
AI新战场
并非所有人都对爆火的Pika持积极态度,一位投资人便向界面新闻记者表示,Pika“有一些亮点,但也没有那么好”。公司最大的问题来自于持久性,因为有基础模型能力的大厂即将或正在输出完全同质化的产品,Pika可能被“卷死”。这也是所有小规模AI应用公司面临的生存难题。
Pika的另外两大竞品分别为Runway与Stable。Runway成立于2018年,是行业内有先发优势的公司,它在今年发布了Gen-1和Gen-2两款产品,是第一个商业化且公开的视频生成模型,可通过文本、图片和视频来进行视频生成,并可编辑。Runway产品已有付费订阅模式。
Stable指Stable Video Diffusion,它是由Stability AI开发的一款免费开源AI视频生成模型,这家公司另一个明星产品是文生图模型Stable Diffusion。
许多网友使用相同提示词或图片对三个产品进行横评,从生成视频质量来看,光大证券的一份研报总结道:Runway Gen-2、Pika测试版、Stable中,Runway明显领先,但其特色的“动态笔刷”功能还不能真正理解物品运动逻辑;而Pika测试版仅能使用提示词生成,导致视频质量和稳定性较差;Stable则无法直接由文字生成视频(需要先文生图),图片动画化的动态幅度强于Pika测试版,但可操作性和稳定性弱于Runway。
需要注意的是,11月29日新发布的Pika 1.0在多方面都有提升,并且增加了局部编辑等功能,已经可与Runway“打平”。
在商业化方面,AI视频生成还无法直接生成一部电影,但能够为电影等视频内容提供素材。短期内,AIGC可以聚焦于在某个环节内部提升工作效率,例如减少建模、渲染的工作。此外,一些对视频质量要求不高,或定制化的领域,如广告营销、自媒体、数字人直播也可让AI视频技术发挥功用。如果能在算法和研发方面持续精进,AIGC也很有希望在电影、动漫的分镜设计、镜头叙事等核心领域抢占一席之地。
该领域的竞争格局可谓百花齐放。在海外,创业公司与巨头同台竞技,国内则主要被资力雄厚的大厂占据阵地。
阿里研究院在近期推出了AI动画项目Animate Anyone,可使用一张人物静态图与一个骨骼动画生成人物动画,但还没有推出可供使用的版本。
字节跳动也发布了MagicAnimate、pixel dance产品,前者是一个基于图片生成的人像动画产品,后者则可以支持文本、图像形式生成视频,几乎与Pika同时间推出。
黄文迪表示,当阿里和字节跳动这样的大公司快速推出与Pika相似的产品时,通常会在市场上得到较快的认可,因为他们拥有丰富的数据来训练模型,以及强大的计算资源来支持模型的运行和优化。
但东吴证券研报认为,Pika爆红的意义在于,让市场认识到好的AI产品可以创造新需求:6月起ChatGPT活跃用户出现下降,但很快爆款AI生成视频应用颠覆了传统视频制作,各行各业都有望涌现出优秀AI应用。同时,爆款国产AI应用的门槛并非遥不可及,过去的应用壁垒可能会被AI应用重新颠覆重塑。Pika小团队的案例就足以说明,并非只有巨头才能做出好的AI产品。
评论