文 | 吴怼怼 斯维奇
编辑 | 吴怼怼
在常见的招聘软件上搜索带货主播职位,会发现一部分薪资已经悄无声息地落回了四位数。
直播间依旧火热,动辄百亿销售额、上亿人次观看量的情势并没有发生变化,但主播的薪资却回落了。一个24小时不休息,面容姣好,口条顺,业务精,工资还远低于真人主播的劳动力逐渐成为一些小商家的心头好。
水温的变化,在22年8月就已经开始。
这期间,乐华娱乐的CEO杜华制作了自己的数字人分身“华华子”在抖音直播带货,演员任泉也发布了自己的数字人视频与抖音的观众分享,淘宝、抖音、视频号也崛起了一批质量参差不齐的带货主播与个人IP账号。
数字人的技术逐渐成熟并普及,首先在电商领域造成冲击,二流带货主播,一夜失业。
当AIGC风潮进一步助推直播市场热潮,互联网巨头也相继推出数字人服务,中小商家选择数字人主播以降低成本,似乎风景一变。但在鱼龙混杂的时代里,一切现象都仍需观察。
01 “每一家直播带货都需要一个数字人”
不仅是各大短视频平台和电商平台,在微信视频号,在政务大厅,都有数字人的存在。
直播前期投入大,风险高,一些有带货需求的小商家就会转向虚拟数字人。
对于小商家而言,考虑虚拟数字人的原因首先是优秀的主播数量少,稳定性欠缺。
在直播火热的时候,一个形象气质俱佳、专业能力过硬的主播常常被挖来挖去,既拉高了行业的薪资预期,也让直播的稳定性受到影响。
其次,实地直播成本高,曝光效率低。小商家知名度低、商单少,就更加需要通过更长的直播时间增加曝光,有时需要做到24小时全天直播。
然而整个运营团队跟着主播三班倒,全天候运营难度大不说,直播场地、摄影灯光设备、场控、直播助理、后端、客服、化妆师也样样要钱,而且也并不保证时时刻刻都有人看。闲时流量转化率低,但却食之无味弃之可惜。
选择虚拟数字人,商家们算的是一笔经济账。
对于希望快速提高个人IP知名度的个人,多平台、注册多个账号、高频率更新视频是一大实现途径。
但传统短视频的制作过程常常耗费大量时间和精力。从准备素材、起草文案,到规划分镜并添加视觉与音效元素,再到反复调整直至达到最佳效果,一个简单视频的制作往往需要耗费良久,如若要保证每日更新,拍摄素材量也需要跟上。即使拍摄团队都就位,本人也可能琐事缠身,分身乏术。
虚拟数字人也提供了连轴转之外的选择。一旦根据本人的视频克隆出自己的数字人分身,生成数字人的视频几乎就是点点鼠标的事情。通过书写简短的文字或语音内容,即可驱动数字人进行口头表达。
一些视频号、抖音博主利用数字人打造个人IP矩阵,能够实现短时间的大量曝光,更有甚者有“一夜爆红”的案例。
于政府、银行、网络运营商,数字人也有发挥作用的空间。消费和出行复苏后,文旅部门于旅行公司一起宣传景区,介绍当地特色衣食住行,快速输出短视频内容,数字人也能助力政府部门降本增效。
一些明星也选择制作属于自己的数字人分身,尽管不一定有借此进一步的曝光需要,更没有带货需求,但踩在时代浪花之上总会给人建立一种高瞻远瞩的印象。
02 入局者众,水平参差
在中国,AI数字人公司如雨后春笋般涌现,互联网巨头也纷纷涉足其中。市场上出现了众多数字人服务,腾讯云、阿里、京东、百度、科大讯飞、微软都相继推出AI电商产品,智能化助力商家自播。商汤、硅基智能、风平智能、闪剪、奇妙元、元分身等中小型公司更是数不胜数。
面向C端用户的Heygen为个人用户提供了数字人制作的机会,按分钟计费,也降低了入场门槛。功能强大,拥有数百种成熟完善的公模,搭配几十种世界语言,可以通过商品链接自动生成带货视频,完成度极高几乎不需要任何改动,简直是为跨境电商而生。
一方面是高歌猛进的集体繁荣,当我们比对半年来的数字人变化,会讶异技术的日新月异。另一方面是服务的良莠不齐和消费者们并不完全买单的不虞之事。
首先是在不同的应用场景中,数字人表现有别。
体验型产品无法通过数字人来展示,如服装类和珠宝类直播需要主播真人亲自穿戴,版型是否合身,材质是否亲肤,都需要通过实际展示,这也是直播的题中之义。而母婴类和科技类的商品则需要更专业的呈现方式来提高可信度,建立和消费者的信任关系,数字人尚且还不能做到。
其次是“似真非真”的尴尬。
尽管在直播过程中,数字人可以点对点欢迎、感谢活跃用户、感谢刷礼物用户,甚至普遍性地能根据预设关键词自动回复,在短时间内难辨真假,但与真人相比,它们的交互性仍显不足。
人们甚至会感觉这种“像真人却不真实”的效果,产生所谓的「恐怖谷效应」。
「恐怖谷效应」是指在制作仿真人类外貌和行为的机器人或数字人时,人类会在其逼真程度达到一定阶段时感到反感或恐惧,而不是产生亲近感。这个概念最早由日本机器人学家与作家森俊男于1970年代提出,用以描述当机器人越来越像人类时,人类的情感反应出现突然的下降,然后随着机器人更加逼真而再次上升。
当虚拟数字人的外貌和行为越来越接近真人,但仍然有一些微小差异,这种差异会让人感到反感或不自在,因为它们接近真实但又不完全相同。有时直播间的观众看了半个小时,突然发现原来主播并不是真人,会有人产生不适的感觉。
迭代快,技术复杂,资源消耗大,发展不平衡,信息不透明,都直接或间接地导致这个行业鱼龙混杂。有的数字人真假莫辨,有的只是“可动照片”,动动口型,表情非常不自然。
数字人的制作涉及到多个技术领域,包括计算机图形学、人工智能、机器学习等。不同技术的复杂度和成熟度不同,可能导致一些团队在某些方面取得突出成果,而在其他方面表现较差。
此外,数字人的质量和逼真程度通常依赖于大量的训练数据和计算资源。一些大型科技公司可能有更多的资源用于数据采集、模型训练和优化,从而能够创造更高水平的数字人。相比之下,小型公司或团队可能受限于资源,也会导致数字人的质量较低。
03 悬在我们头顶的达摩克利斯之剑
即使在鱼龙混杂的市场中选择了适合而满意的服务,在数字人的发展道路上,依然有一个绕不开的问题,即虚拟数字人的版权归属。
数字人的生成通常依赖于真人提供的图像、声音和动作数据。一旦数字人生成后,可能会引发有关版权和知识产权的争议。谁拥有生成数字人所需的原始数据的权利?谁有权决定数字人的使用和分发?这些问题可能引发法律纠纷和知识产权争议。
更早以前的虚拟人,以超现实或2D的形象存在,如在抖音上爆火的虚拟美妆达人柳夜熙,或者是依赖中之人配音的Vtuber绊爱,他们和现实世界的人的联系其实并没有那么紧密。
数字人是基于真人视频、动作捕捉、语音识别等技术生成的,必然建立在真人模型之上。即使存在由多个人面部特征组合的合成人,并不直接与任何另一个现实中存在的人相同,也依然需要这个基础。然而,一旦数字人生成后,它们与原始人的联系逐渐淡化,可以脱离原始人的行动,数字人能根据输入的文案自动生成视频。
商家购买的实际上是一次克隆自己的机会,在提供自己数分钟的口述视频后,基于视频中的动作、发音、表情,捕捉特征并生成一个高度近似本人的数字分身。
方便起见,一些小商家会选择自己的脸作为数字人的形象,即使是员工,也可能是持有公司股权的员工。如果实在其貌不扬,也能够选择将美颜功能拉满,依然还算看得过去。即使为形象业务俱佳的主播制作了数字人分身,离职后要么不允许商家继续使用,要么还是长期支付使用费用。
而前面提到的合成人形象虽然不存在版权问题,但在一些平台,“公模”可以用于制作短视频,但用于直播会被封号。所谓“公模”,就是数字人企业制作的合成人形象,一般会同时送给多个客户共同使用。
由于数字人可以根据预设的文案自动生成内容,它们有可能被用来传播虚假信息、造谣传谣或进行欺骗。数字人的逼真外表和语音可能让人难以分辨真伪。虽然商家都或多或少以营利为目的使用数字人,在平台的监管下不必自掘坟墓,但是一个顶着真人外表却无法直接追溯到具体的人的发言始终存在这样的风险。
今年五月初,抖音发布了关于人工智能生成内容的平台规范和行业倡议,倡议提到虚拟人背后的真人使用者,必须进行实名注册和认证。其直播时,必须由真人驱动进行实时互动,不允许完全由人工智能驱动进行互动。此外,发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景。
AI数字人的繁荣不禁让人想到《黑镜》第六季第一集「Joan is Awful」,故事讲述一位平凡的女子Joan意外发现自己的人生被翻拍成影集,在流媒体平台上上演,由好莱坞大牌明星Salma Hayek挑大梁主演。Joan的生活与剧集几乎同步进行,日常琐事、晦暗的人生秘密都在屏幕上任人欣赏,而需要数月的时间拍摄的高质量剧集通过AI数字人形象生成,能够在极短的时间内送到观众面前。
当Joan的生活被公开,她丢了工作和未婚夫,咨询律师无果,决定采取极端措施宣泄自己的情绪。她去举办婚礼的教堂现场大便,至少能够摧毁剧中演员的生活。如此不雅的行为让主演Salma Hayek找上门,但即使是演员本人也没有话语权,内容生产公司签订的协议使之完全自由使用她的数字虚拟形象生成内容。演员无权停播这个节目,也无法控制自己的数字人形象在剧中的行为,因此两人协商去砸毁量子计算机,为这个故事画上句号。
剧中Streamberry公司创造的量子计算机,它能根据现实影像资料生成虛拟世界影像,并且完成整个虛拟世界节目的拍摄、包装、剪辑。公司借助数字人形象完全让电脑生成内容,这种方式能够降低传统剧集拍摄成本,显著提高内容生产效率。剧中这台计算机确实被砸坏了,但与之相近的运作方式却正在我们身边发生。
一个真假难辨的数字形象,使用权却不完全掌握在自己手中,一旦其行动脱离自己掌控,后果将不堪设想,身份认同、行为掌控、个人隐私、伦理和道德考量乃至于技术与人性的冲突,种种问题都会逐一浮现。
AI数字人产业繁荣的同时,我们也须时刻铭记悬在我们头顶的达摩克利斯之剑。
评论