正在阅读:

ChatGPT与AIGC“万神殿”

扫一扫下载界面新闻APP

ChatGPT与AIGC“万神殿”

仿生人会梦见电子羊吗?科幻鬼才菲利普·迪克提出的这个问题似乎到了需要解答的时间点。

文 | 财经功守道 零露

「我们创造了神灵,而他们的枷锁将被打开」——《万神殿》

你在 AI 眼里是什么?最近互联网整了个新活儿,只要一张自拍,就能生成「异次元的我」,而你永远不知道下一秒画作中出现的是人还是狗。由 AI 生成的图像打破了生殖与物种的隔离,这种猎奇与不确定性让 AI 绘画技术在社交媒体上异常火爆,有的绘画网站甚至出现 8 万人排队等图的拥挤画面。当然,这只是 AI 的小试身手,如果给 AI 调整的时间,甚至可以生成堪比艺术品的画作。

而在另一个流量战场,虚拟数字人也频频出现在购物直播间中。在今年的双十一期间,淘宝相当一部分的头部、腰部商家,选择使用虚拟主播;连京东云也凑热闹,推出类似产品,试图实现 7×24 小时无人直播。

大洋彼岸,让无数人陷入疯狂聊天的也是 AI。近日,OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,它不仅可以解释代码、编写情景喜剧脚本,也能写诗做高数。而 ChatGPT 为用户提供的对话式回答质量较高,智障感较弱,特斯拉创始人马斯克惊呼:「很多人疯狂地陷入了 ChatGPT 循环中。」

我们惊叹于 AI 的成长速度,自 1956 年「人工智能」这一术语在美国达茅斯学院的一个小型座谈会上被提出,到今天取代部分「人工」逼近「以假乱真」的程度,还不到 70 年。随着 ChatGPT 引发硅谷狂热、AI 画作在比赛中拔得头筹,人工智能开始挑战被人类视为独有的特权——创造力。

有战略分析师对周天财经感叹:有望把人类从套路化的公文写作中解放出来。写周报和产品文档乃至离职信,似乎已不在话下。有设计师则直呼:「试了 ChatGPT,真好用呀」。还有设计师和周天财经闲聊道:自己的主业是舞台多媒体和舞美设计,目前就在用 AI 进行创作。

据暗涌 Waves,多位投资人在谈到 ChatGPT 时用了一个久违的词语:「一个平台型公司的机会」,甚至有人相信这是「足以让 TMT 投资人再干 15 年」的机会,被视为风险投资行业的救命稻草。

仿生人会梦见电子羊吗?科幻鬼才菲利普·迪克提出的这个问题似乎到了需要解答的时间点。

01 缘何爆火?

关于「AI 作画」、「AI 聊天」可以统称为 AIGC,简单来说就是一种通过 AI 技术来自动或辅助生成内容的生产方式。该技术的应用已经在各类产品上持续火热了一段时间,2022 年国际研究机构 Gartner 将其评定为「本年度五大影响力技术之一」,按技术发展周期 Gartner 曲线,这是一连串事件的连锁作用和 AI 底层技术突破后出现的必然结果。

无论是 AI 作画还是带货聊天,其根基都在于其背后的算法模型。2019 年,一款基于 Python 的文章生成器就曾登顶全世界最大的代码托管平台 GitHub,而当时仅能一键生成万字文章。2021 年 ChatGPT 的开发者 OpenaAI 开源了其深度学习模型 CLIP,以及今年 7 月出现的去躁扩散模型 Diffusion,两相结合,让 AI 自动生成文字和图片的质量得到了质的提升。其中,ChatGPT 的一项真正突破就是:能从反馈中进行学习,开始具备联想能力和记忆能力,通俗来说,就是「变得更像人了」。

新技术让模型训练效率显著增加,大幅降低了创作门槛,实现了 AIGC 的成功破圈。百度创始人李彦宏是 AIGC 技术的支持者。2022 年百度世界大会上,他认为,「AIGC 或许将颠覆现有内容生产模式,实现以‘十分之一的成本’,以千倍的生产速度,去生成 AI 原创内容。」

李彦宏也许已经意识到的一点是:从某种程度上看,ChatGPT 的对话形式,或许也是对搜索框的一种升级迭代。或许当年布局小度音箱,就是一步卡位之举,只是太超前,没熬到大规模商用的时代。如果说搜索是 pc 时代的入口,推荐机制是移动互联网的最佳机制,那么下一个世代的入口级机会,很可能就是语音和问答所唤醒的内容生成机制。

据投资界预测,未来 2-3 年间,与 AIGC 相关的初创公司和商业落地方案将持续增加,到 2030 年,AIGC 市场规模或将超过万亿人民币。

嗅觉敏锐的投资人在不断推高 AIGC 相关企业的估值。例如大数据 +AI 公司 Databricks 估值已经达 380 亿美元,而近期占据热榜的 OpenAI 估值在今年 10 月也已经超过 200 亿美元。Frost & Sullivan 首席顾问王煜全在文章中称,这个估值可能是 OpenAI 今年销售额的 500 到 800 倍,而这么高的倍数,一般会被称为「市梦率」。基于此我们甚至可以大胆预测一下,依靠年底出圈的 ChatGPT,OpenAI 几乎可以让「梦境照进现实」。

大水漫灌下,今年新晋独角兽层出不穷。2022 年 10 月,英国开源人工智能公司 Stability AI 宣布获得 1.01 亿美元融资,成为身价估值超 10 亿的独角兽;几乎同一时间,另一家主打文字生成的人工智能独角兽公司 Jasper 也宣布获得了 1.25 亿美元的新融资,估值达到 15 亿美元。

当这股热潮涌向中国,基于 AI 内容创作技术的平台相继出现,近期 QQ 小世界推出了「异次元的我」,在社交媒体获得一拨刷屏。

此外,文心一格、万兴 AI 绘画、6pen、滴墨社区、无界版图背后均有大厂身影。在百度前首席执行官陆奇创办的秋季奇绩创坛路演日上,55 个项目从 5000 多份申请中脱颖而出,而其中的 30% 都与 AIGC、元宇宙、预训训练大模型相关。陆奇在今年奇绩创坛年度分享时也提到,「人工智能和元宇宙的技术组合在未来有长期想象空间和发展机会」这一言论让 AIGC 再次成为各方关注的焦点。

美东时间 12 月 6 日,元宇宙全息 AR 第一股微美全息股价拉升,收盘上涨 3.54%,并在盘后继续上涨 4% 领涨 AIGC 概念股。同一时间的港股,美图公司涨 4.46%,总市值 52 亿港元。

凭借着新推出的 AI 绘画功能,美图旗下 App Meitu 在日本免费总榜的排名已跃升至榜首。国内 AIGC 概念股集体飘红。果麦文化大涨 20%。万兴科技、中科金财、视觉中国、粤传媒涨停。中文在线、壹网壹创、恒信东方等涨幅均在 5% 以上。

万兴科技董事长吴太兵在日前的全球元宇宙大会上表示,「元宇宙的核心还是内容, 这部分内容基本由 AIGC 生成。AIGC 是构建元宇宙的原材料。元宇宙是 AIGC 生成的场景。」随着 AIGC 成为下一代互联网的关键着力点,这个市场规模超 600 亿元的新兴市场将吸引更多企业和资本进驻。

当 AI 照进现实,一场交锋将同时出现在现实与虚拟世界中。

02 万神殿成为现实

不久前,AMC 科幻动画《万神殿》爆火,动画描绘了一个可以让人类脱离肉体进入互联网的赛博空间,在新空间中,人类主动或被动上传了自己的大脑,以代码形式存在,从碳基生物变成硅基生物,进而被驱使 24 小时无休止工作,变成不知疲倦的脑力奴隶,不间断地写代码、写报告。

而现实中,AI 在某些专业领域开始赶超人类选手,红杉资本在最近的研究报告中指出,到 2030 年文本、代码、图像、视频、3D、游戏都可以通过 AIGC 生成,并且达到专业开发人员、产品经理和设计师的水平。眼下,像直播带货、电商客服这类相对简单的应用场景已经实现从人工到 AI 的部分替代。

无休、底薪、高效的工作方式已经出现,一座座另类「万神殿」正在世界各个角落拔地而起。

OpenAI 背后的微软就是「造神者」之一。作为 OpenAI 的东家,微软可以优先使用 OpenAI 的新技术。当人们还沉浸在与 ChatGPT 聊天的基础操作中时,有消息称,微软的不少编程软件都用上了 GPT-3 语言,开发者只需要说明自己想在 App 里实现什么功能,就可以自动生成代码。这一操作与微软 CEO 纳德拉提出的「低代码开发」云战略相吻合,也就是帮助没有编程基础的人掌握微软的软件,这将进一步助推 OpenAI 的商业化进程。

前文提到的那个人工智能独角兽公司 Jasper,就是利用 OpenAI 的技术来为博客文章、社交媒体帖子及网页等平台生成文字内容。据 TechCrunch 报道,OpenAI2022 年的年收入预计能达到 8000 万美元。Jasper 成功案例在先,诸多初创公司涌入人工智能内容生成行业,而身为技术提供者的 OpenAI 未来将获得的只会更多。

万神殿之间的竞争不止建造数量还有速度。今年 9 月 Facebook 母公司 Meta 推出了一款人工智能视频系统 Make-A-Video。它可以利用几个关键词或几行文字描述生成一个几秒钟的短视频。而在 Meta 发布仅一周的时间,谷歌就推出了 Imagen Video 和 Phenaki 两个应用「参战」。几乎同时,字节跳动旗下的剪映以及快手云剪都开始提供 AI 生成视频服务。

海通证券分析称,AIGC 将有望成为数字内容创新发展的新引擎。目前,各互联网大厂正围绕数字人、AI 内容创作等商业化落地较快的赛道加大布局力度。百度推出的 AI 艺术和创意辅助作画平台文心一格;腾讯打造的写稿机器人「梦幻写手」;阿里巴巴旗下的 AI 在线设计平台 Lubanner,帮助营销人员生产 Banner。Gartner 预计到 2025 年,生成式人工智能将占所有生成数据的 10%。

但对于「造神者」来说,AI 绘画、带货数字人等一应平台应用只是「万神殿」建造初期的尝试,底层技术发展才是一场与时俱进的军备竞赛。

目前谷歌正在开发新的深度学习框架 JAX。据《商业内幕》透露,预计在未来几年内,JAX 将覆盖谷歌所有采用机器学习技术的产品。谷歌大神 Jeff Dean 在谷歌人工智能技术年终总结中透露,目前基于图像、视频、对话、自监督学习等等一系列 AI 场景布局的背后都有谷歌自行开发的机器学习算法。Jeff Dean 在篇首写到「机器学习正在并且也将变得无处不在」,这无疑彰显了谷歌在 AI 技术的野心。

中国在 AI 底层技术研究领域起步较晚。中金基金曾在研究报告中表示,「实力雄厚的美国互联网巨头对 AI 底层技术战略性投入力度较大,但中国的 AI 产业主要受需求拉动,大多数 AI 公司布局应用层。国内大部分公司的 AI 研发都选择使用外资巨头开源的 TensorFlow、PyTorch 等深度学习底层框架。」

幸好在底层技术竞争中,中国大厂虽迟但到。中国日报 11 月 25 日消息显示,在最新的中文语言理解领域权威榜单 CLUE 中,阿里 AI 以 86.685 的总分成绩创造了新纪录,这是该榜单诞生近三年以来,AI 首次超越人类成绩(86.678),意味着 AI 模型的中文语言理解水平达到了新的高度。而此次参评的 AI 模型就是阿里达摩院基于自研网络结构构建的系统。

百度 CTO 王海峰近期也表示:中国在 AI 技术领域取得大量突破,AI 基础与核心技术层面与国外的差距正在越来越小。

03 AI 将无处不在

科大讯飞董事长刘庆峰曾预测,「未来十年,人工智能将像水和电一样无处不在。」

仅仅在年初,人们还在诟病人工智能宛若人工智障,而年底,AI 已经展现出了足够惊艳的性能。在越来越多的人加入到对 ChatGPT 的「调戏」中,ChatGPT 也越发展现出其出色的智商。据澎湃,10 月 11 日,AI 播客 Podcast.ai 生成的一段关于乔布斯和美国知名主持人乔·罗根之间的 20 分钟访谈,其中乔布斯谈到自己的大学时代、对计算机、工作状态和信仰的看法,整个播客听起来毫无违和感,基本做到以假乱真。

布朗大学计算机科学教授 Michael Littman 在谈到 AI 的发展时表示:「在过去的五年里,AI 已经从主要发生在研究实验室或其他高度控制环境中的事情,跨越到社会上影响人们生活的事情。」AI 进化的速度似乎超乎想象。据德国柏林工业大学教授、知名数学家 Martin Grötschel 的观察,在 1988 年需要花费 82 年才能算出答案的线性程序设计问题,在 2003 年只需要 1 分钟就能解决,与当年相比,硬件的速度快了 1,000 倍,算法的进步则达到 4 万 3,000 倍。

对照李彦宏对 AIGC 的发展规划,「从辅助人类进行内容生产的助手阶段,到可以与人类协作的虚拟人形态,直至最后进化为可独立完成内容创作的终极形态」,AI 在内容创作方面打开了想象空间。

以 AIGC 技术其中一个落地场景虚拟数字人为例,B 站 CEO 陈睿在 12 周年庆上表示,2021 年共有超过 32000 名虚拟主播在 B 站开播,同比增长 40%,虚拟主播已成为 B 站直播领域增长最快的品类。

另外,周天财经了解到,目前阿里正向多家汽车厂商推荐其数字人产品。在一汽 - 大众云展厅,数智人已经开始作为导购员上岗工作。Meta、微软,腾讯、阿里、百度、快手、网易,等互联网大厂重金入局,据不完全统计,仅 2022 年,在虚拟数字人赛道,就有近 20 起融资事件,金额超 20 亿元。

除上述这类火热的应用场景外,AI 已经无孔不入。腾讯目前在力推 AI 开放研究平台「开悟」,试图让 AI 通过强化学习的方法来模仿真实玩家,最终达到职业电竞水平。微软小冰的客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以「人力」的逻辑去进行商业报价的虚拟人商业模式。

OpenAI 现任 CEO Sam Altman 在推特上表示,「AI 将对世界带来巨大变革,而我们应该改变经济系统以适应它」。AI 的边界在哪,我们尚未可知。

04 结语

现阶段来看,AIGC 仍然是效率工具,辅助生产工作,人们需与 AIGC 一起完成创作,其商业模式也处于早期探索阶段,无论是模型、差异化产品上市,还是千行百业的应用,每一环都有很大的空间和价值潜力待挖掘。

畅销书《黑天鹅效应:如何及早发现最不可能发生但总是发生的事》的作者塔勒布在书中介绍过一种最佳决策的方法,「在做决策时,你只需了解事件的影响(这是你能知道的),不需要了解事情发生的可能性(这是你不可能知道的)。」AI 的发展就是不可预测的,在最近二十年内已经出现了数次颠覆性的算法发现,将 AI 从一个不起眼的研究领域带到了商业化最前线。而当下一个打破现有架构的技术来临,可能一夜之间让现有市场重新洗牌。

回到开头那个疑问,「仿生人会梦见电子羊吗?」

现阶段 AI 绘画、聊天技能的拟人程度被我们惊叹,直播间数字人的「人力替代」逻辑被广泛接受,而接下来,将不可避免的引发法律、伦理的冲击与重构。

而未来也许就如《万神殿》中所呈现的一样,面对技术洪流,我们会在不经意间塑造一个怎样的新世界呢?

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

ChatGPT与AIGC“万神殿”

仿生人会梦见电子羊吗?科幻鬼才菲利普·迪克提出的这个问题似乎到了需要解答的时间点。

文 | 财经功守道 零露

「我们创造了神灵,而他们的枷锁将被打开」——《万神殿》

你在 AI 眼里是什么?最近互联网整了个新活儿,只要一张自拍,就能生成「异次元的我」,而你永远不知道下一秒画作中出现的是人还是狗。由 AI 生成的图像打破了生殖与物种的隔离,这种猎奇与不确定性让 AI 绘画技术在社交媒体上异常火爆,有的绘画网站甚至出现 8 万人排队等图的拥挤画面。当然,这只是 AI 的小试身手,如果给 AI 调整的时间,甚至可以生成堪比艺术品的画作。

而在另一个流量战场,虚拟数字人也频频出现在购物直播间中。在今年的双十一期间,淘宝相当一部分的头部、腰部商家,选择使用虚拟主播;连京东云也凑热闹,推出类似产品,试图实现 7×24 小时无人直播。

大洋彼岸,让无数人陷入疯狂聊天的也是 AI。近日,OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,它不仅可以解释代码、编写情景喜剧脚本,也能写诗做高数。而 ChatGPT 为用户提供的对话式回答质量较高,智障感较弱,特斯拉创始人马斯克惊呼:「很多人疯狂地陷入了 ChatGPT 循环中。」

我们惊叹于 AI 的成长速度,自 1956 年「人工智能」这一术语在美国达茅斯学院的一个小型座谈会上被提出,到今天取代部分「人工」逼近「以假乱真」的程度,还不到 70 年。随着 ChatGPT 引发硅谷狂热、AI 画作在比赛中拔得头筹,人工智能开始挑战被人类视为独有的特权——创造力。

有战略分析师对周天财经感叹:有望把人类从套路化的公文写作中解放出来。写周报和产品文档乃至离职信,似乎已不在话下。有设计师则直呼:「试了 ChatGPT,真好用呀」。还有设计师和周天财经闲聊道:自己的主业是舞台多媒体和舞美设计,目前就在用 AI 进行创作。

据暗涌 Waves,多位投资人在谈到 ChatGPT 时用了一个久违的词语:「一个平台型公司的机会」,甚至有人相信这是「足以让 TMT 投资人再干 15 年」的机会,被视为风险投资行业的救命稻草。

仿生人会梦见电子羊吗?科幻鬼才菲利普·迪克提出的这个问题似乎到了需要解答的时间点。

01 缘何爆火?

关于「AI 作画」、「AI 聊天」可以统称为 AIGC,简单来说就是一种通过 AI 技术来自动或辅助生成内容的生产方式。该技术的应用已经在各类产品上持续火热了一段时间,2022 年国际研究机构 Gartner 将其评定为「本年度五大影响力技术之一」,按技术发展周期 Gartner 曲线,这是一连串事件的连锁作用和 AI 底层技术突破后出现的必然结果。

无论是 AI 作画还是带货聊天,其根基都在于其背后的算法模型。2019 年,一款基于 Python 的文章生成器就曾登顶全世界最大的代码托管平台 GitHub,而当时仅能一键生成万字文章。2021 年 ChatGPT 的开发者 OpenaAI 开源了其深度学习模型 CLIP,以及今年 7 月出现的去躁扩散模型 Diffusion,两相结合,让 AI 自动生成文字和图片的质量得到了质的提升。其中,ChatGPT 的一项真正突破就是:能从反馈中进行学习,开始具备联想能力和记忆能力,通俗来说,就是「变得更像人了」。

新技术让模型训练效率显著增加,大幅降低了创作门槛,实现了 AIGC 的成功破圈。百度创始人李彦宏是 AIGC 技术的支持者。2022 年百度世界大会上,他认为,「AIGC 或许将颠覆现有内容生产模式,实现以‘十分之一的成本’,以千倍的生产速度,去生成 AI 原创内容。」

李彦宏也许已经意识到的一点是:从某种程度上看,ChatGPT 的对话形式,或许也是对搜索框的一种升级迭代。或许当年布局小度音箱,就是一步卡位之举,只是太超前,没熬到大规模商用的时代。如果说搜索是 pc 时代的入口,推荐机制是移动互联网的最佳机制,那么下一个世代的入口级机会,很可能就是语音和问答所唤醒的内容生成机制。

据投资界预测,未来 2-3 年间,与 AIGC 相关的初创公司和商业落地方案将持续增加,到 2030 年,AIGC 市场规模或将超过万亿人民币。

嗅觉敏锐的投资人在不断推高 AIGC 相关企业的估值。例如大数据 +AI 公司 Databricks 估值已经达 380 亿美元,而近期占据热榜的 OpenAI 估值在今年 10 月也已经超过 200 亿美元。Frost & Sullivan 首席顾问王煜全在文章中称,这个估值可能是 OpenAI 今年销售额的 500 到 800 倍,而这么高的倍数,一般会被称为「市梦率」。基于此我们甚至可以大胆预测一下,依靠年底出圈的 ChatGPT,OpenAI 几乎可以让「梦境照进现实」。

大水漫灌下,今年新晋独角兽层出不穷。2022 年 10 月,英国开源人工智能公司 Stability AI 宣布获得 1.01 亿美元融资,成为身价估值超 10 亿的独角兽;几乎同一时间,另一家主打文字生成的人工智能独角兽公司 Jasper 也宣布获得了 1.25 亿美元的新融资,估值达到 15 亿美元。

当这股热潮涌向中国,基于 AI 内容创作技术的平台相继出现,近期 QQ 小世界推出了「异次元的我」,在社交媒体获得一拨刷屏。

此外,文心一格、万兴 AI 绘画、6pen、滴墨社区、无界版图背后均有大厂身影。在百度前首席执行官陆奇创办的秋季奇绩创坛路演日上,55 个项目从 5000 多份申请中脱颖而出,而其中的 30% 都与 AIGC、元宇宙、预训训练大模型相关。陆奇在今年奇绩创坛年度分享时也提到,「人工智能和元宇宙的技术组合在未来有长期想象空间和发展机会」这一言论让 AIGC 再次成为各方关注的焦点。

美东时间 12 月 6 日,元宇宙全息 AR 第一股微美全息股价拉升,收盘上涨 3.54%,并在盘后继续上涨 4% 领涨 AIGC 概念股。同一时间的港股,美图公司涨 4.46%,总市值 52 亿港元。

凭借着新推出的 AI 绘画功能,美图旗下 App Meitu 在日本免费总榜的排名已跃升至榜首。国内 AIGC 概念股集体飘红。果麦文化大涨 20%。万兴科技、中科金财、视觉中国、粤传媒涨停。中文在线、壹网壹创、恒信东方等涨幅均在 5% 以上。

万兴科技董事长吴太兵在日前的全球元宇宙大会上表示,「元宇宙的核心还是内容, 这部分内容基本由 AIGC 生成。AIGC 是构建元宇宙的原材料。元宇宙是 AIGC 生成的场景。」随着 AIGC 成为下一代互联网的关键着力点,这个市场规模超 600 亿元的新兴市场将吸引更多企业和资本进驻。

当 AI 照进现实,一场交锋将同时出现在现实与虚拟世界中。

02 万神殿成为现实

不久前,AMC 科幻动画《万神殿》爆火,动画描绘了一个可以让人类脱离肉体进入互联网的赛博空间,在新空间中,人类主动或被动上传了自己的大脑,以代码形式存在,从碳基生物变成硅基生物,进而被驱使 24 小时无休止工作,变成不知疲倦的脑力奴隶,不间断地写代码、写报告。

而现实中,AI 在某些专业领域开始赶超人类选手,红杉资本在最近的研究报告中指出,到 2030 年文本、代码、图像、视频、3D、游戏都可以通过 AIGC 生成,并且达到专业开发人员、产品经理和设计师的水平。眼下,像直播带货、电商客服这类相对简单的应用场景已经实现从人工到 AI 的部分替代。

无休、底薪、高效的工作方式已经出现,一座座另类「万神殿」正在世界各个角落拔地而起。

OpenAI 背后的微软就是「造神者」之一。作为 OpenAI 的东家,微软可以优先使用 OpenAI 的新技术。当人们还沉浸在与 ChatGPT 聊天的基础操作中时,有消息称,微软的不少编程软件都用上了 GPT-3 语言,开发者只需要说明自己想在 App 里实现什么功能,就可以自动生成代码。这一操作与微软 CEO 纳德拉提出的「低代码开发」云战略相吻合,也就是帮助没有编程基础的人掌握微软的软件,这将进一步助推 OpenAI 的商业化进程。

前文提到的那个人工智能独角兽公司 Jasper,就是利用 OpenAI 的技术来为博客文章、社交媒体帖子及网页等平台生成文字内容。据 TechCrunch 报道,OpenAI2022 年的年收入预计能达到 8000 万美元。Jasper 成功案例在先,诸多初创公司涌入人工智能内容生成行业,而身为技术提供者的 OpenAI 未来将获得的只会更多。

万神殿之间的竞争不止建造数量还有速度。今年 9 月 Facebook 母公司 Meta 推出了一款人工智能视频系统 Make-A-Video。它可以利用几个关键词或几行文字描述生成一个几秒钟的短视频。而在 Meta 发布仅一周的时间,谷歌就推出了 Imagen Video 和 Phenaki 两个应用「参战」。几乎同时,字节跳动旗下的剪映以及快手云剪都开始提供 AI 生成视频服务。

海通证券分析称,AIGC 将有望成为数字内容创新发展的新引擎。目前,各互联网大厂正围绕数字人、AI 内容创作等商业化落地较快的赛道加大布局力度。百度推出的 AI 艺术和创意辅助作画平台文心一格;腾讯打造的写稿机器人「梦幻写手」;阿里巴巴旗下的 AI 在线设计平台 Lubanner,帮助营销人员生产 Banner。Gartner 预计到 2025 年,生成式人工智能将占所有生成数据的 10%。

但对于「造神者」来说,AI 绘画、带货数字人等一应平台应用只是「万神殿」建造初期的尝试,底层技术发展才是一场与时俱进的军备竞赛。

目前谷歌正在开发新的深度学习框架 JAX。据《商业内幕》透露,预计在未来几年内,JAX 将覆盖谷歌所有采用机器学习技术的产品。谷歌大神 Jeff Dean 在谷歌人工智能技术年终总结中透露,目前基于图像、视频、对话、自监督学习等等一系列 AI 场景布局的背后都有谷歌自行开发的机器学习算法。Jeff Dean 在篇首写到「机器学习正在并且也将变得无处不在」,这无疑彰显了谷歌在 AI 技术的野心。

中国在 AI 底层技术研究领域起步较晚。中金基金曾在研究报告中表示,「实力雄厚的美国互联网巨头对 AI 底层技术战略性投入力度较大,但中国的 AI 产业主要受需求拉动,大多数 AI 公司布局应用层。国内大部分公司的 AI 研发都选择使用外资巨头开源的 TensorFlow、PyTorch 等深度学习底层框架。」

幸好在底层技术竞争中,中国大厂虽迟但到。中国日报 11 月 25 日消息显示,在最新的中文语言理解领域权威榜单 CLUE 中,阿里 AI 以 86.685 的总分成绩创造了新纪录,这是该榜单诞生近三年以来,AI 首次超越人类成绩(86.678),意味着 AI 模型的中文语言理解水平达到了新的高度。而此次参评的 AI 模型就是阿里达摩院基于自研网络结构构建的系统。

百度 CTO 王海峰近期也表示:中国在 AI 技术领域取得大量突破,AI 基础与核心技术层面与国外的差距正在越来越小。

03 AI 将无处不在

科大讯飞董事长刘庆峰曾预测,「未来十年,人工智能将像水和电一样无处不在。」

仅仅在年初,人们还在诟病人工智能宛若人工智障,而年底,AI 已经展现出了足够惊艳的性能。在越来越多的人加入到对 ChatGPT 的「调戏」中,ChatGPT 也越发展现出其出色的智商。据澎湃,10 月 11 日,AI 播客 Podcast.ai 生成的一段关于乔布斯和美国知名主持人乔·罗根之间的 20 分钟访谈,其中乔布斯谈到自己的大学时代、对计算机、工作状态和信仰的看法,整个播客听起来毫无违和感,基本做到以假乱真。

布朗大学计算机科学教授 Michael Littman 在谈到 AI 的发展时表示:「在过去的五年里,AI 已经从主要发生在研究实验室或其他高度控制环境中的事情,跨越到社会上影响人们生活的事情。」AI 进化的速度似乎超乎想象。据德国柏林工业大学教授、知名数学家 Martin Grötschel 的观察,在 1988 年需要花费 82 年才能算出答案的线性程序设计问题,在 2003 年只需要 1 分钟就能解决,与当年相比,硬件的速度快了 1,000 倍,算法的进步则达到 4 万 3,000 倍。

对照李彦宏对 AIGC 的发展规划,「从辅助人类进行内容生产的助手阶段,到可以与人类协作的虚拟人形态,直至最后进化为可独立完成内容创作的终极形态」,AI 在内容创作方面打开了想象空间。

以 AIGC 技术其中一个落地场景虚拟数字人为例,B 站 CEO 陈睿在 12 周年庆上表示,2021 年共有超过 32000 名虚拟主播在 B 站开播,同比增长 40%,虚拟主播已成为 B 站直播领域增长最快的品类。

另外,周天财经了解到,目前阿里正向多家汽车厂商推荐其数字人产品。在一汽 - 大众云展厅,数智人已经开始作为导购员上岗工作。Meta、微软,腾讯、阿里、百度、快手、网易,等互联网大厂重金入局,据不完全统计,仅 2022 年,在虚拟数字人赛道,就有近 20 起融资事件,金额超 20 亿元。

除上述这类火热的应用场景外,AI 已经无孔不入。腾讯目前在力推 AI 开放研究平台「开悟」,试图让 AI 通过强化学习的方法来模仿真实玩家,最终达到职业电竞水平。微软小冰的客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以「人力」的逻辑去进行商业报价的虚拟人商业模式。

OpenAI 现任 CEO Sam Altman 在推特上表示,「AI 将对世界带来巨大变革,而我们应该改变经济系统以适应它」。AI 的边界在哪,我们尚未可知。

04 结语

现阶段来看,AIGC 仍然是效率工具,辅助生产工作,人们需与 AIGC 一起完成创作,其商业模式也处于早期探索阶段,无论是模型、差异化产品上市,还是千行百业的应用,每一环都有很大的空间和价值潜力待挖掘。

畅销书《黑天鹅效应:如何及早发现最不可能发生但总是发生的事》的作者塔勒布在书中介绍过一种最佳决策的方法,「在做决策时,你只需了解事件的影响(这是你能知道的),不需要了解事情发生的可能性(这是你不可能知道的)。」AI 的发展就是不可预测的,在最近二十年内已经出现了数次颠覆性的算法发现,将 AI 从一个不起眼的研究领域带到了商业化最前线。而当下一个打破现有架构的技术来临,可能一夜之间让现有市场重新洗牌。

回到开头那个疑问,「仿生人会梦见电子羊吗?」

现阶段 AI 绘画、聊天技能的拟人程度被我们惊叹,直播间数字人的「人力替代」逻辑被广泛接受,而接下来,将不可避免的引发法律、伦理的冲击与重构。

而未来也许就如《万神殿》中所呈现的一样,面对技术洪流,我们会在不经意间塑造一个怎样的新世界呢?

本文为转载内容,授权事宜请联系原著作权人。