文|真故研究室 郑思芳
编辑|龚 正
输入一句话,AI就能为有志于从事艺术创作的任何人,生成一幅创意画作,不管创作者此前是否接受过专业的艺术训练。
近两年,海外用户借助Disco Diffusion、MidJourney等AI绘画软件来进行艺术创作,逐渐成为一种风潮。在国内,也有了诸如百度文心一格、TIAMAT等这类适用于中文描述语输入、更能理解中国文化审美的AI艺术和创意辅助平台诞生。
对专业者而言,这类AI绘画辅助工具是一个很好的创意助手。而一些素人则利用这些工具,发展出了自己的斜杆事业,在抖音上做壁纸号,在闲鱼上卖描述语,有的还将自己的作品卖给了包装厂或数字藏品业者,赚到些许零花钱。
01 AI式创作自由
吴先生本职工作是一位医生,他爱玩抖音,闲暇之时常想着在抖音上做点什么来挣钱。
2个月前,他看到不少创作者在抖音上做壁纸号,也就是创作者会发布一些好看的照片或图片,用户可以下载拿去当电脑或手机桌面。下载时用户需要看一段平台广告,创作者则能从广告播放中获得平台分成。
据吴先生的观察,壁纸号圈仍属小众,但圈中也有2、30万粉丝的创作者,通过向用户输送风景、人物、汽车等这类美照,月入上万。
吴先生本身是风景照爱好者,也想做一个风景类的壁纸号,但苦于没有多少素材。正发愁时,他接触到了AI绘画,发现只需要在AI绘画软件里输入相关描述语,就能生成好看的图片,这解决了他素材缺乏的难题。
吴先生下载了两款海外的AI绘画产品,一款是Disco Diffusion,一款是MidJourney,在抖音上注册了一个账号,名为“AI美图”,便开始作画。
Disco Diffusion每天有3小时可免费使用,MidJourney吴先生则充了会员费,每月30美元。每张图平均几分钟就能生成的创作效率,足以支撑起吴先生做账号的素材需要。
在吴先生看来,这两款软件擅长的重点各有不同。Disco Diffusion擅长画场景,MidJourney擅长画人物或动物之类的近景。
图 | 吴先生创作的作品,描述语有梦月(Dream moon)、银河(Milky Way)、夜空下的空中花园(hanging garden under night sky)、魔力(magic)、光(light),此图已获创作者授权发布。
在有了这两款软件的加持后,身为医生的吴先生实现了创作自由。
他通过输入各种描述语,来不断试错,一天能够发布7到8张作品。虽然后来吴先生发现,因为用户圈子太小,并不需要每日在抖音上传这么多。
更难能可贵的是,虽然没有艺术积淀,但并不妨碍吴先生创作出可卖出价格的作品。
据介绍,吴先生创作的一幅赛博朋克机器人,其背后的描述语,被一位从事数字藏品交易的人士以数十元价格买去,这让吴先生惊讶不已。
尔后,这位人士又请吴先生创作了一组十二生肖图片,用作数字藏品开发。吴先生用AI为每组生肖创作了3张图片备选,最后这一组图片背后的描述语,以数百元的价格售出。
这给了吴先生以启发。由于吴先生的抖音号粉丝才200多人,难以通过广告分成的方式挣到钱,他索性决定专门去卖描述语。
百条描述语标价20元,拿到抖音、闲鱼上去卖,有印刷商前来购买,这形成了吴先生的零花钱收入。
与吴先生经历类似的还有小红书博主土味牛仔,摄影专业出身的他,今年6月起开始尝试用MidJourney来进行AI绘画。
土味牛仔的AI绘画作品多以牛仔为主题,风格涵盖东方元素、未来感、科幻感等,点赞量高的达数千,他习惯把摄影时无法实现的脑洞告诉AI,让AI帮他实现。
图 | 土味牛仔创作的牛仔,已获创作者授权发布。
4个月的时间里,土味牛仔一共在小红书发布了117张AI绘画作品,其中每张作品背后平均的生成次数为50次,可谓精益求精。
创作者在学习,AI也在学习。目前,MidJourney里共记录了土味牛仔的10000多次生成记录。现在土味牛仔只要一输入相关词汇,AI就能生成相关额外的联想。有时土味牛仔会怀念“不太听人话”、更具备天马行空创意的AI,而不是对人类思维偏好越来越贴近的圆滑AI。
在小红书上发布AI绘画作品以后,土味牛仔说他接到过几次约稿,也有人找上门想直接购买原图留作NFT收藏,但这样的人屈指可数。目前他在AI绘画作品上的收入还不足以支付他在MidJourney上的投入。
据土味牛仔在圈子里的观察,大家使用AI绘画的原因各不相同。有插画师朋友会用AI生成作品的草稿,以此为基础进行创意和修改。做建筑设计的朋友则会利用AI来进行头脑风暴。但更多素人就是图一个新鲜,就是想要看“超人跟钢铁侠合在一起是什么样子”。
在用户们的推动下,B站、抖音上等介绍AI绘画软件和教程的视频越来越多,小红书则成了AI绘画作品的一个重要展示平台,闲鱼则扮演了一个销售描述语的平台角色。
02 AI绘画技术的迭代
AI绘画的源头可以追溯到上世纪70年代。
计算机问世后的10年,就有艺术家打造电脑程序AARON来进行绘画创作,其主要原理是控制机械臂来作画,但当时的技术成本比较高,且只能得到抽象的结果。
图 | AARON和它的发明者Harold Cohen
而现代意义的AI绘画,主要是指AI从海量图文对应的数据中学习“语言描述”与“艺术画面”的关联,以随机化的起点开始,不断修正画作,最终形成在审美上与人类经验与知识高度一致的成品。
据百度文心一格相关负责人介绍,现代意义AI绘画技术的雏形,主要出现在上一个十年中。
彼时的技术可以批量完成由文本信息指定的画面生成,技术上包括风格迁移、元素拼接和对抗生成网络(GAN—Generative Adverserial Network)等。
从生成的画面质量来看,虽然这些技术使AI绘画的水平有了明显进展,并且在比较强烈的风格上有了初步的应用可能性,但与人类作画质量依然存在差距。
AI绘画最近的一次技术爆发是2022年对扩散生成模型的引入,这类模型用于文生图后,能够在更短的时间内,像素级建模并生成分辨率显著提升的绘画,并且在美感、细节精细度有非常显著的提升,一些AI绘画的成品已经和人类作画的质量不相上下。
行业里普遍认为,从2021年到2022年,是AI文生图技术发展最快的两年,诸多新的学习模型或产品诞生,AI绘画的风潮也开始发展。
一是Open AI于2021年初发布的深度学习模型 CLIP(Contrastive Language-Image Pre-Training)。
Open AI是一家于2015年12月成立于美国的人工智能研究公司,它用 CLIP先后创建了DALL-E 和DALL·E 2两个AI系统,为用户构建了可以根据文字描述创建更逼真、更准确图像的能力。
二是于今年2月初开始出现并流行的开源绘画程序Disco Diffusion,它是一个由谷歌推出的AI,开发者是艺术家兼程序开发员的Somnai_dreams 。
Disco Diffusion的特点是能够高效合成视觉数据,图片生成的质量直接击败了GAN模型。但缺陷仍然存在,主要表现在AI绘画欠缺细节,渲染的时间过长,内存资源消耗巨大。今年7月开始测试的Stable Diffusion程序,则很快改进了以上缺点。
三是今年6月推出的MidJourney,它是一个富有创造性的AI,用它生成的图片质量得到了大幅度的提升,且以月费为方式的商业化做得比较成功。目前公开资料显示MidJourney的用户成员已经超过了240万人。
图 | MidJourney社区上的展示画作
在国内,AI绘画也开始逐渐有了热度。
像Stable Diffusion、MidJourney这类模型,主要是针对英文世界的用户,语言和文化的差异形成了国内用户使用海外AI绘画软件的阻碍。国内用户呼唤中文世界的文生图产品,这形成了一定的市场需求。
TIAMAT成立于2021年、被称为是国内首批AI生成式平台。今年上半年,TIAMAT开始在小红书、抖音等社交媒体上发布中文文生图的产品,赶上了AI绘画的第一波热潮。
图 | 小红书上的AI绘画
图 | 闲鱼上的AI绘画
TIAMAT致力于为个人用户和企业客户提供创意生产、广告、数字藏品等场景形式下的服务。日前,TIAMAT已宣布完成数百万美元天使轮融资,投资方为DCM。
今年8月,百度发布了AI艺术和创意辅助平台文心一格,它使用了百度自主研发的产业级知识增强大模型—文心大模型,通过语义理解+多画作风格适配+结果优化排序,让用户只需要输入一句话,就能完成画作,包括意向、具象等多种类型和风格。
文心一格被认为有效地解决了中文世界中,需求描述困难、多样化需求强、模型生成结果筛选难的困难,降低了中文世界用户使用AI绘画的难度。
基于文心一格平台,由百度数字人度晓晓创作的“无界”系列画作,已被专业美院教授评价为“已经达到了本科美术生的基本要求”。
图 | 度晓晓创作的无界系列
业内人士指出,对于AI绘画而言,如何让AI准确理解中英文语境中的描述语至关重要。描述语不仅有中英文上的语言差异,也有语言承载的文化差异,从而影响到AI绘画技术的研发。
例如“龙”对于英文环境基本没有歧义,但在中文环境中则有东方龙和西方龙的形象差异,且东方龙和西方龙作为文化符号的意义也完全不同,这对AI绘画技术提出了很大的挑战。
从当下来看,如何处理好语言、文化的差异,AI绘画还有很长的路要走。
03 AI绘画的争议点和未来发展
AI绘画诞生后,市场上存在的一个争议点主要围绕版权展开。
AI绘画平台的底层逻辑是融合各创作者的作品以及现有的互联网图片生成的作品,提取原作的笔触、用色、构图等元素而进行的“二次创作”,至于版权是归原作者、平台方,还是现在的创作者,目前尚难以界定。
据使用过Disco Diffusion和MidJourney的用户介绍,用Disco Diffusion生成的图片版权属于创作者自己所有,而使用MidJourney生成的图片版权则属于创作者与平台共有。
百度文心一格相关负责人认为,AI技术生成的图片并不是既有图片的拼凑,而是类似人类经过长期绘画训练后的再创作,既有继承,也有自己的特色。
不过基于版权问题,行业仍在讨论中,为了避免可能的风险以及解决可能发生的纠纷,百度文心一格方面就表示,未来如果平台开放出来的生成图片侵犯到原作者权益,会提供投诉反馈通道,为相关权利人提供权利救济渠道,迅速处理。
据了解,目前国内还无相关具体的法律案例能够用来作参考。
图 | 在文心一格中输入“人工智能画面、超现实主义”生成的图片
关于AI绘画的发展方向,本质是AIGC(人工智能自主生成内容)技术的发展,它是一种继PGC、UGC之后全新的内容生产方式,被认为能够刺激内容产业进一步发展。
公开数据显示,全球库存图片市场规模接近3000亿美元。但目前主流的图片市场是平台有什么用户用什么,而不是用户想要什么就有什么。内容生产者仍然受限于生产的想象力,传统图片行业还处于“数字手工业”阶段。
相较之下,AIGC的发展正好顺应了内容创作者对生产想象力的延伸。以前AI只是辅助内容创作的工具,现在AI已经能够独立完成写作、设计、绘画、作曲等创意性工作。
这里需要注意的一点是,AIGC 听上去时髦,但自动化内容生成并不是一个很新的概念。
利用计算机辅助人类进行内容生产早已经出现,比如在计算机编程领域 IDE 的代码提示、使用 Office Word 编辑内容的错误修正,再到后来利用 NLG 自动化文本生成等都可以算在这个范围里。
关于目前的AIGC技术处于哪个发展阶段, 百度CEO李彦宏在2022年百度世界大会上有一个论述。
他将AIGC分为三个发展阶段:第一阶段是助手阶段,AIGC 辅助人类进行内容生产;第二阶段是协作阶段,AIGC 以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是原创阶段,AIGC 将独立完成内容创作。
从目前AI在作文、绘画、写歌等各个领域的发展来看,AIGC已经进入助手阶段,但总体处于发展早期。
未来AI作画是否会取代设计师、原画师等,这个还说不定。但从目前人们的反应来看,人们显然还没有那么忧虑。
评论