万字长文讲透AI艺术：缘起、意义和未来（中篇）|界面新闻

文｜巴比特资讯

今年 AI 艺术热潮源于海外 AI 技术在图像生成领域的革命性进步，以 Disco Diffusion、Stable Diffusion、Midjourney 等为头部代表的扩散模型（Diffusion Model）开始在数字艺术领域大放异彩！以其惊人的艺术效果和可绘制“万事万物”的无限性，在短短半年时间里，吸引了来自全世界数千万注册用户的实际参与、以及数亿人的关注与谈资。时代洪流再度来袭，只不过这次的主角给予了 AI 技术。我们可以去质疑一种新的商业模式或者消费场景的市场有限性，但却无法不去敬畏一种新技术革新所带来的未来无限性，那是一场绝对的“无限游戏”！

以大模型和数据集为基座，以艺术与视觉为消费手段，扩散模型一时间百花齐放、争奇斗艳：

有的模型擅长逻辑，有的模型崇尚色彩，更有的顶级模型二者兼具、无可挑剔；

科技巨头主推商业付费模式，而开源社区力量对去中心化青睐有加；

闭源付费往往可以提供最上乘的艺术出图，甚至可以直接用于商业生产与产业设计，这是被全球数百万资深用户所证明了的；

而开源生长也许在短暂的当下无法抵达艺术质量的顶峰，但其指数级的进化速度、无标度（scale-free）式的创造者网络，令人倍感未来无限可期；

就像前段时间大火的二次元模型 NovelAI 虽然尚存在一些诟病，但不得不承认其对 SD 的改进产生了质的美学效果提升，给予了后面开源社区最直接有效的指引，人们也都在迫切期待下一个更高艺术质量的 SD 生态模型的出现；

请明白，AI 艺术这个行业永远以结果和效果为直接导向，再多的技术工作都将以艺术效果的本质提升为体现。这是十分明确的，也是十分艰难的，更是十分可期的。

意义：击破 12 道边界

技术在进化，同样世人的观念也在与时俱进。文学与艺术之所以重要，是它们承载了一代人甚至几代人的思想观念和精神意志，是一个民族、这个世界最先进发展理念的人文表达。

从文艺复兴开始，到照相机的发明，再到信息技术时代，艺术永远在随着技术的进步而焕发新的光辉。面对 AI 这最新一轮的破坏性冲击，艺术再也不能对其避而不谈。但这绝不仅仅关乎艺术，其意义之深远可破“元宇宙”。那就从 12 道边界说起吧。

边界 1：使图像生成“民主化”

在各大 AI 艺术工具和开源技术的帮助下，最直观的改变是赋予了全民创作图像视觉的权力和能力。在中国大概是几百万的群体规模，而放眼世界，大概是数千万人的规模，他们争相把通过 AI 艺术工具创作出来的优秀作品以去中心化的形态发布于 Tiktok、Instagram、抖音、快手、小红书等传统互联网流量平台。如果说曾经的短视频创作时代造就了视频发布的民主化，那么今天的 AI 艺术则使图像生成变得民主化！

喂给 AI 一段文字描述，AI 便还用户一张视觉“奇迹”，AI 艺术工具的使用就是如此的简单。唯一的门槛是创作者自身需要精通撰写优秀描述词的语法和技巧，简单的一句话和经过精雕细琢的、具备“艺术修养”的一大段话所产出的艺术效果有着天壤之别，所以有人愁有人喜，有人失望有人鼓舞，但一切掌控尽在所有人自己的手中。正如社区力量所总结的“AI 技法宝典”：

（1）尽量以短语、短句、词组为主体输入，并注意逻辑断句，以便 AI 更好地理解人类思维

（2）你想要特别强调某个词，可以加很多括号或者惊叹号，比如“大漠!!，青烟，长河，(((落日)))”中优先体现“大漠”和“落日”元素。这招在输出人像的时候很有用，比如你希望输出一张对称的脸，就可以在英文描述“symmetry”后面多加几个惊叹号——"symmetry!!"

（3）优秀的描述词不仅需要创作者以简明扼要的词句组合描述清楚要绘制的内容，更需要融入必要的艺术专业修饰词，如下只有绿色部分是对主体内容的描述，即“非常酷的女孩穿着赛博朋克的、复杂的休闲服饰”；黄色部分是对人物主体的进一步修饰，以便 AI 能读懂人类希望绘制出的是一个漂亮写实的女性；红色部分是加入了一些专业艺术家和工作室的风格，让画面的美感直接进入艺术殿堂；蓝色部分是更多的细节方面的艺术修饰词

（4）大力出奇迹：即便一组非常优秀的关键词在 AI 的随机性下也可能输出劣质的作品（比如双头、结构混乱、不合逻辑、扭曲夸张），解决办法只有一个——量大出奇迹

（5）去各大开放社区、关键词搜索引擎网站，临摹优秀创作者的关键词，站在前辈的肩膀上继续创作

还有很多很多类似的技法，如同武侠世界修炼上乘武功一般，刻苦且有天分的人会很快掌握本质、输出全网最优秀的画作，而往往都是开创性的画风，例如早期在国内开创 AI 古风艺术的抖音创作者一条状态可收获高达 158.7 万个赞，流量惊人。一时间，数字艺术的江湖再起风云，各大派争奇斗艳，最早从壁纸视觉开始，陆续出现了古风美学、化身头像、唯美动漫、山海神兽、江湖武侠、十二生肖、机甲科幻等 AI 艺术的新“八大派”。AI 艺术创作者们不断找到了流量密码，2022 年全年无休。

很多头部的创作者在短短几个月时间内，完成了数十万粉丝的私域流量搭建，然后通过售卖优秀 AI 作品的版权、与传统图库商业模式合作分成、教授学员 AI 艺术创作课程等多种方式完成流量和认知的变现。时代使然，早期者得红利。先富带动后富，于是在 2022 年下半年中，全民开始进行学习和创作，去构建属于自己的创作者经济时代的私域流量，而此时你不需要艺术出身、不需要懂 PS 和设计，这甚至比之前创作抖音短视频还要简单和省力。

使图像生成民主化，现阶段更大的意义在于，使图像生成的生产力得到指数级的提升。在 SD 公测的短短几周时间里便创造了数千万张图片，MJ 更是由数百万人全天候 24 小时不间断出图已达半年。这种量级的图片生成将很快充斥到下一代互联网中。图像生成的生产力在新技术的加持下来到了一个新拐点，必将去影响到新生产关系的形成，更必将去重塑现有的商业构成、去催生崭新的消费市场和消费关系。

从更具体的角度，将首先会对视觉中国等传统图库商业模式带来降维式的冲击，将会极大解放创作者经济时代全网数千万乃至上亿创作者在获取低成本、合法版权作品资源时的顾虑和效率。

AI 艺术使图像生成民主化，但更深层次的意义是，让全民都开始创作，全社会进入创作者经济时代，一个具备崭新生产关系的商业社会即将来临。

新时代的文艺复兴蓄势待发，文学与艺术对于一个民族的觉醒至关重要，全民掌握最先进的 AI 生产力，去觉醒新时代的精神意志。创作无限，以致涌现！

边界 2：连接艺术家与大众

使图像生成民主化，让人人成为创作者，但并非让全民与艺术家群体形成对立与误解。首先从当下 AI 艺术的发展阶段来讲，AI 出图的美学质量尚不足以撼动艺术家群体所占据的消费市场。

AI 艺术创作出来的作品的笔触、画质、艺术性，目前还不能与人类艺术家相比，因此它无法从纯艺术这个维度与人类艺术家争抢存量市场，但它却为自己开辟了一个全新的增量市场。打个比方，泡泡玛特为什么没去用那些知名艺术家的作品，而是与新兴艺术家合作，去把他们的作品变成盲盒，变成一种快消品，并带有金融属性，带有全民消费性质。他们错开了打不动的佳士得等传统藏品市场，但是却给自己开辟了一块新兴消费的增量市场。

而 AI 艺术也可以先成为一种快消品！再如虽然 AI 无法撼动头部设计师的饭碗，但它会给更多平凡而普通的设计师带来更多的效率提升和甲方需求。从这个角度，AI 艺术创作者与传统艺术家们并非利益对立关系，而是皆有市场。双方群体在初期阶段可以有短暂的思想观念对立，但从长远来看，也必将各取所需、互不侵犯。

当然更多的对立并非来自市场侵占，而是围绕模仿、抄袭、不尊重、互相瞧不上等纷争不已。最典型的一个案例是在 SD 刚发布之后，随着全球数百万人参与到图像生成中，一时间推特上充斥着大量 AI 作品。其中大量带有明显在世艺术家画风的作品引发了海外艺术家群体的强烈不满和抗议，投诉诸推特，当时 SD 生态的最大社区分享账号一度遭到封禁，舆论哗然。这个问题可以从三方面讲一讲一些当前的认知：

（1）对于 AI 技术工具：

在训练阶段不免会用到大量艺术家在互联网上出现的作品，当然包括很多在世艺术家。比如在 CG 绘图这个方面，几乎所有顶级的 AI 艺术算法框架都捕捉到了大量年轻一代优秀 CG 艺术家的作品，如 wlop、黄光剑等人。因为这些作品在互联网上传播得无所不在且数量极大，是最有价值的训练数据集，可以产生很好的 AI 生成效果。所以针对这种情况，必然会出现争议，尤其是前段时间引起更多舆论风波的二次元模型 NovelAI。

它在未经过大型二次元图片资源网站 Danbooru 官方授权的情况下，直接连带着标签爬取其上几乎所有的二次元图片资源用于自身的模型训练，同时通过算法“过拟合”的手段，让 AI 出图质量达到了与原始作品和人类艺术家惊人相似的效果。

虽然极为出色的出图俘获了全球大量用户的芳心，但却令人类艺术家无法放心。一方面来自其未经允许“盗用” Danbooru 网站资源，后来 Danbooru 官方也出面谴责了这种行为；另一方面来自所出之图有着浓厚的原始作品风格和形态，此处是因为其对 AI 算法采取了“过拟合”的“不良”行为。

这两点也是在 AI 技术发展过程中未对其进行道德约束的经典情形，我们应该去大胆承认 NovelAI 的不足之处，以此为警醒，才能获得更长远的发展。

但更应该明白的是，这只是个例，是 AI 艺术技术大潮中那并不属于主流的一支。像 DD、SD、MJ、DALL-E、Google 等更多主流的顶级 AI 技术框架都在采取合法的、尊重人类道德的、并受全世界监督的、甚至全面开源的方式去构建 AI 艺术的训练体系和出图绘制标准。

以 SD 为例，首先其所采用的大规模数据集 LAION 工程本身就在用极大的成本、经过数年才完成训练集的构建。如前所述不免会去获取很多在世艺术家以及更多具有版权归属问题的图片资源，LAION 都会以合法的方式与这些图片所归属的图库和商业主体进行付费合作，去获取合法使用图片的权利，并备注用于 AI 模型训练，不做其他用途。同时 LAIOIN 将所有的一切都全部开源，接受全世界的监督，也就是说你完全可以去从那数十亿张用于训练的图片中找出所谓的不合法图片。

LAION 这项浩大的工程，是整个 AI 艺术和 AI 技术行业的公共财富，是全人类的合法财富！因此大可不必质疑一切采用 LAION 数据集为训练源的 AI 艺术工具，它们在源头上都是合法的！

随后便是算法绘制层面，如上我们提到了不良的“过拟合”行为，那也只是个例，更多的扩散模型都在遵循符合道德的算法参数。扩散模型的技术原理从本质上决定了所生成的图片绝不是对原始人类图片进行搜索拼贴的“缝合怪”，它真的是在学习。这个奇妙的过程就像是人类艺术家从小学习前辈和大师的作品一样，当学有所成之时，所输出的绝不是跟前辈大师一模一样的作品，而是在那种大框架下形成了自己独特的一面。以 CLIP 和扩散模型等为先进代表的 AI 艺术算法框架，就像 AlphaGo 完成对人类所有棋谱的学习并进行更加“天外”的演绎一般，它们也是在模拟人脑从小学习并学以致用的这个神奇生物过程，只要不采取“过拟合”的偏激行为，其所输出的图片皆不存在抄袭、侵权、缝合、拼贴等情况，这是技术使然，正如那句名言“In Math，We Trust”！

从更专业的角度，人类可以为作品设置版权以保护合法权益，但画风是不受版权束缚的，它像风一样是自由的，是全人类的自由和财富，正如你也无法为某种数学公式和算法设置专利的壁垒。即便是人类艺术家自身，也无法确保自身不受某位先辈艺术家画风的影响，而产生相似之处，所以知其原委而互相谅解。

（2）对于 AI 创作者群体：

要合理使用符合伦理的 AI 艺术工具，去产生合法范围内的生成式图片。虽然一些顶级 AI 技术工具已经做了本质上的合法合规输出规范，但依然有很多细节场景、尤其是涉及自身商业化需要用户自己去约束自己，比如生成公众人物肖像用于商业场景、生成迪士尼形象用于商业场景等等。

除此之外，AI 艺术创作者更要尊重人类艺术家和人类艺术史。这些合法的顶级 AI 工具在学习的过程中都如此谦卑，甚至付费购买人类艺术家作品作为训练数据集，而作为使用 AI 艺术工具的创作者们更应该去尊重这来之不易的数字化成果，这更像是一种传承！

人类艺术家那历经千年、无比光辉的艺术思想和成果经由新时代顶级 AI 技术的记录与回炉开始向下一代、全世界所有人传承、延绵、生生不息、文艺再复兴！

从更细的层面，如前我们讲述要出好的 AI 作品需要懂很多的艺术理念和知识，更需要让自身具备充分的艺术修养和审美能力，这些都需要 AI 创作者更虚心地向艺术家群体学习。

虽然 AI 出图即便随意一张都有可能出现上乘质量，但要知道 AI 创作者群体之中更藏龙卧虎，而那些真正顶尖的 AI 艺术创作者无不对真正的艺术虚怀若谷、知其然更知其所以然。传统人类艺术家所做的辛苦的努力，背后的故事、情感、知名度，这些是 AI 艺术替代不了的。

（3）对于艺术家群体：

自李世乭被 AlphaGo 击败后，人类棋坛陷入了 AI 恐惧之中。但与此同时新一代韩国棋手申真谞却始终在向 AI 学习，去真正地了解它，在棋坛有着“申真智能”的美誉。面对对弈过程中 AI 逆天的“杀伐”，申真谞始终虚怀若谷，去窥测其本质，在这日复一日的“以虎为师”的博弈中，申真谞的棋力得到了极大的提升，并在今年战胜了柯洁。赛后柯洁坦言，申真谞下棋具有 AI 的影子。

同样对于人类艺术家来说，AI 艺术可以对几千年人类艺术史进行学习、融合和再塑，且一直处于不断进化的阶段，其必有可取之处。不论是对于创作灵感的启迪，还是对新画风的创造，抑或是对自身创作效率的提升，AI 艺术都应该成为人类艺术家在数字时代最有力的工具和伙伴。就像一百多年前的照相机一样，更具智慧的艺术家选择与其和解，将自身从现实主义的严格束缚中解放出来，进而引发了印象派、立体主义和抽象艺术等现代艺术运动，深刻影响了人类现代文明的建立。

再从更细的角度，诚如前所述，AI 艺术的进化离不开对人类艺术家作品的获取和学习，像波兰概念艺术家 Greg Rutkowski 已成为 AI 艺术全网引用量最高的艺术家，国内也有一大批青年艺术家被全世界的 AI 创作群体所喜爱和引用。因此，艺术家们为何不借助这种时代的机遇进一步扩大自己的市场和粉丝群体呢，也为自己带来一块更加庞大的增量市场，去巩固自己的艺术地位、去获得更大的粉丝流量、去捕获更大的价值变现、去赢得全世界的“高被引”荣誉。也许在 AI 艺术流行之前知道 greg 的只有少数，但今天相信至少一千万人都在自己的作品中写下“by Greg Rutkowski”！

所以，艺术家与 AI，需要“柯洁”，但更需要和解。

边界 3：社区的力量，共同的想象

这个边界是给所有人来击破的。AI 艺术从来不应该是一个人的单打独斗，社区的力量凌驾于 AI 艺术之上，而所有人的想象力凌驾于社区之上。每一位进入 AI 艺术领域的新朋友都会在很短的时间内上手，输出高质量的作品，正是因为他不是一个人在埋头苦干，而是身处于一个巨大的开放社区之中。

同时在这个社区之中，所有人的知识经验都处于共享的、叠加的、彼此增强的状态，也就是说你的创作来自别人的经验，别人也可以基于你的优秀探索去演绎更加精彩的想象力空间，而这一切的知识共享都是唾手可得，且无时无刻不在发生的。

正如 MJ 创始人在 Midjourney 社区规模达 100 万时所感慨到：当一群人在一个社区共同创作时，一开始有人会说“狗”，随后会有人提议“太空狗”，紧接着是“阿兹特克太空狗”，在那一瞬间，所有人都明白了那种令人振奋的无限可能性。这些人，包括你自己，在试图创造一种被增强的想象力。是的，人们真的喜欢社交，更真的喜欢在一种社交的氛围里一起想象。在这个巨大的 Discord 社区中，大约有 100 万人在这个共享空间中共同想象啊！

时至今日，这个共同想象力已经扩充到了近 500 万人的规模，这才刚刚过去几个月而已。这种想象力边界的击碎，带来的是一种全民共同想象力的公共物品，这种公共物品将一种增强的、远超单个人类个体的想象力置之于公共领域，被全世界人所汲取，并在汲取的过程中也不断令自身去进化，这是多么可怕的新群体智能！

边界 4：版权界定与合法使用

AI 艺术作品的版权归属问题与 AI 艺术工具或产品的协议声明有关。一般而言，以 SD 所代表的开源生态为例，SD 在向社区开源时，明确在协议中声明任何将 SD 部署于自有计算资源的个体或者商业实体在对外提供图片生成服务时，有权自主决定生成图片的版权归属问题。于是可以出现多种选择：

（1）有的产品会选择将用户生成的作品版权归属于公共领域，即 Web3.0 倡导的 CC0（知识共享零许可）运动。在 CC0 下，图片将失去个体所有权的概念，即任何人都有权将该图片用于任何商业用途，所有人都不能单独拥有它，这是绝对的商业自由，但也存在所有权缺失带来的商业保护和个体创作积极性问题；

（2）因此更多一部分商业化产品会选择将用户用 SD 生成的图片所有权还归于创作者本身，即谁创作的谁拥有 AI 艺术作品的所有权，然后自主决定其商业用途和授权；

（3）除此之外，还有像闭源性质的商业化产品如 MJ 选择平台与用户共同享有所创作图片的所有权，以及一些传统科技巨头如百度选择平台拥有所有生成图片的所有权，而创作用户并不享有版权。

SD开源发布，协议界定版权

版权界定是会随着时代发展、法律完善和技术进步而不断发生变化的，起码在 AI 艺术发展初期，版权问题更多会让步于技术革新，会首先服务于让全民创作实现摩擦最小化、利益最大化。但不论如何，合法合理使用 AI 作品的版权始终是最为明确的要求。任何 AI 艺术商业平台和产品都不会漠视侵犯版权行为的滋生，因为那才是整个行业共同的敌人。

边界 5：元宇宙从数字孪生到数字原生再到数字永生

真假清明上河图，张择端你永生了吗？

AI 艺术来自现实，更超脱于现实。在学习了大量人类语言和图像之后，它似乎可以在数字的疆域上再造一个自己理解的新世界。就像这张“真假清明上河图”一样，上为真，下为微软顶级 AI 艺术工具 Nuwa 在经过大量学习后演绎出的新时代清明上河图，不仅让人感慨到：张择端，你永生了吗？

如果说“真假清明上河图”还停留在数字孪生，那么再看下面这张 Miss Journey 的肖像画，她并不存在于千年人类文明长河中的任何一角，她从来没有存在过。是 MJ 社区数百万人的共同想象力让 AI 算法“凭空”产生了这样一位“新人类”，她会经常出现在 MJ 的用户创作中，令人匪夷所思，但却没人知道她从何而来，她是谁，她要到哪里去。这便是数字原生的经典案例。

Miss Journey，来自 MJ 社区的共同想象力的产物

这不禁让人联想起了元宇宙的一些理念。宇宙的进化历程实际上以是人类文明数字化进程为标志的，人类向数字文明迁徙过程可以概括为三个阶段：数字孪生、数字原生和数字永生。

（1）数字孪生（ Digital Twin）现实物理世界向数字世界的映射，以数字化方式创建物理实体的虚拟实体，需要借助历史数据、实时数据以及算法模型等。

（2）数字原生（Digital Native）数字原生是生产人类认知之外的新知识。就像“阿尔法狗”从黑白落子的行为数据中，面向答案（输赢）学习中间不确定性的过程，生产出新的知识。数字原生才是元宇宙成功的关键之钥。元宇宙不是要复制一个现实中的宇宙，而是要创造一个目前不存在的宇宙。

（3）数字永生（Digital immortality）现实世界与数字世界共同构成人类的生命空间，密不可分。数字世界的艺术、资产、文化具有与现实世界一样的价值与影响力。更重要的是，人类的生命不再以肉体生命为标志，由于科技的发展，人类的意识与记忆可以上传到元宇宙当中，最终实现数字世界与现实世界的二元融合，人类在元宇宙中数字化永生。随着张择端的作品不断被全球千万人复现在新数字空间中，他的思想、艺术修养和精神意志也从另外一个角度获得了永生。数字生命将拥有与现实生命同等的权利。

AI 艺术的过程不正像美剧《上载新生》中所讲述的那般：未来社会当你身体即将死亡，你可以把全部记忆和意识上载到数字虚拟空间，数字空间本身就是另一个人类社会，而你还可以随时与现实空间的亲友可视化的场景互动，从而实现数字永生。如果全部记忆和意识可以“上载”，那么同样也可以“下载”。我们需要的只是克隆、3D 打印或者什么更高技术创造的碳基躯体，作为灵魂植入、意识下载的载体。

元宇宙三阶段，《元宇宙：通往无限游戏之路》

边界 6：从虚拟到现实

AI 艺术并未停留在永恒的数字空间中，它可以与实体、与现实世界产生跨越。从简单可见的层面讲，普通人获得了艺术创作的权力，可以将自己生成的好作品变成现实世界中的一副挂画用于家庭装修、发展成一种别具一格的 IP 用于制造广受欢迎的潮玩配饰、更可以让 AI 艺术出现在大街小巷的广告牌中去宣扬新时代的力量……从长远的商业本质来看，即便是曾经更加虚拟的直播间，如今也成为电商最强大的流量平台和新模式，为更多普通人带来参与实体的机遇。AI 艺术及平台在具备同样等级的流量效应时，也会产生服务实体、影响实体的时代使命。

边界 7：开源与商业

开源是无私而博大的，它将人类最顶级的技术还给了人类，就像 StabilityAI 的口号一样：“AI by the people, for the people（AI，来自人民，为人民服务）”。其实更应该 of the people（属于人民）。所有的商业化都应该建立在尊重开源的基础之上。在这个大家彼此心照不宣的规则空间之下，诞生了很多初级的 AI 艺术商业模式。AI 艺术生态每日海量的新生成图片极大冲击了传统付费图片版权库，在中国如视觉中国，在海外如 Getty Images、Shutterstock。与后者动辄一张图几十块的付费体验形成强烈反差，使用顶级 AI 艺术工具 Dalle-2 生成同样质量的风景图片仅需 0.03 美金甚至更少，而 SD 可以将成本进一步降到 1 毛钱以下，且用户“所需即所得”。

除此之外 AI 艺术商业模式的建立更多是围绕流量效应开展而来，AI 艺术如同当年的短视频创作一样，具有与生俱来的创作者经济网络效应，是最符合数字原住民的网络行为体验，是未来社交媒体平台都不可忽视的一环，不论对于内容还是用户，都息息相关。

边界 8：AI 技术的进化边界

AI 艺术在技术进化上是无边界的，虽然从 2022 年初发展至今已近一年之久，但给人的感觉是 AI 技术尚未发挥出更具革命性的威力，很多顶级 AI 艺术平台，包括 MJ，都似乎存在更大的进化空间。我们会在“下篇”中详细叙述所追踪到的一切与 AI 艺术相关的前沿技术动向，以及对未来边界的预判。

边界 9：Web3.0 与加密世界

现阶段 AI 艺术更多发生在主流世界，或者更多发生在互联网世界中，在国内更多的新用户来自抖音、小红书、设计圈、微博等传统互联网世界的原住民。但就像 SD 所展露的像 CC0 等极具去中心化精神的迹象一般，AI 艺术在下一阶段也必然会渗透到整个 Web3.0 大潮中，为 Web3.0 所倡导的下一大互联网大框架丰富其骨架、完善其肉身、增强其实际价值。而今天，加密世界也从 NFT 的角度以更大的姿态开始拥抱 AI 艺术，通过 AI 艺术所具备的社群力量和新生产力，完成对 DAO 的实践、对公共物品的描绘、对加密创作者经济网络的搭建。

边界 10：本质是文字、图片还是想象力

有人说 AI 艺术的本质是视觉输出，但也有人认为其本质是文字输入。有人会说即便是文字输入，但也应该先在脑海中形成艺术画面，才能有所文字输出，进而转化为 AI 的文字输入。然而真正的本质是文字与艺术共性——想象力。Midjourney 创始人 David Holz 曾说：AI 艺术是想象力的发动机。

边界 11：破除边界的最佳方式——涌现

无论一个中心化的团队、平台或者生态如何努力，他们的创造力都无法与一个去中心化生态相比。今天面对 AI 艺术我们有太多的未知、太多的难题、太多的迷茫，而这些问题的解决都将由“涌现”实现——一个所有节点都能够去解决问题的超大规模网络的创造力是无限的。今天面对 AI 艺术，我们更多从图片生成去认知，是为创作；然而随着 AI 艺术带动“开放模型”时代的到来，任何类似图像生成的人类需求都能够在开放 AI 的时代得到新的解决方案，是为创造！如 StabilityAI 所言：

人工智能的下一个转折点：开放基础模型（foundation models）的时代。

在 Stability，我们认为只有当人工智能辐射到世界各地的人时，它才会真正实现变革。当一个人或几个人有智能手机时，这没有什么有趣的。只有当我们把 10 亿台智能手机连接在一起时，它才变得有趣。

是时候让我们往大的方面想了，想象一下我们可以在更大的范围内用这些模型做些什么，想象一下我们如何以一千种方式将基础模型编织到全世界的各种软件中去。

当基础模型无处不在时，一切都会改变。

想象一下这样一个世界：不久之后，基础模型即服务（FMaaS）将涌入我们生活的方方面面，并彻底改变工作和娱乐的方方面面。

欢迎来到环境（ambient）AI时代。

所有这一切都将发生，因为环境 AI 模型的巨大全球网络。人工智能无处不在，每个设备都在苏醒，变得越来越智能。一旦我们将智能工业化，它将在我们的工作和娱乐方式上引发一场革命。

但要成为现实，这个行业现在就必须做出改变。

首先，我们必须更加开放。

最后一道边界：无限游戏！

文｜巴比特资讯

以大模型和数据集为基座，以艺术与视觉为消费手段，扩散模型一时间百花齐放、争奇斗艳：

有的模型擅长逻辑，有的模型崇尚色彩，更有的顶级模型二者兼具、无可挑剔；

科技巨头主推商业付费模式，而开源社区力量对去中心化青睐有加；

闭源付费往往可以提供最上乘的艺术出图，甚至可以直接用于商业生产与产业设计，这是被全球数百万资深用户所证明了的；

而开源生长也许在短暂的当下无法抵达艺术质量的顶峰，但其指数级的进化速度、无标度（scale-free）式的创造者网络，令人倍感未来无限可期；

意义：击破 12 道边界

边界 1：使图像生成“民主化”

（1）尽量以短语、短句、词组为主体输入，并注意逻辑断句，以便 AI 更好地理解人类思维

（5）去各大开放社区、关键词搜索引擎网站，临摹优秀创作者的关键词，站在前辈的肩膀上继续创作

AI 艺术使图像生成民主化，但更深层次的意义是，让全民都开始创作，全社会进入创作者经济时代，一个具备崭新生产关系的商业社会即将来临。

边界 2：连接艺术家与大众

（1）对于 AI 技术工具：

这两点也是在 AI 技术发展过程中未对其进行道德约束的经典情形，我们应该去大胆承认 NovelAI 的不足之处，以此为警醒，才能获得更长远的发展。

（2）对于 AI 创作者群体：

（3）对于艺术家群体：

所以，艺术家与 AI，需要“柯洁”，但更需要和解。

边界 3：社区的力量，共同的想象

边界 4：版权界定与合法使用

SD开源发布，协议界定版权

边界 5：元宇宙从数字孪生到数字原生再到数字永生

真假清明上河图，张择端你永生了吗？

Miss Journey，来自 MJ 社区的共同想象力的产物

（1）数字孪生（ Digital Twin）现实物理世界向数字世界的映射，以数字化方式创建物理实体的虚拟实体，需要借助历史数据、实时数据以及算法模型等。

元宇宙三阶段，《元宇宙：通往无限游戏之路》

边界 6：从虚拟到现实

边界 7：开源与商业

边界 8：AI 技术的进化边界

边界 9：Web3.0 与加密世界

边界 10：本质是文字、图片还是想象力

边界 11：破除边界的最佳方式——涌现

人工智能的下一个转折点：开放基础模型（foundation models）的时代。

当基础模型无处不在时，一切都会改变。

想象一下这样一个世界：不久之后，基础模型即服务（FMaaS）将涌入我们生活的方方面面，并彻底改变工作和娱乐的方方面面。

欢迎来到环境（ambient）AI时代。

但要成为现实，这个行业现在就必须做出改变。

首先，我们必须更加开放。

最后一道边界：无限游戏！

历史搜索全部删除

热门搜索

万字长文讲透AI艺术：缘起、意义和未来（中篇）

意义：击破 12 道边界

边界 3：社区的力量，共同的想象

评论

万字长文讲透AI艺术：缘起、意义和未来（中篇）

意义：击破 12 道边界

边界 3：社区的力量，共同的想象