正在阅读:

杀手级应用不只有ChatGPT,生成式技术的浪潮即将到来

扫一扫下载界面新闻APP

杀手级应用不只有ChatGPT,生成式技术的浪潮即将到来

生成式技术的重要特征是利用AI模型生成新的内容,它让人与软件的关系发生了根本性变化。

编译|阿尔法公社

作为生成式技术的代表应用之一,ChatGPT已经在短期内突破一亿用户,也成为了微软全新Edge浏览器和Bing搜索引擎的重要组成部分。生成式技术的重要特征是利用AI模型生成新的内容,它让人与软件的关系发生了根本性变化。传统软件能帮助人们完成工作的后半部分,生成式技术则从工作初期的想法开始和人类合作,与其说是工具,不如说是协作者。

自加密货币以来最大革新刚刚发生。在过去6个月里,一个全新的应用程序世界向创始人们敞开了大门。

我们现在拥有高质量、廉价、快速的AI模型,用于生成文本、语音、图像、视频、软件代码、音乐、3D模型等——这些都没有版权,也没有被剽窃。

生成式技术是软件的下一步,是人机合作的新水平。它将深度学习引擎转变为协作者,可以像人类一样产生新的内容和想法。

有人将其称为“生成式AI”,但AI只是方程式的一半。人工智能模型是堆栈的支持基础层。顶层将是数以千计的应用程序。生成式技术是关于真正触动我们的东西——作为合作伙伴,你可以用 AI 做什么。

在近期最火的几个关键词中,ChatGPT的搜索指数增长曲线是最陡峭的。

作为生成式技术的代表应用之一,ChatGPT已经在短期内突破一亿用户,也成为了微软全新Edge和Bing的重要组成部分,同时谷歌和百度等海内外互联网巨头也抓紧推出了自己的类ChatGPT应用以和它竞争。

生成式技术行业的发展速度非常快,不仅ChatGPT的发明者Open.AI已经是百亿美金级别的独角兽,还有Stability.AI和Jasper等在短时间内就达到10亿美金以上的新兴独角兽,更有一大批像Runaway这样发展极快的新兴创业公司。

我们鼓励创始人积极在这个领域创业,以抓住技术采用周期的最佳部分。这篇文章是给你们的。

生成技术的创新点在哪儿?

1.一种新的因特网拓扑结构。

直到今天,互联网的特点是进行数据库查询以获取 1) 存储的一段, 2) 旧内容 ,3) 从中心到网络边缘的你。生成式技术改变了互联网的拓扑结构,因为现在的特点是:1) 独特的内容片段, 2) 在网络边缘生成, 3) 通过你的操作实时生成。这是一个重大转变,通常会为创始人带来机会。

如果 Web1 是“只读”,Web2 是“读写”,生成式技术是“读写-生成”,那么 Web 3 就是“读写-生成-拥有”。生成式技术现在与Web3并行发生,并且发展速度更快。如果加密技术没有诞生,我们可能会把生成式技术命名为web3。

2.人与软件的关系发生根本性变化

知识工作者们将更快更好地完成工作。有些人将能够完成他们以前无法完成的工作,创建新的工作类型。虽然一些工作将被降级、威胁、淘汰——这将在未来 36个月内引起数以千万计的“打工人”的恐惧和自我怀疑——但人们能力、生产力和效率的提高将大大超过整体损失,产生数万亿美元的价值。

对于知识工作者和创意人员来说,从0到1在他们的脑海中永远不会是一样的。

例如,作家、程序员、建筑师、音乐家、摄像师、销售代表以及其他从无到有创造价值的人,现在将使用这些工具来生成他们的作品第一个想法。

到目前为止,软件一直被用来将我们最初的想法提炼成有用的东西;它负责从无到有过程的后半部分。

但这些新的生成工具可以帮助你完成整个过程的前半部分,你只需要产生很多初始想法的萌芽,生成工具将帮助你走完剩下的过程。

到目前为止,软件无法解决从0到1的问题,因为它根据我们的指令工作,而生成技术是与我们合作。

今天和未来几年,这将让人感到惊讶,也在很多方面都令人恐惧。因为那些你从0到初始想法的创造性时刻总是让人感觉如此独特。这些想法曾经被认为只能通过人们的思想和灵魂不可预测地产生,来自才能或培训,通常与特殊的人有关——现在将由非人类、非同事或合作者的事物产生,而不是你。这会让很多人感到不安。然而,与大多数新的人机界面一样,我们会克服不适并习惯它。

未来10年,我们期待软件与我们合作,这将是新常态。

乔布斯于1980年表示,苹果电脑是人类思维的自行车,你可能会说生成式技术是人类思维的火箭飞船。这些 AI 模型的制造者可能会说它们是真正的思想。毫无疑问,他们会到达那里。自上世纪50年代以来,我们一直在谈论基于软件的思维的必然性。1997年,IBM的深蓝在国际象棋中击败了卡斯帕罗夫,这是我们作为一种文化感受到的这个时代曙光的第一个例子。下一个重大飞跃是 Alpha Go在 2016 年的围棋比赛中击败了李世石。

从 2023 年开始,生成式技术未来将对数十亿人产生影响。

这是一个非常不同的层次。这就是巧妙地创造新事物。

是什么变化导致生成技术在现在这个时点爆发?

Open.AI的专有生成AI模型的开源替代品的可用性提升是导致生成技术在过去 6 个月内全面爆发的原因。

Eleuther.ai 的GPT-NeoX-20B 于 2022 年 2 月推出,是用于文本生成的 OpenAI GPT-3 的开源替代品。

Stability.AI Stable Diffusion 于2022年8月推出,是 Open.AI的DALL-E 2 图像和视频的开源替代品。

两者都在价格、质量和易用性方面改变了游戏规则。在过去2个月中,生成图像的成本下降了100倍。在过去6个月里,通过网络和移动设备从这些模型中生成输出的摩擦已经“容易了大约10倍”。

高质量生成的文本、图像、代码、语音等正在迅速接近或达到人类质量。许多人认为我们已经通过了其中几个内容类别的图灵测试。这很难衡量,但当你看到它时,你就知道质量如何。

正如2021年斯坦福大学人工智能指数指出的那样,对于一些受限应用程序,人工智能已经达到了“足够高的标准,以至于人类很难分辨合成输出和非合成输出之间的区别”。我们正朝着“生成一切”的方向前进。

由于所有这些变化,实验量“在过去两个月中增加了大约20倍”。这加速了提供价值的应用程序的数量,并为相应社区带来了更多新进入的人。

这是技术领域的一个古老故事:壁垒下降,然后繁荣……寒武纪大爆发。我们还处于早期阶段,但生成式技术现在已经很流行了,正循环开始了。

我们相信它会比大多数人想象的更快发生。与自动驾驶汽车不同,生成式技术不受监管,也不需要完美以避免事故。与 VR不同,它已经很有用,不需要新硬件,并且正在迅速变得更好。

作为创始人,你可以相信,如今几乎每种类型的内容的成本和质量都足以让你的公司运转:文本、图像、代码、语音、3D、视频。

当然,当你组建团队并融到种子轮资金时,它就会存在。不要想太多。(为了展示它的移动速度,你可以搜一搜一个20 分钟的 Podcast.ai,是史蒂夫乔布斯与乔罗根谈话的内容。声音和脚本都是由 AI 生成的。)

我们今天所处的位置只是一个坡道。在经历了 14 年的近乎停滞之后,我们的大多数软件和人机界面现在有可能在未来 5 年内得到显著增强。这为创始人打开了机会之门。

生成式技术产品的特征

生成式技术产品有两层。

底层是AI模型。它能根据用户独有的输入生成新颖的输出,例如Open.AI的 DALL-E或GPT-3。制作和训练这些的通用版本可能需要1亿美元。训练应用更窄的版本可能不到1000万美元,而且价格下降得非常快。开源版本已经开始可行。

顶层是一个应用程序。这是你可以构建网络效应和嵌入效应以产生持久业务的地方。

这个堆栈将降低与某些领域相关的技术壁垒。你不必成为建筑师即可生成房屋改造图纸,不必成为插画师即可告诉DALL- 要画什么。这就是生成式技术能够解锁新公司和项目的原因。

这些新兴公司具有某些核心特征,有助于将它们置于生成技术连续体中。以下是我们总结的三大特征。

从0到1→从0到10

生成式技术从解决0到1的问题开始。最成功的公司最终将提供从0到10的解决方案,或者换句话说,提供满足用户完整需求的产品,并由AI模型激活。

你可以想象Latitude的AI Dungeon的一个版本,它结合了图像和视频以匹配文本让用户获得完整的游戏体验,或者允许你使用 AI 生成的图像或声音创建持久的在线角色。

我们已经看到了提供接近成品的生成式 AI 项目的示例。像SALT这样的项目,使用生成式技术工具的组合来快速生成视频(Stable Diffusion、MidJourney、DALL-E)、编写脚本 (GPT-3)、并生成角色声音(Murf、Synthesia)。

用创造生成代替个性推荐

生成式技术以我们以前从未体验过的方式进行个性化。

20 年来,我们一直在通过个性推荐追求个性化。电子商务公司、Netflix和 Spotify都希望从他们的中央数据库中为客户提供他们最有可能喜欢的精选产品。Facebook、TikTok 和纽约时报已经尝试过用个性推荐改善用户对其内容的体验。

这是一种非常受限的个性化方法,因为它基于调用现有数据。我们一直在努力将人们的偏好改进到我们现有的产品中,而不是产生最适合他们的新事物。生成式技术用创造取代个性推荐。生成式技术不是更复杂的数据库调用。它可以通过这个数据库进行训练,但其核心功能是在网络边缘生成新的东西。生成式技术巧妙地创造新颖的输出,提供给用户的内容、图像或体验本来并不存在,直到用户提出要求,或通过其他操作触发它。

这发生在音乐领域。Boomy、Amper、Aiva、Ecrett、SoundDraw和其他公司都是使用 AI 在几秒钟内生成完整长度的原创歌曲的公司。Boomy 还为创作者提供了分享这些作品并从中获利的工具。至关重要的是,Boomy 的 AI 可以生成适合任何心情和流派的即时音乐。在用户决定用它创作之前,这些音乐从未存在过。

在生成式技术出现之前的世界中,你可能会有一个根据你的设置和别人的推荐而形成的音乐播放列表。在生成技术出现后的世界中,你将生成适合自己的场合、心情、血压、心率、位置以及与你在一起的人的全新歌曲。

低摩擦界面

也许目前最大的突破是生成式技术工具的易用性。人工智能模型完成了众多繁重工作,从创作过程中消除了摩擦。DALL-E 和 Stable Diffusion 只需要简单的文本提示即可在 30 秒内生成令人惊叹的艺术作品。

生成通常是自动的。只要你输入,它就会发生。你可以想象一个版本的第二人生,其中两个角色一起进入一所房子,房子可以产生适合两个用户个性的全新事物,如艺术品、体验、音乐和角色。或者,如果你出售某物,它会自动生成 NFT。或者,你可以想象从你的照片、视频、文本和音乐中提取你的生活。这些将是人机协作的下一个层次。这是一种合作伙伴关系,你会感到惊讶和鼓舞。

生成式技术公司将做什么?

让我们来分析下一个伟大的生成式技术创意将来自何处——以及为什么它会来自你。

对于你的头脑风暴,请思考:如果我将一个或多个基础层 AI 模型与XX领域/应用结合起来会怎样?

生成式技术将影响的潜在应用包括:

头像、照片共享、流媒体视频、法律服务、天使投资和风险投资、选股、投资银行、新闻、体育、建筑、室内设计、活动策划、付款、贷款、信用卡、销售、营销、广告、文案、编剧、社交网络、约会网络、C2C 交易市场、B2B 交易市场等等。

人工智能模型业务

如果你是构建AI和ML模型的创始人,请查看上面的列表,看是否可以为该特定领域创建AI模型。如果你可以访问独特的数据,如果你是第一个看到应用领域的人,那么就可以通过在特定领域拥有一段时间内的最佳模型来获得优势。

这种优势可能不会持久,更通用的模型可能会侵蚀你的数据优势,或者竞争对手以更便宜的价格出售劣质但仍然有用的模型,就像过去两年通用模型所发生的那样。请记住,数据网络效应通常是渐近的。如果你能让它们成为实时的或超本地的,它们就会更耐用。

心智模型

  • 实现伟大的生成式技术创意的另一种方法是思考该业务如何运作。
  • 它如何产生网络效应,让每个新用户都能为其他每个用户增加价值?
  • 它如何融入企业或某人的生活中,让他们从长远来看不想停止使用它?
  • 哪里有适用于你的 AI 模型的超本地数据集,你可以拥有这些数据集并在以后的竞争中维持自己的数据网络效应?
  • 你可以在哪里插入现有工作流程、浏览器或应用程序?

基于生成式技术的应用程序提供什么功能?

今天显然有效的三个快速功能。随着时间的推移会有更多。

1. 最初的想法合作者

这有助于解决从0到1的问题。这些公司生成草稿或完成的项目,并结合传统的 SaaS 工具来帮助完善这些草稿。随着时间的推移,我们预计这些公司将朝着创造成品的方向发展,但从0到1是第一步。

Tailorbird的平面图生成引擎就是一个很好的例子,它创建了改造的初稿。基于简单语言输入生成广告文案或代码初稿的公司也是如此:比如Copy.ai或 Copysmith。

像 jasper.ai这样的公司向我们展示了这条道路如何最终创造出从0到10的解决方案。Jasper.ai提供跨学科(复制、电子邮件、社交等)的专业写作和图像功能。它是满足公司所有格式写作需求的一站式商店。他们现在正在尝试将其嵌入到公司中,这样他们就无法像企业 SaaS 公司那样将其移除。

这些产品让球在复杂的任务上滚动,并让人类从那里开始。

2. 指导/量身定制的反馈

我们通过反复试验的过程来学习。但是我们在教练的帮助下学得更快。我们希望 生成式技术能够分析我们的表现、提出建议或整合工具来磨练我们的技艺。其中许多应用程序一开始可能会让一些人感到不舒服。但他们将挑战我们在 AI 合作者的帮助下成长。这将成为新常态。

3. 规模的独特性

唯一性和可扩展性在历史上一直是不相容的概念。真正独特的事物不可能在不失去其定制品质的情况下大量存在。生成式技术改变了这一点。生成引擎能够大规模地为每个新用户或每个问题提供新的输出。

The.com允许用户在一个电子表格中生成数百个新网站。这些不是千篇一律的副本,它们设计精美,并且对应每个用户独一无二的需求。

生物界的一个例子是Insilico Medicine。Insilico Medicine 采用三种协同工作的人工智能产品。一个确定药物的新目标,而另一个从头开始生成新的候选分子,最后一个引擎根据之前的工作预测临床试验的结果。这是分析性 AI 方法(识别目标和分析试验结果)与生成式技术(生成新分子结构)相结合的一个很好的例子。

这类似于自然界中雪花的产生方式——每次暴风雨期间都会落下数百万片雪花,每次都与之前的雪花完全不同。但想象一下,每一片雪花都可以为企业创造收入、治愈疾病或激发喜悦。

现在给创始人的建议

要想以创始人的身份赶上这波浪潮,你需要在本周、本月的进步和学习这方面的信息和知识,而不是按月和年。除非你已经在火箭飞船上,在激流中,否则建议你暂停你正在做的事情并考虑专注于此。

在这个领域,越来越多的公司获得了投资。

在游戏领域,Latitude提供的全新游戏体验将通过生成式技术成为可能。现在的体验不仅仅是在旧游戏中与NPC的对话,而是在AI Dungeon等全新类型的游戏中。Latitude凭借其全新的Voyage游戏平台处于领先地位。他们在生成式技术的核心工作了 3 年,现在正与AI 21 Labs合作,进一步将自然语言处理集成到他们的平台中。

在法律领域,darrow.ai提供一种合法索赔挖掘服务,使用 AI 模型通过检测有害事件来生成新线索。它将细节汇编成律师事务所的新法律案例。它不是查找旧案例,而是根据一般提示生成特定的新案例。

在装修领域, Tailorbird使用深度学习为希望进行装修的房主制定新的平面图。这些计划是根据从网络上获取的照片和计划生成的,并与远程3D测量相结合,以生成许多新的空间设计效果图。这些生成的计划是很好的起点,它们还减少了与改造相关的时间和成本。

当一个新的行业像这样开放时,创始人通常可以比在更容易理解并因此更具竞争力的领域更容易找到容易实现的成果。生成式技术将具有不同寻常的市场动态,因为它已经达成共识。

通常,重大技术变革会缓慢展开。直到2003年,许多人仍然对互联网持怀疑态度,所以我们这些相信互联网的人竞争较少。从1997年到2005年,SaaS获得了共识。Apple 在发布后的18个月内没有向外部开发人员开放他们的iOS平台。Web3 已经推出 10 年了。

但每个人都支持生成式技术。风投们明白了,创始人明白了,“前浪”们明白了,很明显,游戏现在开始了。所以投入进去吧。

这对创始人来说意味着:

1) 你必须非常非常快地行动。大胆很重要。

2)你必须非常仔细地选择你的想法。你决定构建什么、你的目标客户是谁以及你的分销渠道非常重要。你可以追求水平或垂直、特定数据类型或地理位置。今天的生成技术领域有很多选择。

例如,当Facebook推出时,有50多个社交网络具有相同的5个功能。社交网络已经是“共识”。但Facebook是从哈佛大学的大学生开始的,结果证明这是正确的关注点。你将不得不在这个共识市场中做出类似的重点选择。

以下是我们按顺序向创始人提出的建议:

创办一家新公司来做新事情并创造新市场(就像 Darrow、Jasper和Latitude 所做的那样)

以这项技术为核心,而不只是作为一项功能,创办重做旧业务的新公司。例如 Tailorbird,或CRM,客户服务软件等。

将生成式技术功能添加到您现有的产品中以使其与众不同。

如何在生成式技术中快速增长和防御

如果你正在为企业建立一个生成技术业务,为了快速增长,请准备好成为现有系统的插件。不要试图替换工作流或替换现有的软件系统。为了获得防御,嵌入客户现有的工作流程和软件中。你看到Jasper宣布他们希望成为浏览器插件,让所有知识工作者能够访问所有底层AI模型的文本、图像等。当然,他们不会全部接受,但他们的插件方法是正确的两者都很重要:易于实施和嵌入工作流程。

另一个很好的企业示例是Tabnine,它模仿GitHub的CoPilot代码生成器。它不会取代程序员的代码编辑器,它只是为了快速增长而居于首位。Tabnine所做的防御措施是围绕其确切的代码库为其服务的每家公司构建超本地数据网络效应,从而将这些客户锁定在Tabnine中。将工作流的嵌入与可保护的数据护城河相结合是持久性的良好组合。

如果你正在构建B2C,它的结局会更开放。消费者喜欢新奇事物,并愿意更快地采用新行为。只要确保快速行动并获得网络效应即可。

如果您正在为SMB构建产品,它可能介于全新产品和即插即用产品之间。

减速带

在生成式技术中,仍然存在版权和安全问题,我直接知道这些问题的真实性。此外,创始人应该注意不要制造具有大规模社会破坏性的武器。此外,作为一家重要公司的创始人,你需要为社会负责,而不仅仅对你的股东负责。

但是伟大的创始人会直面风险并迅速解决挑战。不要让这些顾虑拖慢你的脚步。最好是考虑周全,表现出色,并且尽早进入该领域——成为解决问题的人——而不是落在后面,在场边皱着眉头绞着你的手。

本文编译自NFX,作者James Currier。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

杀手级应用不只有ChatGPT,生成式技术的浪潮即将到来

生成式技术的重要特征是利用AI模型生成新的内容,它让人与软件的关系发生了根本性变化。

编译|阿尔法公社

作为生成式技术的代表应用之一,ChatGPT已经在短期内突破一亿用户,也成为了微软全新Edge浏览器和Bing搜索引擎的重要组成部分。生成式技术的重要特征是利用AI模型生成新的内容,它让人与软件的关系发生了根本性变化。传统软件能帮助人们完成工作的后半部分,生成式技术则从工作初期的想法开始和人类合作,与其说是工具,不如说是协作者。

自加密货币以来最大革新刚刚发生。在过去6个月里,一个全新的应用程序世界向创始人们敞开了大门。

我们现在拥有高质量、廉价、快速的AI模型,用于生成文本、语音、图像、视频、软件代码、音乐、3D模型等——这些都没有版权,也没有被剽窃。

生成式技术是软件的下一步,是人机合作的新水平。它将深度学习引擎转变为协作者,可以像人类一样产生新的内容和想法。

有人将其称为“生成式AI”,但AI只是方程式的一半。人工智能模型是堆栈的支持基础层。顶层将是数以千计的应用程序。生成式技术是关于真正触动我们的东西——作为合作伙伴,你可以用 AI 做什么。

在近期最火的几个关键词中,ChatGPT的搜索指数增长曲线是最陡峭的。

作为生成式技术的代表应用之一,ChatGPT已经在短期内突破一亿用户,也成为了微软全新Edge和Bing的重要组成部分,同时谷歌和百度等海内外互联网巨头也抓紧推出了自己的类ChatGPT应用以和它竞争。

生成式技术行业的发展速度非常快,不仅ChatGPT的发明者Open.AI已经是百亿美金级别的独角兽,还有Stability.AI和Jasper等在短时间内就达到10亿美金以上的新兴独角兽,更有一大批像Runaway这样发展极快的新兴创业公司。

我们鼓励创始人积极在这个领域创业,以抓住技术采用周期的最佳部分。这篇文章是给你们的。

生成技术的创新点在哪儿?

1.一种新的因特网拓扑结构。

直到今天,互联网的特点是进行数据库查询以获取 1) 存储的一段, 2) 旧内容 ,3) 从中心到网络边缘的你。生成式技术改变了互联网的拓扑结构,因为现在的特点是:1) 独特的内容片段, 2) 在网络边缘生成, 3) 通过你的操作实时生成。这是一个重大转变,通常会为创始人带来机会。

如果 Web1 是“只读”,Web2 是“读写”,生成式技术是“读写-生成”,那么 Web 3 就是“读写-生成-拥有”。生成式技术现在与Web3并行发生,并且发展速度更快。如果加密技术没有诞生,我们可能会把生成式技术命名为web3。

2.人与软件的关系发生根本性变化

知识工作者们将更快更好地完成工作。有些人将能够完成他们以前无法完成的工作,创建新的工作类型。虽然一些工作将被降级、威胁、淘汰——这将在未来 36个月内引起数以千万计的“打工人”的恐惧和自我怀疑——但人们能力、生产力和效率的提高将大大超过整体损失,产生数万亿美元的价值。

对于知识工作者和创意人员来说,从0到1在他们的脑海中永远不会是一样的。

例如,作家、程序员、建筑师、音乐家、摄像师、销售代表以及其他从无到有创造价值的人,现在将使用这些工具来生成他们的作品第一个想法。

到目前为止,软件一直被用来将我们最初的想法提炼成有用的东西;它负责从无到有过程的后半部分。

但这些新的生成工具可以帮助你完成整个过程的前半部分,你只需要产生很多初始想法的萌芽,生成工具将帮助你走完剩下的过程。

到目前为止,软件无法解决从0到1的问题,因为它根据我们的指令工作,而生成技术是与我们合作。

今天和未来几年,这将让人感到惊讶,也在很多方面都令人恐惧。因为那些你从0到初始想法的创造性时刻总是让人感觉如此独特。这些想法曾经被认为只能通过人们的思想和灵魂不可预测地产生,来自才能或培训,通常与特殊的人有关——现在将由非人类、非同事或合作者的事物产生,而不是你。这会让很多人感到不安。然而,与大多数新的人机界面一样,我们会克服不适并习惯它。

未来10年,我们期待软件与我们合作,这将是新常态。

乔布斯于1980年表示,苹果电脑是人类思维的自行车,你可能会说生成式技术是人类思维的火箭飞船。这些 AI 模型的制造者可能会说它们是真正的思想。毫无疑问,他们会到达那里。自上世纪50年代以来,我们一直在谈论基于软件的思维的必然性。1997年,IBM的深蓝在国际象棋中击败了卡斯帕罗夫,这是我们作为一种文化感受到的这个时代曙光的第一个例子。下一个重大飞跃是 Alpha Go在 2016 年的围棋比赛中击败了李世石。

从 2023 年开始,生成式技术未来将对数十亿人产生影响。

这是一个非常不同的层次。这就是巧妙地创造新事物。

是什么变化导致生成技术在现在这个时点爆发?

Open.AI的专有生成AI模型的开源替代品的可用性提升是导致生成技术在过去 6 个月内全面爆发的原因。

Eleuther.ai 的GPT-NeoX-20B 于 2022 年 2 月推出,是用于文本生成的 OpenAI GPT-3 的开源替代品。

Stability.AI Stable Diffusion 于2022年8月推出,是 Open.AI的DALL-E 2 图像和视频的开源替代品。

两者都在价格、质量和易用性方面改变了游戏规则。在过去2个月中,生成图像的成本下降了100倍。在过去6个月里,通过网络和移动设备从这些模型中生成输出的摩擦已经“容易了大约10倍”。

高质量生成的文本、图像、代码、语音等正在迅速接近或达到人类质量。许多人认为我们已经通过了其中几个内容类别的图灵测试。这很难衡量,但当你看到它时,你就知道质量如何。

正如2021年斯坦福大学人工智能指数指出的那样,对于一些受限应用程序,人工智能已经达到了“足够高的标准,以至于人类很难分辨合成输出和非合成输出之间的区别”。我们正朝着“生成一切”的方向前进。

由于所有这些变化,实验量“在过去两个月中增加了大约20倍”。这加速了提供价值的应用程序的数量,并为相应社区带来了更多新进入的人。

这是技术领域的一个古老故事:壁垒下降,然后繁荣……寒武纪大爆发。我们还处于早期阶段,但生成式技术现在已经很流行了,正循环开始了。

我们相信它会比大多数人想象的更快发生。与自动驾驶汽车不同,生成式技术不受监管,也不需要完美以避免事故。与 VR不同,它已经很有用,不需要新硬件,并且正在迅速变得更好。

作为创始人,你可以相信,如今几乎每种类型的内容的成本和质量都足以让你的公司运转:文本、图像、代码、语音、3D、视频。

当然,当你组建团队并融到种子轮资金时,它就会存在。不要想太多。(为了展示它的移动速度,你可以搜一搜一个20 分钟的 Podcast.ai,是史蒂夫乔布斯与乔罗根谈话的内容。声音和脚本都是由 AI 生成的。)

我们今天所处的位置只是一个坡道。在经历了 14 年的近乎停滞之后,我们的大多数软件和人机界面现在有可能在未来 5 年内得到显著增强。这为创始人打开了机会之门。

生成式技术产品的特征

生成式技术产品有两层。

底层是AI模型。它能根据用户独有的输入生成新颖的输出,例如Open.AI的 DALL-E或GPT-3。制作和训练这些的通用版本可能需要1亿美元。训练应用更窄的版本可能不到1000万美元,而且价格下降得非常快。开源版本已经开始可行。

顶层是一个应用程序。这是你可以构建网络效应和嵌入效应以产生持久业务的地方。

这个堆栈将降低与某些领域相关的技术壁垒。你不必成为建筑师即可生成房屋改造图纸,不必成为插画师即可告诉DALL- 要画什么。这就是生成式技术能够解锁新公司和项目的原因。

这些新兴公司具有某些核心特征,有助于将它们置于生成技术连续体中。以下是我们总结的三大特征。

从0到1→从0到10

生成式技术从解决0到1的问题开始。最成功的公司最终将提供从0到10的解决方案,或者换句话说,提供满足用户完整需求的产品,并由AI模型激活。

你可以想象Latitude的AI Dungeon的一个版本,它结合了图像和视频以匹配文本让用户获得完整的游戏体验,或者允许你使用 AI 生成的图像或声音创建持久的在线角色。

我们已经看到了提供接近成品的生成式 AI 项目的示例。像SALT这样的项目,使用生成式技术工具的组合来快速生成视频(Stable Diffusion、MidJourney、DALL-E)、编写脚本 (GPT-3)、并生成角色声音(Murf、Synthesia)。

用创造生成代替个性推荐

生成式技术以我们以前从未体验过的方式进行个性化。

20 年来,我们一直在通过个性推荐追求个性化。电子商务公司、Netflix和 Spotify都希望从他们的中央数据库中为客户提供他们最有可能喜欢的精选产品。Facebook、TikTok 和纽约时报已经尝试过用个性推荐改善用户对其内容的体验。

这是一种非常受限的个性化方法,因为它基于调用现有数据。我们一直在努力将人们的偏好改进到我们现有的产品中,而不是产生最适合他们的新事物。生成式技术用创造取代个性推荐。生成式技术不是更复杂的数据库调用。它可以通过这个数据库进行训练,但其核心功能是在网络边缘生成新的东西。生成式技术巧妙地创造新颖的输出,提供给用户的内容、图像或体验本来并不存在,直到用户提出要求,或通过其他操作触发它。

这发生在音乐领域。Boomy、Amper、Aiva、Ecrett、SoundDraw和其他公司都是使用 AI 在几秒钟内生成完整长度的原创歌曲的公司。Boomy 还为创作者提供了分享这些作品并从中获利的工具。至关重要的是,Boomy 的 AI 可以生成适合任何心情和流派的即时音乐。在用户决定用它创作之前,这些音乐从未存在过。

在生成式技术出现之前的世界中,你可能会有一个根据你的设置和别人的推荐而形成的音乐播放列表。在生成技术出现后的世界中,你将生成适合自己的场合、心情、血压、心率、位置以及与你在一起的人的全新歌曲。

低摩擦界面

也许目前最大的突破是生成式技术工具的易用性。人工智能模型完成了众多繁重工作,从创作过程中消除了摩擦。DALL-E 和 Stable Diffusion 只需要简单的文本提示即可在 30 秒内生成令人惊叹的艺术作品。

生成通常是自动的。只要你输入,它就会发生。你可以想象一个版本的第二人生,其中两个角色一起进入一所房子,房子可以产生适合两个用户个性的全新事物,如艺术品、体验、音乐和角色。或者,如果你出售某物,它会自动生成 NFT。或者,你可以想象从你的照片、视频、文本和音乐中提取你的生活。这些将是人机协作的下一个层次。这是一种合作伙伴关系,你会感到惊讶和鼓舞。

生成式技术公司将做什么?

让我们来分析下一个伟大的生成式技术创意将来自何处——以及为什么它会来自你。

对于你的头脑风暴,请思考:如果我将一个或多个基础层 AI 模型与XX领域/应用结合起来会怎样?

生成式技术将影响的潜在应用包括:

头像、照片共享、流媒体视频、法律服务、天使投资和风险投资、选股、投资银行、新闻、体育、建筑、室内设计、活动策划、付款、贷款、信用卡、销售、营销、广告、文案、编剧、社交网络、约会网络、C2C 交易市场、B2B 交易市场等等。

人工智能模型业务

如果你是构建AI和ML模型的创始人,请查看上面的列表,看是否可以为该特定领域创建AI模型。如果你可以访问独特的数据,如果你是第一个看到应用领域的人,那么就可以通过在特定领域拥有一段时间内的最佳模型来获得优势。

这种优势可能不会持久,更通用的模型可能会侵蚀你的数据优势,或者竞争对手以更便宜的价格出售劣质但仍然有用的模型,就像过去两年通用模型所发生的那样。请记住,数据网络效应通常是渐近的。如果你能让它们成为实时的或超本地的,它们就会更耐用。

心智模型

  • 实现伟大的生成式技术创意的另一种方法是思考该业务如何运作。
  • 它如何产生网络效应,让每个新用户都能为其他每个用户增加价值?
  • 它如何融入企业或某人的生活中,让他们从长远来看不想停止使用它?
  • 哪里有适用于你的 AI 模型的超本地数据集,你可以拥有这些数据集并在以后的竞争中维持自己的数据网络效应?
  • 你可以在哪里插入现有工作流程、浏览器或应用程序?

基于生成式技术的应用程序提供什么功能?

今天显然有效的三个快速功能。随着时间的推移会有更多。

1. 最初的想法合作者

这有助于解决从0到1的问题。这些公司生成草稿或完成的项目,并结合传统的 SaaS 工具来帮助完善这些草稿。随着时间的推移,我们预计这些公司将朝着创造成品的方向发展,但从0到1是第一步。

Tailorbird的平面图生成引擎就是一个很好的例子,它创建了改造的初稿。基于简单语言输入生成广告文案或代码初稿的公司也是如此:比如Copy.ai或 Copysmith。

像 jasper.ai这样的公司向我们展示了这条道路如何最终创造出从0到10的解决方案。Jasper.ai提供跨学科(复制、电子邮件、社交等)的专业写作和图像功能。它是满足公司所有格式写作需求的一站式商店。他们现在正在尝试将其嵌入到公司中,这样他们就无法像企业 SaaS 公司那样将其移除。

这些产品让球在复杂的任务上滚动,并让人类从那里开始。

2. 指导/量身定制的反馈

我们通过反复试验的过程来学习。但是我们在教练的帮助下学得更快。我们希望 生成式技术能够分析我们的表现、提出建议或整合工具来磨练我们的技艺。其中许多应用程序一开始可能会让一些人感到不舒服。但他们将挑战我们在 AI 合作者的帮助下成长。这将成为新常态。

3. 规模的独特性

唯一性和可扩展性在历史上一直是不相容的概念。真正独特的事物不可能在不失去其定制品质的情况下大量存在。生成式技术改变了这一点。生成引擎能够大规模地为每个新用户或每个问题提供新的输出。

The.com允许用户在一个电子表格中生成数百个新网站。这些不是千篇一律的副本,它们设计精美,并且对应每个用户独一无二的需求。

生物界的一个例子是Insilico Medicine。Insilico Medicine 采用三种协同工作的人工智能产品。一个确定药物的新目标,而另一个从头开始生成新的候选分子,最后一个引擎根据之前的工作预测临床试验的结果。这是分析性 AI 方法(识别目标和分析试验结果)与生成式技术(生成新分子结构)相结合的一个很好的例子。

这类似于自然界中雪花的产生方式——每次暴风雨期间都会落下数百万片雪花,每次都与之前的雪花完全不同。但想象一下,每一片雪花都可以为企业创造收入、治愈疾病或激发喜悦。

现在给创始人的建议

要想以创始人的身份赶上这波浪潮,你需要在本周、本月的进步和学习这方面的信息和知识,而不是按月和年。除非你已经在火箭飞船上,在激流中,否则建议你暂停你正在做的事情并考虑专注于此。

在这个领域,越来越多的公司获得了投资。

在游戏领域,Latitude提供的全新游戏体验将通过生成式技术成为可能。现在的体验不仅仅是在旧游戏中与NPC的对话,而是在AI Dungeon等全新类型的游戏中。Latitude凭借其全新的Voyage游戏平台处于领先地位。他们在生成式技术的核心工作了 3 年,现在正与AI 21 Labs合作,进一步将自然语言处理集成到他们的平台中。

在法律领域,darrow.ai提供一种合法索赔挖掘服务,使用 AI 模型通过检测有害事件来生成新线索。它将细节汇编成律师事务所的新法律案例。它不是查找旧案例,而是根据一般提示生成特定的新案例。

在装修领域, Tailorbird使用深度学习为希望进行装修的房主制定新的平面图。这些计划是根据从网络上获取的照片和计划生成的,并与远程3D测量相结合,以生成许多新的空间设计效果图。这些生成的计划是很好的起点,它们还减少了与改造相关的时间和成本。

当一个新的行业像这样开放时,创始人通常可以比在更容易理解并因此更具竞争力的领域更容易找到容易实现的成果。生成式技术将具有不同寻常的市场动态,因为它已经达成共识。

通常,重大技术变革会缓慢展开。直到2003年,许多人仍然对互联网持怀疑态度,所以我们这些相信互联网的人竞争较少。从1997年到2005年,SaaS获得了共识。Apple 在发布后的18个月内没有向外部开发人员开放他们的iOS平台。Web3 已经推出 10 年了。

但每个人都支持生成式技术。风投们明白了,创始人明白了,“前浪”们明白了,很明显,游戏现在开始了。所以投入进去吧。

这对创始人来说意味着:

1) 你必须非常非常快地行动。大胆很重要。

2)你必须非常仔细地选择你的想法。你决定构建什么、你的目标客户是谁以及你的分销渠道非常重要。你可以追求水平或垂直、特定数据类型或地理位置。今天的生成技术领域有很多选择。

例如,当Facebook推出时,有50多个社交网络具有相同的5个功能。社交网络已经是“共识”。但Facebook是从哈佛大学的大学生开始的,结果证明这是正确的关注点。你将不得不在这个共识市场中做出类似的重点选择。

以下是我们按顺序向创始人提出的建议:

创办一家新公司来做新事情并创造新市场(就像 Darrow、Jasper和Latitude 所做的那样)

以这项技术为核心,而不只是作为一项功能,创办重做旧业务的新公司。例如 Tailorbird,或CRM,客户服务软件等。

将生成式技术功能添加到您现有的产品中以使其与众不同。

如何在生成式技术中快速增长和防御

如果你正在为企业建立一个生成技术业务,为了快速增长,请准备好成为现有系统的插件。不要试图替换工作流或替换现有的软件系统。为了获得防御,嵌入客户现有的工作流程和软件中。你看到Jasper宣布他们希望成为浏览器插件,让所有知识工作者能够访问所有底层AI模型的文本、图像等。当然,他们不会全部接受,但他们的插件方法是正确的两者都很重要:易于实施和嵌入工作流程。

另一个很好的企业示例是Tabnine,它模仿GitHub的CoPilot代码生成器。它不会取代程序员的代码编辑器,它只是为了快速增长而居于首位。Tabnine所做的防御措施是围绕其确切的代码库为其服务的每家公司构建超本地数据网络效应,从而将这些客户锁定在Tabnine中。将工作流的嵌入与可保护的数据护城河相结合是持久性的良好组合。

如果你正在构建B2C,它的结局会更开放。消费者喜欢新奇事物,并愿意更快地采用新行为。只要确保快速行动并获得网络效应即可。

如果您正在为SMB构建产品,它可能介于全新产品和即插即用产品之间。

减速带

在生成式技术中,仍然存在版权和安全问题,我直接知道这些问题的真实性。此外,创始人应该注意不要制造具有大规模社会破坏性的武器。此外,作为一家重要公司的创始人,你需要为社会负责,而不仅仅对你的股东负责。

但是伟大的创始人会直面风险并迅速解决挑战。不要让这些顾虑拖慢你的脚步。最好是考虑周全,表现出色,并且尽早进入该领域——成为解决问题的人——而不是落在后面,在场边皱着眉头绞着你的手。

本文编译自NFX,作者James Currier。

本文为转载内容,授权事宜请联系原著作权人。