正在阅读:

产业等待AI“造铲人”

扫一扫下载界面新闻APP

产业等待AI“造铲人”

AI应用的真正爆发,或许离我们还有点远。

图片来源:界面新闻 匡达

文|光子星球 吴坤谚

编辑|吴先之

一家刚刚引入大厂AI能力不久的医疗SaaS企业,正在面临由产业规模扩张带来的沉没成本困境。

其市场部经理孙胜表示,早在大模型与AIGC秋风扫落叶似地席卷中文互联网之前,这家公司便通过首轮融资中的5亿元搭建好了架构与产品,在2022年中到2023年中的一年内做到了盈亏平衡。

然而“行业大模型”叙事的出现彻底打乱了他们的节奏,在竞争趋烈的SaaS赛道,引入AI似乎不可避免。

于是,该公司又在AI能力以及相关架构的产研上,前前后后投入了数亿元。此举换来的是新老架构冲突、产品混乱以及定价的问题——客户好像并不需要当下称不上成熟的AI能力,然而这部分成本却又难以通过老产品转嫁出去。

这只是AI在垂直领域落地的一角,由此管中窥豹,虽然AI工具不断“入侵”人类社会,但是如雨后笋般不断冒出的各类新式AI工具的冲击却迟迟撞不开那道名为“普及”的大门。

AI工具并非一套封闭的技术体系,需要的是在相应场景中,通过交互与人类智能互缘重构。

过去,我们一度认为“幻觉”是阻碍AIGC以及大模型进入千行百业的根本原因。但实际情况是,大厂也好创企也罢,其AI+的产品落地更多的是受到了成本和场景的桎梏,这让市场上一众“80分的模型最终只能落地为60分的产品”。

由这些限制而产生的,从及格到优秀的这一小段距离,已然成为人类社会智能化转型的一道天堑。

PMF的“鬼故事”

“原定在年中准备参加的几个活动中,一些是直接被取消,还有一些是缩减参会人员,减少开支”,孙胜说,“公司在A轮融到的钱已经花得七七八八了,新的融资还没有迹象”。

他坦言,曾经一度称得上顺风顺水的BD不仅没能乘上大模型东风,反而是在引入AI之后变得更“难”了。他得到的回复不外乎AI的准确性、成本以及缺少相关案例这几类,这其中或许有医疗行业相对孤立于互联网之外而缺乏有效数据的缘故,但不可否认的是,AI问诊、开药等功能时常在“帮倒忙”。

相似的情况,我们不难在同为高知行业的法律与金融等行业上找到。

一位投资人告诉光子星球,他看到过多起由投资人指定的AI+法律方向的投资,天使轮融资额一般在七位数,然而几乎绝大多数都倒在了模型幻觉导致的法律条文准确性问题上。“投资款几乎都用来买数据和算力,B端赞助算力的话就招兼职开发,团队之间少有开工资的,主打一个为爱发电”。

在更为依赖人类智能决策的金融领域,行业对AI的工具应用态度更为审慎。朱雀基金经理Michael坦言道,目前业内的主流应用仍是去年便开始推广的金融新闻生成、客服以及报告总结。即使是对新兴技术态度相对更为激进的同花顺,在与百度合作后也未有什么大动作。

至于在NLP时期便有爆发迹象的智能投研则是随着大模型的到来彻底熄火——过去机器学习的过拟合缺陷已然被更大的数据与训练规模升格为“幻觉”,浅显易懂的词汇也加重了这个缺陷的分量。过去的智能投研拿不到Alpha(与市场不相关的超额收益),现在更加拿不到。

医疗、法律与金融一直是社会财富较为集中且追求人效的行业,当AIGC及应用爆发后,这也自然而然地成为大厂创企共同瞄准的落地场景。既然能解决一切问题的AGI还遥遥无期,那么在PMF(Product Market Fit,产品市场匹配度)的第一性之下,从需求切入并反向推动技术迭代便是题中之义。

在创业成本相对较低且主要面向消费市场的移动互联网时代,PMF的正向或逆向工程都能跑出一定成绩,但在成本巨大、市场不明确的AI赛道,PMF逆向工程的前方多是dead end。

说白了,全球资源集中攻坚下,AI技术跑得太快,GPT3.5到GPT4的里程碑跨越仅耗时数月,当我们以为大模型能力遭遇瓶颈时,Sora又吹响了多模态的号角。这让一度陷入FOMO的创业者和PM们根本没有时间去做用户研究,只能事先构想需求和场景,以此打造产品并试图通过实际场景中的应用快速迭代。

问题是AI赛道PMF并非一群PM排排坐拍脑门就能产生的玩意,更非一些技术出身的创业者,在对绝大多数行业一知半解的情况下,依靠AI这种技术力量便能降维打击的领域。

上述情况在当下主要面向B端的AI工具类服务中的直观体现,便是光子星球曾在《大模型没过“试用期”》中提到的“客户AI业务的‘保姆’”,在为客户定制一匹更快的“马”的路上做无用功,而真正的“汽车”却隐藏在工具之下的模型底层中。

内容产业的迷思

如果说AI工具在B端的落地受到了既往的定制化叙事与过度产研的拖累,导致产品难以进入实际场景,那么场景更为明确的C端是否会有所不同?

单从供给侧看,C端AI应用的发展如火如荼,如字节跳动、百度、腾讯等大厂围绕自研模型,为AI拉出了数条独立产品线,其中字节更是海内外同步推进,旗下多款应用都推出了海内外双版本。

不过当下大厂产品扎堆的AI社交,其产品形态诞生于去年末,不仅受限于模型能力输出的限制,导致设计与功能上高度趋同,于用户而言也大多只有尝鲜一用,如字节旗下的对话应用“猫箱”便只能徘徊在iOS免费榜的末端。相比之下,用户忠诚度更高的效率类工具与多模态工具才是玩家们掘金的目的地。

然而,这些工具在落地上同样遭遇了场景受限的问题,C端场景并不比B端更丰富,因为效率工具本身服务的便是相对专业的内容生产者。就像图文、视频的媒体变革带来的UGC风潮被细分为UGC(用户生产内容)与PUGC(专业用户生产内容),而PUGC对生产工具的要求与B端可以说大差不差。

我们了解到,不少尝试Suno、网易天音、天工等AI音乐工具的工作室与音乐人仅仅以此作为辅助创作的形式,并且付费意愿不高。至于由Sora带火的文生视频赛道,则相对更为前景未明,一个例证是北京电影节、麻省理工学院、爱奇艺等不同主体召开AI视频相关大赛,这一赛道的商业化明显还处于培养的初级阶段。

好似2016年的阿尔法狗,文生视频赛道还在扩充供给侧的规模,需求侧则是无从谈起。

只不过相比于决策成本更高、定制化需求更重的B端,普通用户、专业生产者与组织的付费门槛更低,更愿意尝试。不过这也引出了当下大模型能力在工具产品落地上的另一大问题。

“看过很多团队,请了清北的算法大牛,不停微调模型、优化prompt,但是能在产品层面上体现出来的大多还是原地踏步。”

在这位投资人眼中,“原地踏步”并非止步不前,而是大多AI工具上不去也下不来——门槛并未降低到消费级水平,而专业性却又难以满足专业领域人士。

其中比较典型的是音乐产业,且不提AI作曲大多缺乏情感、“平淡如水”,更重要的是多位音乐人向我们反映过基于大模型的AI音乐工具在生产流程上是“反人类”的。以Suno为首的AI音乐工具直接大包大揽的AI作曲的全流程,当创作者好不容易prompt出了一首能听的歌,还得自己“扒谱”、分轨。

这对于未受过专业和弦学习、创作能力较差的小白来说可堪一用,但对于专业的音乐人而言,简直是灾难。相比之下,并未在大模型之下接受重构的网易天音反而脱颖而出。

网易天音是网易基于NLP学习而包装产品化的AI编曲平台,去年与微软小冰合作从而引入了人声生成功能。音乐人可以按音乐生产流程中的风格、乐器、调号、拍号、速度以及时长等要素产出Demo并分轨导出,相对更贴合生产语境。但与之相对的,这也使其较自然语言交互生成的大模型AI音乐,距消费场景更远了。

上述情况直指当下大模型能力被高估的现状,专业生产者还没玩明白,何况是消费语境下的小白?

移山

病来如山倒,病去如抽丝。大模型对商业社会的冲击就好比是一场“病”,希望进入千行百业的大模型需要的恰恰是消解其科技属性所带来的冲击叙事,让企业与用户使用大模型能力进入“常态化”。

这不免又将我们带回前文所述的PMF问题,如今业内找PMF之所以会造成“自以为是”的情况,在于AI这个崭新变量改变了过去移动互联网的思维与商业模式。这意味着,AI大模型落地的搬山之旅需要的是就PMF这个“初级理论”进行革新。

值此情况下,大厂与创企基于自己的资本与生态位,走出了不同的道路。

百度、腾讯、阿里等头部玩家大多都持有雄厚的基础设施,这导向了以基建为抓手,将开发者作为模型能力的延伸,以触达更多场景的路线。以百度为例,其于4月16日召开的Create2024百度AI开发者大会上公布了AI原生应用平台千帆Appbuilder,目前千帆社区上已有19万款应用,应用商店的成熟应用数量也达到了317款。

相比大厂的“稳扎稳打”,底子相对更薄、更需要精打细算的创企却相对更玩得开。2023年4月,视频赛道的知名创企HeyGen创始人 Joshua Xu便在官方博客中分享了他们在7个月实现100万美元ARR的历程,其中特别将AI浪潮中的PMF概念称呼为“AMF”(AI市场匹配度)。

Joshua Xu称其通过Fiverr(一家国际自由职业者平台)找到了第一个付费客户。平台在其中的作用是,让HeyGen仅在初步技术探索的基础上,以产品Demo和“代言人(spokesperson)”这个细分场景便完成了与需求的匹配。

或许,从PMF精细化至AMF,需要的并非闭门造车,而是一个能更高效匹配AI能力与需求的新工具或平台。

此外,零一万物创始人李开复也在5月13日的发布会上更新了AI时代的PMF概念——TC-PMF(Product-Market-Technology-Cost Fit,技术成本与产品市场契合度)。他认为,由于大模型的推理成本过高,即使推理成本以10倍的速度在下降,AI产品的落地也必须将成本作为必须考虑的要素之一。

这么看来,AI工具的落地要么是冲不破用户与场景的限制,要么是ROI打不平。

2024即将行至半程,显然业内对其成为应用爆发元年的判断有些乐观了。唯一能确定的历史爆点是GPT,而应用的真正爆发,或许离我们还有点远。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

产业等待AI“造铲人”

AI应用的真正爆发,或许离我们还有点远。

图片来源:界面新闻 匡达

文|光子星球 吴坤谚

编辑|吴先之

一家刚刚引入大厂AI能力不久的医疗SaaS企业,正在面临由产业规模扩张带来的沉没成本困境。

其市场部经理孙胜表示,早在大模型与AIGC秋风扫落叶似地席卷中文互联网之前,这家公司便通过首轮融资中的5亿元搭建好了架构与产品,在2022年中到2023年中的一年内做到了盈亏平衡。

然而“行业大模型”叙事的出现彻底打乱了他们的节奏,在竞争趋烈的SaaS赛道,引入AI似乎不可避免。

于是,该公司又在AI能力以及相关架构的产研上,前前后后投入了数亿元。此举换来的是新老架构冲突、产品混乱以及定价的问题——客户好像并不需要当下称不上成熟的AI能力,然而这部分成本却又难以通过老产品转嫁出去。

这只是AI在垂直领域落地的一角,由此管中窥豹,虽然AI工具不断“入侵”人类社会,但是如雨后笋般不断冒出的各类新式AI工具的冲击却迟迟撞不开那道名为“普及”的大门。

AI工具并非一套封闭的技术体系,需要的是在相应场景中,通过交互与人类智能互缘重构。

过去,我们一度认为“幻觉”是阻碍AIGC以及大模型进入千行百业的根本原因。但实际情况是,大厂也好创企也罢,其AI+的产品落地更多的是受到了成本和场景的桎梏,这让市场上一众“80分的模型最终只能落地为60分的产品”。

由这些限制而产生的,从及格到优秀的这一小段距离,已然成为人类社会智能化转型的一道天堑。

PMF的“鬼故事”

“原定在年中准备参加的几个活动中,一些是直接被取消,还有一些是缩减参会人员,减少开支”,孙胜说,“公司在A轮融到的钱已经花得七七八八了,新的融资还没有迹象”。

他坦言,曾经一度称得上顺风顺水的BD不仅没能乘上大模型东风,反而是在引入AI之后变得更“难”了。他得到的回复不外乎AI的准确性、成本以及缺少相关案例这几类,这其中或许有医疗行业相对孤立于互联网之外而缺乏有效数据的缘故,但不可否认的是,AI问诊、开药等功能时常在“帮倒忙”。

相似的情况,我们不难在同为高知行业的法律与金融等行业上找到。

一位投资人告诉光子星球,他看到过多起由投资人指定的AI+法律方向的投资,天使轮融资额一般在七位数,然而几乎绝大多数都倒在了模型幻觉导致的法律条文准确性问题上。“投资款几乎都用来买数据和算力,B端赞助算力的话就招兼职开发,团队之间少有开工资的,主打一个为爱发电”。

在更为依赖人类智能决策的金融领域,行业对AI的工具应用态度更为审慎。朱雀基金经理Michael坦言道,目前业内的主流应用仍是去年便开始推广的金融新闻生成、客服以及报告总结。即使是对新兴技术态度相对更为激进的同花顺,在与百度合作后也未有什么大动作。

至于在NLP时期便有爆发迹象的智能投研则是随着大模型的到来彻底熄火——过去机器学习的过拟合缺陷已然被更大的数据与训练规模升格为“幻觉”,浅显易懂的词汇也加重了这个缺陷的分量。过去的智能投研拿不到Alpha(与市场不相关的超额收益),现在更加拿不到。

医疗、法律与金融一直是社会财富较为集中且追求人效的行业,当AIGC及应用爆发后,这也自然而然地成为大厂创企共同瞄准的落地场景。既然能解决一切问题的AGI还遥遥无期,那么在PMF(Product Market Fit,产品市场匹配度)的第一性之下,从需求切入并反向推动技术迭代便是题中之义。

在创业成本相对较低且主要面向消费市场的移动互联网时代,PMF的正向或逆向工程都能跑出一定成绩,但在成本巨大、市场不明确的AI赛道,PMF逆向工程的前方多是dead end。

说白了,全球资源集中攻坚下,AI技术跑得太快,GPT3.5到GPT4的里程碑跨越仅耗时数月,当我们以为大模型能力遭遇瓶颈时,Sora又吹响了多模态的号角。这让一度陷入FOMO的创业者和PM们根本没有时间去做用户研究,只能事先构想需求和场景,以此打造产品并试图通过实际场景中的应用快速迭代。

问题是AI赛道PMF并非一群PM排排坐拍脑门就能产生的玩意,更非一些技术出身的创业者,在对绝大多数行业一知半解的情况下,依靠AI这种技术力量便能降维打击的领域。

上述情况在当下主要面向B端的AI工具类服务中的直观体现,便是光子星球曾在《大模型没过“试用期”》中提到的“客户AI业务的‘保姆’”,在为客户定制一匹更快的“马”的路上做无用功,而真正的“汽车”却隐藏在工具之下的模型底层中。

内容产业的迷思

如果说AI工具在B端的落地受到了既往的定制化叙事与过度产研的拖累,导致产品难以进入实际场景,那么场景更为明确的C端是否会有所不同?

单从供给侧看,C端AI应用的发展如火如荼,如字节跳动、百度、腾讯等大厂围绕自研模型,为AI拉出了数条独立产品线,其中字节更是海内外同步推进,旗下多款应用都推出了海内外双版本。

不过当下大厂产品扎堆的AI社交,其产品形态诞生于去年末,不仅受限于模型能力输出的限制,导致设计与功能上高度趋同,于用户而言也大多只有尝鲜一用,如字节旗下的对话应用“猫箱”便只能徘徊在iOS免费榜的末端。相比之下,用户忠诚度更高的效率类工具与多模态工具才是玩家们掘金的目的地。

然而,这些工具在落地上同样遭遇了场景受限的问题,C端场景并不比B端更丰富,因为效率工具本身服务的便是相对专业的内容生产者。就像图文、视频的媒体变革带来的UGC风潮被细分为UGC(用户生产内容)与PUGC(专业用户生产内容),而PUGC对生产工具的要求与B端可以说大差不差。

我们了解到,不少尝试Suno、网易天音、天工等AI音乐工具的工作室与音乐人仅仅以此作为辅助创作的形式,并且付费意愿不高。至于由Sora带火的文生视频赛道,则相对更为前景未明,一个例证是北京电影节、麻省理工学院、爱奇艺等不同主体召开AI视频相关大赛,这一赛道的商业化明显还处于培养的初级阶段。

好似2016年的阿尔法狗,文生视频赛道还在扩充供给侧的规模,需求侧则是无从谈起。

只不过相比于决策成本更高、定制化需求更重的B端,普通用户、专业生产者与组织的付费门槛更低,更愿意尝试。不过这也引出了当下大模型能力在工具产品落地上的另一大问题。

“看过很多团队,请了清北的算法大牛,不停微调模型、优化prompt,但是能在产品层面上体现出来的大多还是原地踏步。”

在这位投资人眼中,“原地踏步”并非止步不前,而是大多AI工具上不去也下不来——门槛并未降低到消费级水平,而专业性却又难以满足专业领域人士。

其中比较典型的是音乐产业,且不提AI作曲大多缺乏情感、“平淡如水”,更重要的是多位音乐人向我们反映过基于大模型的AI音乐工具在生产流程上是“反人类”的。以Suno为首的AI音乐工具直接大包大揽的AI作曲的全流程,当创作者好不容易prompt出了一首能听的歌,还得自己“扒谱”、分轨。

这对于未受过专业和弦学习、创作能力较差的小白来说可堪一用,但对于专业的音乐人而言,简直是灾难。相比之下,并未在大模型之下接受重构的网易天音反而脱颖而出。

网易天音是网易基于NLP学习而包装产品化的AI编曲平台,去年与微软小冰合作从而引入了人声生成功能。音乐人可以按音乐生产流程中的风格、乐器、调号、拍号、速度以及时长等要素产出Demo并分轨导出,相对更贴合生产语境。但与之相对的,这也使其较自然语言交互生成的大模型AI音乐,距消费场景更远了。

上述情况直指当下大模型能力被高估的现状,专业生产者还没玩明白,何况是消费语境下的小白?

移山

病来如山倒,病去如抽丝。大模型对商业社会的冲击就好比是一场“病”,希望进入千行百业的大模型需要的恰恰是消解其科技属性所带来的冲击叙事,让企业与用户使用大模型能力进入“常态化”。

这不免又将我们带回前文所述的PMF问题,如今业内找PMF之所以会造成“自以为是”的情况,在于AI这个崭新变量改变了过去移动互联网的思维与商业模式。这意味着,AI大模型落地的搬山之旅需要的是就PMF这个“初级理论”进行革新。

值此情况下,大厂与创企基于自己的资本与生态位,走出了不同的道路。

百度、腾讯、阿里等头部玩家大多都持有雄厚的基础设施,这导向了以基建为抓手,将开发者作为模型能力的延伸,以触达更多场景的路线。以百度为例,其于4月16日召开的Create2024百度AI开发者大会上公布了AI原生应用平台千帆Appbuilder,目前千帆社区上已有19万款应用,应用商店的成熟应用数量也达到了317款。

相比大厂的“稳扎稳打”,底子相对更薄、更需要精打细算的创企却相对更玩得开。2023年4月,视频赛道的知名创企HeyGen创始人 Joshua Xu便在官方博客中分享了他们在7个月实现100万美元ARR的历程,其中特别将AI浪潮中的PMF概念称呼为“AMF”(AI市场匹配度)。

Joshua Xu称其通过Fiverr(一家国际自由职业者平台)找到了第一个付费客户。平台在其中的作用是,让HeyGen仅在初步技术探索的基础上,以产品Demo和“代言人(spokesperson)”这个细分场景便完成了与需求的匹配。

或许,从PMF精细化至AMF,需要的并非闭门造车,而是一个能更高效匹配AI能力与需求的新工具或平台。

此外,零一万物创始人李开复也在5月13日的发布会上更新了AI时代的PMF概念——TC-PMF(Product-Market-Technology-Cost Fit,技术成本与产品市场契合度)。他认为,由于大模型的推理成本过高,即使推理成本以10倍的速度在下降,AI产品的落地也必须将成本作为必须考虑的要素之一。

这么看来,AI工具的落地要么是冲不破用户与场景的限制,要么是ROI打不平。

2024即将行至半程,显然业内对其成为应用爆发元年的判断有些乐观了。唯一能确定的历史爆点是GPT,而应用的真正爆发,或许离我们还有点远。

本文为转载内容,授权事宜请联系原著作权人。