文|光子星球 吴坤谚
编辑|吴先之
急需找到新飞轮的手机厂商,盯上了大模型。
华为在8月初的开发者大会上宣布将在 HarmonyOS 4中搭载的AI助手小艺接入大模型,并在8月底邀测;小米也差不多同一时间开启了其AI助手小爱接入大模型的邀测。OPPO与vivo紧随其后,两者均在11月开始手机大模型的落地尝试。
“将大模型塞进手机”于业界并不是新鲜事儿,不谈自10月中旬开始密集预热的vivo,荣米O三家均曾在今年召开的发布会上透出过相关消息。业界普遍看法是智能手机赛道的硬件部分几乎卷无可卷,而大多跑在云端的大模型恰是一个游离于硬件之外的变量。
需要注意的是,端侧部署对大模型赛道而言同样也是行业趋势。以ChatGPT为例,作为云侧大模型的典型代表,其训练与推理都跑在微软的Azure上,用户则通过浏览器或App获取结果。input-output来回之间,不仅存在影响使用体验的时延,耗能、算力等云端成本也居高不下。
从实际场景与需求来看,不少需求完全可以通过边缘设备来满足,尤其是手机、PC、新能源车等广泛应用的终端。
于是,大模型的端侧部署逐渐成为共识,不仅有手机厂商铆足了劲训练模型,PC赛道联想与芯片赛道的高通等均在前段时间发布了端侧AI的相关解决方案。尤其是刚刚发布的高通骁龙8 Gen3以及联发科天玑9300,其AI性能的提升可以说是手机端大模型的基础。
行业需求与硬件条件都已被满足,大模型终于可以进入手机之内。可令人颇为意外的是,率先掏出“完整产品”的手机厂商竟是vivo。
vivo大模型成色如何?
11月1日,vivo召开开发者大会,于会上发布了自研大模型矩阵"蓝心"(BlueLM),包含十亿、百亿、千亿等不同参数规模。同时还发布了适配其大模型的自研操作系统OriginOS 4。
面对大模型这块“应许之地”,vivo的急切几乎写在脸上。
据10月26日市场调研机构Canalys公布的最新数据,vivo出货量出货量下滑,排名也出现下跌。vivo迫切需要大模型以及OriginOS 4来扭转局势,率先下场“开卷”并不让人意外。
而且与大模型相比,本次vivo推出的OriginOS 4的更新跨度略显寡淡。在公域讨论中,不仅其虚拟显卡、异构计算空间与轻量化等迭代幅度不及预期,vivo用户中声量颇高的原子通知等模块也没有升级。也就是说,大模型才是本次发布会的主角。
从业务模式看,vivo本次发布会展示的路线与此前业内其他玩家相似,以人工智能助手为载体,采取端侧+云侧混合的部署方式,其中作为重头戏的端侧大模型,呈现本地化、轻量化的明显特征。
这么做的目的显而易见,手机这一方小天地所提供的功耗、算力与机房不可同日而语。只是如何将模型能力与手机深度结合成为手机厂商们迫切需要突破的“konw how”。
对此,vivo给出的解决方案是推出多参数规格模型,其中主要面向文本场景的10亿规格与面向自然对话、知识问答长焦的70亿规格为端侧部署的重头戏。在官方介绍中,10亿规格单独面向端侧,70亿规格设为端云两用,自700亿起均为云端部署,这也体现了vivo在端云协同上“让上帝的归上帝,让凯撒的归凯撒”的矩阵思路。
这与谷歌在今年5月的 I/O 开发者大会如出一辙,当时谷歌发布的大模型 PaLM2 有四个参数规格,其中小参数模型可在离线状态下实现每秒处理20 tokens,适配于终端的离线使用。
如果就此认为vivo是“拾人牙慧”则未免过于严苛。实际上,vivo早在2017年便着手组建内部人工智能团队,时至今日,vivo人工智能研究院已有过千研究人员。
纵使其技术沉淀总体上不如阿里、百度等第一梯队,但开源社区的存在也让稍晚入场的玩家们能迅速赶上大部队。而vivo在2018年成立的知识图谱研究院也能在一定程度上补强其作为手机厂商可能遭遇的训练数据不足问题。
至于模型能力方面,vivo在预热时期便交出了一份不错的答卷。据悉,BlueLM在中文大模型第三方测评集C-Eval中获得了“受限访问模型”类目的第一名。其官方通告中称BlueLM是行业内首家7B端侧大模型。
但是在测评中斩获高分却实际表现不如人意的模型不在少数,更是有业内人士称这份榜单已经在过去一段时间被“刷脱皮”了,只能代表模型“做题”的能力而无法体现推理、安全、应变等能力。照此来看,vivo的业务成果显然还需要更多实际检验。
况且,vivo目前展示的云端模型能力如文生图、交互等并未跳出大模型赛道窠臼,新意有限。而且其作为重头戏的端侧模型能力还停留在测试阶段,同时端侧能力的展现也必然受到手机硬件的限制。
我们了解到,多位受邀参与蓝心内测的用户使用的是以X90 Pro为代表的旗舰机,这批机型也是目前vivo释出的大模型应用公测适配时间表中最为靠前的。
毫无疑问,大模型正在成为手机厂商开辟高端化的第二战场,同时也是盘活用户,激活IoT的重要变量。尽管如此,vivo依靠大模型增加高端产品价值的打算,还存在诸多变量
归根结底,大模型的推出既是vivo高端化的新基石,也是其试图拉动新机与高端产品的一驾马车。
低端机型自然难以胜任这场高端化的战争。以vivo于本次发布会前发布的基础机型Y100为例,这是上述适配计划中最晚上线的机型之一,如此类似“背刺”的举动背后是vivo希望靠高端产品重回王座的“小算盘”。
纵使如此,大模型的推出还是不太能成为vivo高端产品的加分项。
开源社区端侧大模型创业者王阳(化名)告诉光子星球,大模型在端侧的能力表现在于其NPU(专门为深度神经网络计算而设计的处理器)所带来的AI性能。而在vivo既往机型中,并不注重NPU能力,因此老机型大概率难以顺畅地跑大模型。
至于即将发布的,搭载联发科天玑9300旗舰芯片与新一代AI处理器的新机型vivo X100系列或许能顺畅使用模型能力,但在在市面上早已存在文心一言、讯飞星火等大模型应用的情况下,留给手机端的空间没有想象中那么大。相比于能力,或许vivo这次展示的玩法更值得深究。
让手机再智能一些?
力推微软成为 OpenAI 天使投资人的微软CTO Kevin Scott 曾公开表示,模型本身不是产品,而是基础设施。言下之意是在训练精调出模型底座后,产品化的探索才是一众玩家们“二次创业”的核心。
大模型于手机端的“再产品化”水到渠成,但部署于手机端的大模型,还需要进一步产品化探索。从目前曝光的信息看,vivo将通过一款名为小V助手的应用来实现大模型能力,而目前业内主流路线也是将大模型能力嵌入既有的人工智能助手之上。
智能手机使用者存在对大模型理解能力的现实需求,无论是被戏称为“人工智障”的智能助手还是在容量爆炸下日益臃肿的应用与数据,都需要手机能更懂交互,帮助用户梳理信息。而大模型的加入,本质上便是为手机带来自然语言理解能力。
未落地实装的情况下,端侧模型可能出现的功耗、散热、时延等用户体验问题可以暂且不谈。在王阳看来,vivo模型落地面临的首要问题是多款模型配合使用时,如何区分不同模型的能力边界以及如何调用,“这关乎最终的产品形态以及呈现”。
面对场景泛化且需求复杂的C端,不同需求调用的模型各不相同。例如端侧的10亿规格模型与70亿规格模型需要针对用户本地数据学习,试图“更懂用户”。那么能否通过模型能力以及与之适配的OS,在手机上实现复杂指令是重要指标。
目前来看,BlueLM展示的复杂指令功能颇具亮点。在新发布的OriginOS 4之下,小V助手常驻侧边栏的右下角,点击即可弹出。不仅操作逻辑相对云侧模型更短,更适配手机使用,同时也可以理解OS内的一些复杂指令,例如智能搜索相册、初步完成第三方App指令以及OS内设置等。
值得一提的是,小V助手在功能与路径上,和vivo既有的Jovi语音存在隔离,两者相互独立,这是明显有别于此前其他厂商提出的端侧大模型路径。
从功能上看,小V助手基本可以做到Jovi语音的全覆盖,那么两者区分的目的很可能是为了便于用户感受两者之间的差别。而且小V助手的产品逻辑形态与微软全家桶中搭载的Copilot相似,两种不同的路径很可能会在未来完成整合。
这也体现出目前的BlueLM还处于试水阶段,产品形态难言成熟。
据参与BlueLM内测人士反馈,以vivo旗舰机型使用模型能力,输入20 tokens以内的纯文本生成需求还存在2s~5s的时延,这对于后续实装而言不算是个好消息——云侧模型的时延并未得到很好的解决。这一点或许会在搭载芯片厂商最新AI芯片的机型中得到改善,只是对于消费者来说,这并不构成换机的理由。
此外,作为行业内首个手机大模型,vivo的云侧模型能力还面临许多云厂商大模型的“围剿”。
例如vivo宣布将上线应用商店的对话机器人蓝心千询,1750亿的参数规格与当下应用商店中的大模型相比并不显眼。云厂商中的百度已经就近日发布的文心4.0专业版试水收费,而蓝心千询看起来更多只是vivo大模型生态中不算亮眼的一员,其道路显然有阻且长。
不得不提的还有vivo作为后来者,技术沉淀的差距也将限制其大模型业务的进一步推进。
软件方面,vivo大模型已经成为阿里云旗下Pai机器学习平台的宣传素材,我们甚至可以从“蓝心千询”的命名中找到“通义千问”的影子。跑在云上的业务意味着长期成本,这一点在OpenAI上体现得淋漓尽致。成本视角下,如果vivo希望将BlueLM发展成为长期生态,自建IDC显然比上云更利于长期发展。
硬件方面,华为与苹果两家头部厂商早已在现有产品线中集成自研的NPU能力,vivo则还需依赖于芯片厂商。即使模型训练与调优方面可以构筑一定壁垒,但作为核心的硬件差距仍导致其与头部厂商拉开了数个身位。
大模型的终端战事
大模型的加入,让我们重新认识到智能手机的本质是一种集成多种能力的智能终端,且同时身兼硬件与OS两大入口。得天独厚的条件使得手机天然需要与大模型相结合。
那么其他终端是否也可以接入大模型,就像重做应用一样重新定义终端的能力边界?
对于这一问题的探寻可以追溯到深度学习网络爆发之时,而对端侧模型可能性探讨也源于业内人“老生常谈”的时延、能耗、隐私等问题,大模型的爆发成功地让手机成为装旧酒的“新瓶”。
实际上,早在本次往手机里塞大模型的热潮正式开启前,新能源车携自动驾驶早已成为大模型的一个终端。业内也不乏智能可穿戴设备搭载大模型的畅想,只是手机似乎即将凭借场景多样性与网络便利而后发先至。
更进一步说,当手机厂商密集发布大模型并投入使用后,届时便是端侧模型的一个绝佳的练兵场。我们也可以自手机大模型的落地情况,探讨多种终端搭载大模型的方法论。
毕竟,无论手机上的模型如何出色,短时间内能做到的最佳表现无非是一位用户生活领域的“秘书”。其他智能终端搭载大模型所带来的想象力无疑更大。
例如目前因移动支付而逐渐退出历史舞台的ATM,能否凭借大模型,让用户无需前往银行排队办理深度业务;亦或是同属B端场景的智能摄像头,在医疗领域识别患者基本体征、在工业领域快速质检、在农业领域智能灌溉等。而今凭借云侧模型未能广泛打开的B端市场,也可能将迎来端侧这一变量。
这也是为什么vivo会在其生态尚不及华为、小米完善之时,便在本次发布会上展示了搭载在新款vivo Watch的蓝河操作系统(BlueOS)。作为vivo面向通用人工智能时代研发的跨端系统,其推出旨在通过手机带动一系列IoT产品,无疑具备不错的想象空间。
vivo亦宣布开源其7B规格模型,并推出了蓝心大模型开发套件BlueKit,生态建设的野心昭然欲揭。或许目前vivo只走到了让IoT听得懂指令的阶段,但这对于vivo其后的高端化、生态化等战略相当重要。
手机大模型的能力未知,面临的挑战很多,正式发布与落地之后,势必为业内带来更多“开卷”的方向。更多千奇百怪的落地姿势,正在等待业界的解锁。
评论