正在阅读:

BAT一号位“再创业”

扫一扫下载界面新闻APP

BAT一号位“再创业”

国产大模型,大厂都不肯输。

界面新闻|范剑磊

文 | 蓝洞商业 赵卫卫

间隔不到一个月,百度、阿里先后高调发布自研AI大语言模型。

继3月16日,百度发布对标ChatGPT的聊天机器人「文心一言」之后;4月11日上午阿里云峰会上,阿里也发布了自家的ChatGPT产品「通义千问」。在国产AI大模型这条赛道上,有ChatGPT类产品比没有更重要。

互联网大厂一号位挂帅,印证了绑定这款产品对大厂的重要性。

如同「文心一言」的发布是由百度创始人李彦宏亲自上场示范一样,阿里的「通义千问」也是由阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇揭晓的。

而且,这是张勇在阿里大重组之后的首次出现公开露面。

阿里的「通义千问」发布现场,最具亮点的一张图就是张勇宣布,「阿里未来将所有产品接入通义千问进行全面改造」。他强调说,「面对AI时代,所有产品都值得用大模型重做一次。」

如果说百度在国内率先发布「文心一言」时,重点还是对外普及「文心一言」怎么用;那么如今阿里发布「通义千问」时,重点是这种GPT类大语言模型的应用范围和场景是什么,以及这种「MaaS」(Model as a Service,模型即服务)将成为阿里云智能的发展路线之一。

百度的「文心一言」已经给国内C端用户做了科普,并且正视与ChatGPT的差距,在短时间内难以弥补。而阿里的「通义千问」入局则意味着国产AI大模型混战已经开始,挖掘B端的市场增量成为竞争中下一个命题。

当下,压力给到了腾讯和字节跳动,手握微信和抖音两大国民级APP产品,他们如何讲大语言模型的故事,还是一个待解之谜。

大模型的魔力

「通义千问距离国外产品还是有一定差距的,但是在国内同行中还是可以的。」作为阿里旗下达摩院智能计算实验室大模型负责人,周畅在阿里云峰会「AI新范式与商业创新」论坛中最后说。

同样,作为阿里云智能首席技术官,周靖人承认「通义千问」在推理和数学等方面不及ChatGPT,但与ChatGPT不断迭代一样,「通义千问」也在保持每周进步的速度,「过一段时间,你会发现他又学会了很多东西,进步很大。」

自百度发布「文心一言」之后,其承受着国产AI大模型产品对标ChatGPT的各种评价,人们热衷于对比「文心一言」和ChatGPT在生成式内容上的差异,并逐渐让国内市场意识到,中国互联网公司的AI大模型产品距离ChatGPT还有很长一段路要走。

从这个角度上说,再去测试比较阿里「通义千问」与ChatGPT的差距或是与「文心一言」的差异已经意义不大。正视差距之后,如何通过国内现有的AI大模型水平挖掘新的增量市场,才是国内市场更关键的命题。

阿里云峰会上,张勇强调未来的两个重点,一个是让算力更普惠,一个就是AI更普及。

背后的潜台词之一就是挖掘B端市场的增量,阿里云能够支持所有行业、所有应用、所有软件、所有服务都基于新型AI大模型支撑重做一遍,阿里云能让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型,满足个性化的需求。

ChatGPT以及AI大模型背后依托的云计算市场,正在成为真正的竞逐战场。

作为OpenAI的独家云计算供应商,微软就曾公布其正在把AI模型变成新的计算平台,下一轮云计算浪潮正在诞生,而反观国内市场,百度、阿里的AI大模型也同样依托各自的云计算平台。

「AI大模型的出现是一个划时代的里程碑,人类将进入一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。」张勇说。

张勇希望,未来在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。「即使是中小企业,也能通过云平台获得AI大模型的能力和服务。」

事实上,「通义千问」只是阿里云生态中的最新成员,与之并列的还有通义M6、通义视觉、通义Alicemind等丰富系列,这些都为「通义千问」打下基础,通义千问跟ChatGPT类似,支持多轮交互和复杂指令理解,能够进行文案创作、代码编写等,具有多模态能力,支持多语言的处理和理解。

如同微软旗下全线产品拥抱ChatGPT一样,如今阿里云发布通义千问的相同动作,就是宣布包括天猫、淘宝、钉钉等阿里全系产品都将接入通义千问进行全面改造。只不过,目前可以确定的是天猫精灵、钉钉会率先接入测试,而其他产品完成AI改造没有明确的时间表。

「通用的AI大语言模型连接一切,可以解决企业边际成本过高的问题」,周畅认为,企业中很多长尾需求都可以通过自然语言大模型+多模态的方式解决。

这背后就是阿里云的Mass理念,通过「通义千问」等大模型,B端的企业可以通过阿里云实现个性化的需求,搭建适合自身应用场景的企业专属大模型,比如通过企业内部文档形成自动部署的QA问答系统,此外还有智能客服、智能导购、文案助手和AI设计师等等。

此前,百度发布文心一言时公布了近300家合作伙伴公司;如今,阿里云也敲定了与智己汽车、波司登、掌阅科技等多家合作共创。最有说服力的,还是现场发布的阿里云与昆仑万维的战略合作。

昆仑万维全球平均月活跃用户近4亿,海外收入占比达78%,诸多海外业务大量使用阿里云海外公共云服务,国内游戏等业务也全面跑在阿里云上,阿里云帮助其在AIGC领域建立了大规模的算力集群。

自ChatGPT火爆之后,昆仑万维就因布局天工AIGC全系列算法与模型受到关注,并且在二级市场股价大涨超过200%,旗下「天工」大模型也将在4月17日开始邀请测试。

如今,阿里云将和昆仑万维在超大规模算力中心建设以及推理训练等场景、AI产品技术、生态共建等展开深度合作,换句话说,在AI大模型追逐浪潮中,阿里云不只是自己做AI大模型,还通过底层算力的积累真正服务B端做AI大模型的公司。

当C端用户感受到的ChatGPT等创作工具门槛不断降低,正是B端企业针对不同行业和不同场景的打透打深。所以说,阿里云一方面要抓住增长幅度明显的C端用户,同时还要服务好朝着智能化转型的B端客户,在两个不同商业逻辑中寻找增量市场。

腾讯字节何时交卷?

百度和阿里之后,压力来到了腾讯和字节。

马化腾和张一鸣虽然还未拿出大模型产品发布,但已经有所行动。根据「晚点LatePost」报道,张一鸣开始看人工智能论文了。一位字节人士称,张一鸣近期时常会和一些字节人士分享论文学习心得和对 ChatGPT 的思考。

就在阿里云发布「通义千问」当日,字节跳动旗下的飞书发布了智能助手「My AI」,但并没有具体上线公测日期。

从展示视频中可以看出,「My AI」的应用场景比较垂直,可以总结会议纪要、创建待办事项、创建报告、自动续写、创建日程等,但飞书相关视频展示的内容可能只是冰山一角,其在文案中提到,「My AI能做的远不止于此。」

飞书的针锋相对,是因为阿里旗下的钉钉与大模型产品「通义千问」做了结合。在钉钉展示的内容中,钉钉可以通过「通义千问」实现多种功能,比如自动生成聊天摘要,帮助用户快速了解上下文;可以通过输入需求,让钉钉进行内容创作;总结会议纪要重点与待办事项等等。

换句话说,钉钉能实现的AI场景,飞书想证明自己一样也可以。

但飞书的针锋相对,实际上是在弥补之前的不足。在3月22日的春季未来无限大会上,ChatGPT已经如火如荼,微软将旗下全线产品接入ChatGPT,但当时飞书并没有在万众期待中拿出相关的AI产品。

字节加入AI大模型之战已是事实,只是目前呈现出来的信息并不一致。

根据「晚点LatePost」透露,字节今年初才开始组建专门的大模型团队,目前参与字节大模型的技术负责人有朱文佳、项亮、李航等,他们分属字节多个部门,其中朱文佳是字节大模型的第一负责人。

而《财新》则披露,字节跳动有两个团队在做大模型,一个做语言,是由帮阿里打造M6大模型的杨红霞负责,一个做音频,是希望与抖音和Tiktok等应用结合。

相比于飞书智能助手展示出字节跳动在AI大语言模型上的跃跃欲试,腾讯在AI大语言模型上的动作很少,一直保持低调。

3月底的腾讯财报分析师会上,腾讯总裁刘炽平说,生成式人工智能可成为腾讯已有业务,如社交、游戏的「倍增器」,也可帮助开拓数字助手、搜索等新增长线;腾讯正在加速推进大模型「混元」。

事实上,腾讯在AI大语言模型上的储备并非不足,早在ChatGPT正式发布前的2022年10月,微信的大语言模型「WeLM」(WeChat Language Model))就已经上线,只不过这不是一个直接的对话机器人,而是一个补全用户输入信息的生成模型。

「WeLM 提供续写功能,但并不具有原生对话能力」,「WeLM」的官网网站上这样提醒用户,并且提示其最后的更新日期是2022年10月12日,其主要能力可以实现八种功能,包括阅读理解任务,开放域问答,文本分类,文本风格转换,个性对话生成,翻译和文本续写等等方面。

最初,「WeLM」被外界以为是微信官方的聊天机器人,但目前为止,「WeLM」并没有得到大规模推广和广泛应用。据称,「WeLM」只是微信内部的创新型实验项目,没有计划应用到实际的产品之中,也不会与微信App的体验有所关联。

但「WeLM」只是一个雏形,未来能代表腾讯实力的大语言模型产品,仍是一个未知数。据称,腾讯将在今年年中实现大模型产品的内测并在年内上线。

留给腾讯和字节跳动的AI大模型压力,已经越来越大。

一方面是百度和阿里已经抢占先机,他们正在利用各自的生态优势开始挖掘AI大模型的增量市场;另一方面,对AI大模型的反思和监管将逐步增强和完善,这将对后入场的选手提出更高的挑战。

问题是,我们真的需要如此多的国产ChatGPT吗?

对炒作ChatGPT类产品提出反对意见的,就包括自然语言模型专家、前腾讯副总裁吴军,他在最近的分享提到,大语言模型太消耗资源,「今天的ChatGPT,可能光硬件的成本就要差不多10亿美元,这还没算电钱,所以成本和耗资是非常巨大的。所以,如果开完玩笑,问ChatGPT的最大贡献是什么,我倒觉得它对全球变暖是有很大贡献的。」

监管的脚步正在加快,《生成式人工智能服务管理办法(征求意见稿)》在4月11日公布。其中要求,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

但无论如何,行业将逐渐趋于理性和冷静,但在通往AI大模型所带来的增量市场中,没有头部互联网公司愿意掉队,阿里、百度和腾讯、字节的AI大模型混战,将成为2023年中国互联网的主旋律之一。

国产AI大语言模型不能输已成事实,谁能在这场混战中挖到更大增量,将是互联网大厂的一号位需要回答的新命题。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

BAT一号位“再创业”

国产大模型,大厂都不肯输。

界面新闻|范剑磊

文 | 蓝洞商业 赵卫卫

间隔不到一个月,百度、阿里先后高调发布自研AI大语言模型。

继3月16日,百度发布对标ChatGPT的聊天机器人「文心一言」之后;4月11日上午阿里云峰会上,阿里也发布了自家的ChatGPT产品「通义千问」。在国产AI大模型这条赛道上,有ChatGPT类产品比没有更重要。

互联网大厂一号位挂帅,印证了绑定这款产品对大厂的重要性。

如同「文心一言」的发布是由百度创始人李彦宏亲自上场示范一样,阿里的「通义千问」也是由阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇揭晓的。

而且,这是张勇在阿里大重组之后的首次出现公开露面。

阿里的「通义千问」发布现场,最具亮点的一张图就是张勇宣布,「阿里未来将所有产品接入通义千问进行全面改造」。他强调说,「面对AI时代,所有产品都值得用大模型重做一次。」

如果说百度在国内率先发布「文心一言」时,重点还是对外普及「文心一言」怎么用;那么如今阿里发布「通义千问」时,重点是这种GPT类大语言模型的应用范围和场景是什么,以及这种「MaaS」(Model as a Service,模型即服务)将成为阿里云智能的发展路线之一。

百度的「文心一言」已经给国内C端用户做了科普,并且正视与ChatGPT的差距,在短时间内难以弥补。而阿里的「通义千问」入局则意味着国产AI大模型混战已经开始,挖掘B端的市场增量成为竞争中下一个命题。

当下,压力给到了腾讯和字节跳动,手握微信和抖音两大国民级APP产品,他们如何讲大语言模型的故事,还是一个待解之谜。

大模型的魔力

「通义千问距离国外产品还是有一定差距的,但是在国内同行中还是可以的。」作为阿里旗下达摩院智能计算实验室大模型负责人,周畅在阿里云峰会「AI新范式与商业创新」论坛中最后说。

同样,作为阿里云智能首席技术官,周靖人承认「通义千问」在推理和数学等方面不及ChatGPT,但与ChatGPT不断迭代一样,「通义千问」也在保持每周进步的速度,「过一段时间,你会发现他又学会了很多东西,进步很大。」

自百度发布「文心一言」之后,其承受着国产AI大模型产品对标ChatGPT的各种评价,人们热衷于对比「文心一言」和ChatGPT在生成式内容上的差异,并逐渐让国内市场意识到,中国互联网公司的AI大模型产品距离ChatGPT还有很长一段路要走。

从这个角度上说,再去测试比较阿里「通义千问」与ChatGPT的差距或是与「文心一言」的差异已经意义不大。正视差距之后,如何通过国内现有的AI大模型水平挖掘新的增量市场,才是国内市场更关键的命题。

阿里云峰会上,张勇强调未来的两个重点,一个是让算力更普惠,一个就是AI更普及。

背后的潜台词之一就是挖掘B端市场的增量,阿里云能够支持所有行业、所有应用、所有软件、所有服务都基于新型AI大模型支撑重做一遍,阿里云能让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型,满足个性化的需求。

ChatGPT以及AI大模型背后依托的云计算市场,正在成为真正的竞逐战场。

作为OpenAI的独家云计算供应商,微软就曾公布其正在把AI模型变成新的计算平台,下一轮云计算浪潮正在诞生,而反观国内市场,百度、阿里的AI大模型也同样依托各自的云计算平台。

「AI大模型的出现是一个划时代的里程碑,人类将进入一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。」张勇说。

张勇希望,未来在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。「即使是中小企业,也能通过云平台获得AI大模型的能力和服务。」

事实上,「通义千问」只是阿里云生态中的最新成员,与之并列的还有通义M6、通义视觉、通义Alicemind等丰富系列,这些都为「通义千问」打下基础,通义千问跟ChatGPT类似,支持多轮交互和复杂指令理解,能够进行文案创作、代码编写等,具有多模态能力,支持多语言的处理和理解。

如同微软旗下全线产品拥抱ChatGPT一样,如今阿里云发布通义千问的相同动作,就是宣布包括天猫、淘宝、钉钉等阿里全系产品都将接入通义千问进行全面改造。只不过,目前可以确定的是天猫精灵、钉钉会率先接入测试,而其他产品完成AI改造没有明确的时间表。

「通用的AI大语言模型连接一切,可以解决企业边际成本过高的问题」,周畅认为,企业中很多长尾需求都可以通过自然语言大模型+多模态的方式解决。

这背后就是阿里云的Mass理念,通过「通义千问」等大模型,B端的企业可以通过阿里云实现个性化的需求,搭建适合自身应用场景的企业专属大模型,比如通过企业内部文档形成自动部署的QA问答系统,此外还有智能客服、智能导购、文案助手和AI设计师等等。

此前,百度发布文心一言时公布了近300家合作伙伴公司;如今,阿里云也敲定了与智己汽车、波司登、掌阅科技等多家合作共创。最有说服力的,还是现场发布的阿里云与昆仑万维的战略合作。

昆仑万维全球平均月活跃用户近4亿,海外收入占比达78%,诸多海外业务大量使用阿里云海外公共云服务,国内游戏等业务也全面跑在阿里云上,阿里云帮助其在AIGC领域建立了大规模的算力集群。

自ChatGPT火爆之后,昆仑万维就因布局天工AIGC全系列算法与模型受到关注,并且在二级市场股价大涨超过200%,旗下「天工」大模型也将在4月17日开始邀请测试。

如今,阿里云将和昆仑万维在超大规模算力中心建设以及推理训练等场景、AI产品技术、生态共建等展开深度合作,换句话说,在AI大模型追逐浪潮中,阿里云不只是自己做AI大模型,还通过底层算力的积累真正服务B端做AI大模型的公司。

当C端用户感受到的ChatGPT等创作工具门槛不断降低,正是B端企业针对不同行业和不同场景的打透打深。所以说,阿里云一方面要抓住增长幅度明显的C端用户,同时还要服务好朝着智能化转型的B端客户,在两个不同商业逻辑中寻找增量市场。

腾讯字节何时交卷?

百度和阿里之后,压力来到了腾讯和字节。

马化腾和张一鸣虽然还未拿出大模型产品发布,但已经有所行动。根据「晚点LatePost」报道,张一鸣开始看人工智能论文了。一位字节人士称,张一鸣近期时常会和一些字节人士分享论文学习心得和对 ChatGPT 的思考。

就在阿里云发布「通义千问」当日,字节跳动旗下的飞书发布了智能助手「My AI」,但并没有具体上线公测日期。

从展示视频中可以看出,「My AI」的应用场景比较垂直,可以总结会议纪要、创建待办事项、创建报告、自动续写、创建日程等,但飞书相关视频展示的内容可能只是冰山一角,其在文案中提到,「My AI能做的远不止于此。」

飞书的针锋相对,是因为阿里旗下的钉钉与大模型产品「通义千问」做了结合。在钉钉展示的内容中,钉钉可以通过「通义千问」实现多种功能,比如自动生成聊天摘要,帮助用户快速了解上下文;可以通过输入需求,让钉钉进行内容创作;总结会议纪要重点与待办事项等等。

换句话说,钉钉能实现的AI场景,飞书想证明自己一样也可以。

但飞书的针锋相对,实际上是在弥补之前的不足。在3月22日的春季未来无限大会上,ChatGPT已经如火如荼,微软将旗下全线产品接入ChatGPT,但当时飞书并没有在万众期待中拿出相关的AI产品。

字节加入AI大模型之战已是事实,只是目前呈现出来的信息并不一致。

根据「晚点LatePost」透露,字节今年初才开始组建专门的大模型团队,目前参与字节大模型的技术负责人有朱文佳、项亮、李航等,他们分属字节多个部门,其中朱文佳是字节大模型的第一负责人。

而《财新》则披露,字节跳动有两个团队在做大模型,一个做语言,是由帮阿里打造M6大模型的杨红霞负责,一个做音频,是希望与抖音和Tiktok等应用结合。

相比于飞书智能助手展示出字节跳动在AI大语言模型上的跃跃欲试,腾讯在AI大语言模型上的动作很少,一直保持低调。

3月底的腾讯财报分析师会上,腾讯总裁刘炽平说,生成式人工智能可成为腾讯已有业务,如社交、游戏的「倍增器」,也可帮助开拓数字助手、搜索等新增长线;腾讯正在加速推进大模型「混元」。

事实上,腾讯在AI大语言模型上的储备并非不足,早在ChatGPT正式发布前的2022年10月,微信的大语言模型「WeLM」(WeChat Language Model))就已经上线,只不过这不是一个直接的对话机器人,而是一个补全用户输入信息的生成模型。

「WeLM 提供续写功能,但并不具有原生对话能力」,「WeLM」的官网网站上这样提醒用户,并且提示其最后的更新日期是2022年10月12日,其主要能力可以实现八种功能,包括阅读理解任务,开放域问答,文本分类,文本风格转换,个性对话生成,翻译和文本续写等等方面。

最初,「WeLM」被外界以为是微信官方的聊天机器人,但目前为止,「WeLM」并没有得到大规模推广和广泛应用。据称,「WeLM」只是微信内部的创新型实验项目,没有计划应用到实际的产品之中,也不会与微信App的体验有所关联。

但「WeLM」只是一个雏形,未来能代表腾讯实力的大语言模型产品,仍是一个未知数。据称,腾讯将在今年年中实现大模型产品的内测并在年内上线。

留给腾讯和字节跳动的AI大模型压力,已经越来越大。

一方面是百度和阿里已经抢占先机,他们正在利用各自的生态优势开始挖掘AI大模型的增量市场;另一方面,对AI大模型的反思和监管将逐步增强和完善,这将对后入场的选手提出更高的挑战。

问题是,我们真的需要如此多的国产ChatGPT吗?

对炒作ChatGPT类产品提出反对意见的,就包括自然语言模型专家、前腾讯副总裁吴军,他在最近的分享提到,大语言模型太消耗资源,「今天的ChatGPT,可能光硬件的成本就要差不多10亿美元,这还没算电钱,所以成本和耗资是非常巨大的。所以,如果开完玩笑,问ChatGPT的最大贡献是什么,我倒觉得它对全球变暖是有很大贡献的。」

监管的脚步正在加快,《生成式人工智能服务管理办法(征求意见稿)》在4月11日公布。其中要求,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

但无论如何,行业将逐渐趋于理性和冷静,但在通往AI大模型所带来的增量市场中,没有头部互联网公司愿意掉队,阿里、百度和腾讯、字节的AI大模型混战,将成为2023年中国互联网的主旋律之一。

国产AI大语言模型不能输已成事实,谁能在这场混战中挖到更大增量,将是互联网大厂的一号位需要回答的新命题。

本文为转载内容,授权事宜请联系原著作权人。