正在阅读:

阿里接连“痛失”两员大将,都去搞大模型了

扫一扫下载界面新闻APP

阿里接连“痛失”两员大将,都去搞大模型了

每一个AI科学家都有一个做大模型的梦想。

文|融中财经 风信子

编辑|吾人

要问2023年的创投圈什么最热闹,那非ChatGPT莫属。

除了谷歌、微软、Meta、百度等这些互联网大厂积极加码AI的投资,不少这些大厂走出来的高管也纷纷加入到创业的队伍中去,大有重现移动互联网时代的创业热潮,这不又有几个互联网大厂的高管出来创业了。

近日,亚马逊首席科学家李沐,被曝已离职创业,其创业项目,名为Boson.ai,从官网信息来看,创业内容与大模型应用有关。目前李沐尚未官宣,但在Boson.ai的GitHub项目主页中,已经能看见他的身影。

就好像王兴找上老同学王慧文开启大模型创业一样,这次李沐是与其导师Alex Smola一起创业的,Alex Smola曾任亚马逊副总裁,是位杰出的AI科学家,目前任Boson.ai的CEO。

有传闻称阿里VP贾扬清将离职创业,计划创业的方向是AIInfra(AI架构),属于是AI基础设施提供商,关注包括大模型在内的AI应用。具体而言是要打造一个统一、多云和可观察的人工智能平台。目标是提升人工智能产品化的效率,包括开发者效率和系统效率两个方面。通过端到端的解决方案,来帮助企业和开发者高效部署人工智能。

仅隔一天,阿里再失一员AI大将。据悉,阿里M6大模型的前带头人杨红霞已加入字节AILab(人工智能实验室),参与语言生成大模型的研发。

除此之外,据不完全统计,AI大模型领域已经集结了前美团联合创始人王慧文,原京东集团技术委员会主席、云与 AI 总裁,京东人工智能研究院院长周伯文,前搜狗CEO王小川,快手前AI核心人物李岩等。

3月20日,创新工场董事长兼首席执行官李开复,转型投资人多年的他,宣布将筹组名为“AI2.0”的项目。创新工场也将“Project AI 2.0”(AI2.0项目)挂到了官网首页,并表示将在全球范围寻找具有 AI 大模型、NLP(语言生成模型)、Multi-modality(多模态)等领域能力的优秀技术人和研究员。这意味着,李开复要亲自带队投入大模型创业中去了。

看到曾经最优秀的一批创业者投身AI大模型创业,无疑是振奋人心的,然而我们要思考的是为什么ChatGPT没有诞生在中国,开发我们自己的ChatGPT到底需要什么?

01 为什么ChatGPT没有诞生在中国?

ChatGPT的诞生让世界为之震惊,也让创投圈为之疯狂,不少国人也为ChatGPT没有诞生在中国而感到失落。

近几个月,关于老外在用ChatGPT写论文,写工作总结,写各种报告等新闻不绝于耳,国人垂涎已久,尽管百度以最快的速度推出了号称中国版的ChatGPT文心一言,然而无论是来自用户还是投资者的反馈都不是满意,甚至有人调侃,百度的文心一言发布会硬生生搞成了招商大会。发布会期间,百度股价一度闪崩,这不禁让国内再度发出疑问,百度做AI也有10年了,为什么它没有率先做出ChatGPT,为什么ChatGPT没有诞生在中国?

有不少专家从技术、法律等角度分析原因,他们认为中国之所以没有诞生ChatGPT主要是因为以下几个原因:

华东政法大学政治学研究院院长、人工智能与大数据指数研究院院长高奇琦教授认为,通用大模型是一个系统工程,算法、数据和算力这三个因素至关重要。目前,我们的差距主要集中在数据和算力。数据方面,英文互联网上的数据质量相对比较高,也更易于清洗。ChatGPT之所以问题回答得好,很重要的原因就在于英文互联网上有大量比较准确的知识类信息,可以用于模型训练。中文互联网产生的数据也很多,但质量还有差距,加之国内的数据大量储存于移动端APP中,数据比较难抓取,而互联网巨头之间的数据又是相互封闭的,数据孤岛化的情况也比较严重。算力是另一个巨大的挑战,ChatGPT需要至少3万张英伟达A100卡的算力,这是巨大的一笔投入。

除此之外,还有人从政策法规的角度进行了分析,他们认为,为了避免人工智能技术可能带来的潜在风险和威胁,中国国家和市级政府都出台了一系列的人工智能技术规范和管理条例。这些规定对于ChatGPT这样依赖深度学习技术,可能涉及到数据保护和隐私保护等方面的技术提出了严格要求,需要满足一系列的审批和认证流程。

笔者从创投的角度分析,认为中国之所以没率先落地ChatGPT,一方面是国内许多企业家对新技术缺乏敏感性,另一方面是国内的投资人对底层技术的长期不重视。

虽然不少国人纷纷举手要进行大模型创业,立志要做出中国版的ChatGPT,然而俞敏洪却指出了一个扎心的事实。近日,他在第23届亚布力中国企业家论坛上说道,“ChatGPT已讨论两个月了,有多少企业家玩过ChatGPT?”在他看来,没玩过ChatGPT的企业家,没资格谈论高科技和未来企业的走向,对于企业家来说,年龄不是问题,思想的僵化和行动的僵化才是问题,不接受新鲜事物才是问题。

知名互联网学者刘兴亮在一档节目中被主持人问到,为什么ChatGPT没有诞生在中国,他用一句话回答了这个问题,即美国人在创新、中国人在应用、欧洲人在立法。

俞敏洪与刘兴亮分别揭示了国内面对新技术不同层面的态度,俞敏洪指出了,中国企业家对于新兴技术缺乏足够的热情,对于新事物缺乏思想上的接受能力以及相应的行动力,这也引发了中国的ChatGPT到底会在互联网大厂诞生还是在创业企业诞生的讨论。

刘兴亮的回答也反映出一个问题,即我国的创业项目有着太强的功利性,凡是不能快速变现或者暂时落地场景不明朗的项目很难得到投资人的青睐,这也让我们忽略了许多底层技术的创业机会,而恰恰是底层技术才是能够“卡脖子”的地方。

所以,中国缺的不是能做出ChatGPT的技术人才,而是能够孵化ChatGPT的环境土壤。

02 中国不缺技术人才,缺的是优秀的企业家

每一个AI科学家都有一个做大模型的梦想,比如李沐、贾扬清等,我们要做的是给他们一个实现梦想的温床。

李沐,江湖人称“沐神”,又被称为深度学习界的“米其林”,是硅谷华人技术大神,深度学习框架MXNet创始人之一。

公开资料显示,李沐2008年毕业于上海交通大学计算机系,大学期间,曾在微软亚洲研究院担任实习生。2011年4月-2012年8月,李沐在百度担任高级研究员,后进入卡耐基梅隆大学(CMU)读博,师从Alex Smola和Dave Andersen。2017年CMU博士毕业后,李沐加入亚马逊成为资深首席科学家。

李沐的主要研究兴趣集中在大规模机器学习,尤其是大规模分布式系统和机器学习算法的协同设计。李沐曾以第一作者的身份在计算机科学领域的大会以及期刊上发表了多篇论文,包括跨度理论(FOCS)、机器学习(NIPS、ICML)、应用层面(CVPR、KDD)、操作系统(OSDI)等方向。

此外,李沐还是B站的一位UP主,注册了“跟着李沐学AI”这一账号,通过视频向大家介绍各种AI知识,制作了几十篇论文的精读课程。不少同学跟着他养成了精读论文的习惯。

李沐不仅是一位学霸,一位不错的老师,他在创业上也有这一定的经验和心得。

李沐在CMU读博期间,恰逢国内创业热潮,他在国内的好友戴文渊、余凯等人纷纷加入创业大军,受此影响,大洋彼岸的李沐与导师Alex Smola、同学等5人也体验了一把创业。他们创办了数据分析算法公司 Marianas Labs,Alex Smol 教授担任 CEO,李沐担任 CTO。后来这家公司被收购了。

“在学术界,当你有一个想法,马上就可以开始操作,并且只需要把想法实现,大概完成 90% 的工作就好;而在工业界,想法不是最重要的,重要的是要把想法落地,剩下的那10% 的工作才是最重要的,甚至可能会花费你 90% 的精力。”“而创业,需要考虑的事情就更复杂了,除了要思考如何把想法落地,还需要考虑团队的合作、人员的调配,要决定团队的发展方向,分析整个工业环境的发展趋势等”,李沐曾谈到。

2016年7月,Alex Smola重返工业界,加入亚马逊,后来在AWS 担任副总裁级别的科学家,李沐也追随导师,加入亚马逊,离职前做到了AWS资深高级科学家。

还有最新加入大模型的阿里的两位AI科学家。贾扬清,本科和研究生阶段就读于清华大学自动化专业,后赴加州大学伯克利分校攻读计算机科学博士。他在博士期间创立并开源了如今业内目熟能详的深度学习框架Caffe,被微软、雅虎英伟达、Adobe等公司采用。2019年3月,贾扬清正式加入阿里巴巴,担任技术副总裁岗位,领导大数据计算平台的研发工作。

杨红霞毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson。她在人工智能领域国际会议、顶级期刊有近百篇页级论文。

杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,M6是阿里巴巴达摩院研发的超大规模多模态预训练模型。

杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型首次发布到2021年底,阿里云发布M6最新进展时,其参数已至10万亿,成为当时全球最大的AI预训练模型。

随着越来越多的人加入大模型创业,可以发现,无论在国内还是在国外,我们AI技术方面的人才并不在少数,然而实际的结果却是,我们并没有率先做出自己的大模型出来,这再次将我们一直以来的短板暴露出来,我们是个很好的追随者,但是做不了领先者。

如何改变这一局面呢?

03 ChatGPT会诞生在哪里?巨头还是创业公司

想做领先者,不可忽视创业公司的作用。

在ChatGPT出来之前,很多国内的投资人都认为,这种没有落地场景的底层技术只有巨头才能玩,创业公司参与就是自寻死路,在他们看来,巨头在技术研发上的积累远超创业公司,在数据和算法资源也是遥遥领先,在资金和人才的储备上也占尽优势,甚至在管理能力方面都是成熟的,然而现实却打脸了。

谷歌作为全球AI领域的领路人,一直被寄予厚望,然而突然杀出一个OpenAI,这着实让它有点措手不及,同时在美国的其他巨头中也没有诞生出ChatGPT。

同样在中国,百度主攻AI多年,据称,许多百度内部的员工都不信百度能做好文心一言。

这一方面说明,一个庞大的企业机器,虽然有着投资人所以为的诸多优势,但由于内部人际关系复杂,问题盘根错节,这造成了人浮于事,效率低下等问题;另一方面,相比创业公司的孤注一掷,巨头有着稳定的现金流业务,这也会让企业家对新业务的重视程度不够。此外,巨头最缺的是创业团队对项目的热情和成功的渴望,而这也是能否成为领先最关键的因素。

不少人觉得,高调进入AI大模型创业就是为了蹭热点、圈钱,真正踏踏实实做事的少之又少,诚然,正如清华大学新闻学院教授、博士生导师沈阳预测,未来AI大模型的市场格局是ChatGPT一家,开源一家,中国一家,三分天下,这个行业必然是九死一生的,但是最后谁是留下来的幸运儿,谁又能知道呢?

从个人投资者来说,不投九死一生的行业可以理解,但是从全国整体来说,我们需要敢于做梦的投资家、企业家,毕竟OpenAI也是美国数位富豪喂出来的。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

阿里接连“痛失”两员大将,都去搞大模型了

每一个AI科学家都有一个做大模型的梦想。

文|融中财经 风信子

编辑|吾人

要问2023年的创投圈什么最热闹,那非ChatGPT莫属。

除了谷歌、微软、Meta、百度等这些互联网大厂积极加码AI的投资,不少这些大厂走出来的高管也纷纷加入到创业的队伍中去,大有重现移动互联网时代的创业热潮,这不又有几个互联网大厂的高管出来创业了。

近日,亚马逊首席科学家李沐,被曝已离职创业,其创业项目,名为Boson.ai,从官网信息来看,创业内容与大模型应用有关。目前李沐尚未官宣,但在Boson.ai的GitHub项目主页中,已经能看见他的身影。

就好像王兴找上老同学王慧文开启大模型创业一样,这次李沐是与其导师Alex Smola一起创业的,Alex Smola曾任亚马逊副总裁,是位杰出的AI科学家,目前任Boson.ai的CEO。

有传闻称阿里VP贾扬清将离职创业,计划创业的方向是AIInfra(AI架构),属于是AI基础设施提供商,关注包括大模型在内的AI应用。具体而言是要打造一个统一、多云和可观察的人工智能平台。目标是提升人工智能产品化的效率,包括开发者效率和系统效率两个方面。通过端到端的解决方案,来帮助企业和开发者高效部署人工智能。

仅隔一天,阿里再失一员AI大将。据悉,阿里M6大模型的前带头人杨红霞已加入字节AILab(人工智能实验室),参与语言生成大模型的研发。

除此之外,据不完全统计,AI大模型领域已经集结了前美团联合创始人王慧文,原京东集团技术委员会主席、云与 AI 总裁,京东人工智能研究院院长周伯文,前搜狗CEO王小川,快手前AI核心人物李岩等。

3月20日,创新工场董事长兼首席执行官李开复,转型投资人多年的他,宣布将筹组名为“AI2.0”的项目。创新工场也将“Project AI 2.0”(AI2.0项目)挂到了官网首页,并表示将在全球范围寻找具有 AI 大模型、NLP(语言生成模型)、Multi-modality(多模态)等领域能力的优秀技术人和研究员。这意味着,李开复要亲自带队投入大模型创业中去了。

看到曾经最优秀的一批创业者投身AI大模型创业,无疑是振奋人心的,然而我们要思考的是为什么ChatGPT没有诞生在中国,开发我们自己的ChatGPT到底需要什么?

01 为什么ChatGPT没有诞生在中国?

ChatGPT的诞生让世界为之震惊,也让创投圈为之疯狂,不少国人也为ChatGPT没有诞生在中国而感到失落。

近几个月,关于老外在用ChatGPT写论文,写工作总结,写各种报告等新闻不绝于耳,国人垂涎已久,尽管百度以最快的速度推出了号称中国版的ChatGPT文心一言,然而无论是来自用户还是投资者的反馈都不是满意,甚至有人调侃,百度的文心一言发布会硬生生搞成了招商大会。发布会期间,百度股价一度闪崩,这不禁让国内再度发出疑问,百度做AI也有10年了,为什么它没有率先做出ChatGPT,为什么ChatGPT没有诞生在中国?

有不少专家从技术、法律等角度分析原因,他们认为中国之所以没有诞生ChatGPT主要是因为以下几个原因:

华东政法大学政治学研究院院长、人工智能与大数据指数研究院院长高奇琦教授认为,通用大模型是一个系统工程,算法、数据和算力这三个因素至关重要。目前,我们的差距主要集中在数据和算力。数据方面,英文互联网上的数据质量相对比较高,也更易于清洗。ChatGPT之所以问题回答得好,很重要的原因就在于英文互联网上有大量比较准确的知识类信息,可以用于模型训练。中文互联网产生的数据也很多,但质量还有差距,加之国内的数据大量储存于移动端APP中,数据比较难抓取,而互联网巨头之间的数据又是相互封闭的,数据孤岛化的情况也比较严重。算力是另一个巨大的挑战,ChatGPT需要至少3万张英伟达A100卡的算力,这是巨大的一笔投入。

除此之外,还有人从政策法规的角度进行了分析,他们认为,为了避免人工智能技术可能带来的潜在风险和威胁,中国国家和市级政府都出台了一系列的人工智能技术规范和管理条例。这些规定对于ChatGPT这样依赖深度学习技术,可能涉及到数据保护和隐私保护等方面的技术提出了严格要求,需要满足一系列的审批和认证流程。

笔者从创投的角度分析,认为中国之所以没率先落地ChatGPT,一方面是国内许多企业家对新技术缺乏敏感性,另一方面是国内的投资人对底层技术的长期不重视。

虽然不少国人纷纷举手要进行大模型创业,立志要做出中国版的ChatGPT,然而俞敏洪却指出了一个扎心的事实。近日,他在第23届亚布力中国企业家论坛上说道,“ChatGPT已讨论两个月了,有多少企业家玩过ChatGPT?”在他看来,没玩过ChatGPT的企业家,没资格谈论高科技和未来企业的走向,对于企业家来说,年龄不是问题,思想的僵化和行动的僵化才是问题,不接受新鲜事物才是问题。

知名互联网学者刘兴亮在一档节目中被主持人问到,为什么ChatGPT没有诞生在中国,他用一句话回答了这个问题,即美国人在创新、中国人在应用、欧洲人在立法。

俞敏洪与刘兴亮分别揭示了国内面对新技术不同层面的态度,俞敏洪指出了,中国企业家对于新兴技术缺乏足够的热情,对于新事物缺乏思想上的接受能力以及相应的行动力,这也引发了中国的ChatGPT到底会在互联网大厂诞生还是在创业企业诞生的讨论。

刘兴亮的回答也反映出一个问题,即我国的创业项目有着太强的功利性,凡是不能快速变现或者暂时落地场景不明朗的项目很难得到投资人的青睐,这也让我们忽略了许多底层技术的创业机会,而恰恰是底层技术才是能够“卡脖子”的地方。

所以,中国缺的不是能做出ChatGPT的技术人才,而是能够孵化ChatGPT的环境土壤。

02 中国不缺技术人才,缺的是优秀的企业家

每一个AI科学家都有一个做大模型的梦想,比如李沐、贾扬清等,我们要做的是给他们一个实现梦想的温床。

李沐,江湖人称“沐神”,又被称为深度学习界的“米其林”,是硅谷华人技术大神,深度学习框架MXNet创始人之一。

公开资料显示,李沐2008年毕业于上海交通大学计算机系,大学期间,曾在微软亚洲研究院担任实习生。2011年4月-2012年8月,李沐在百度担任高级研究员,后进入卡耐基梅隆大学(CMU)读博,师从Alex Smola和Dave Andersen。2017年CMU博士毕业后,李沐加入亚马逊成为资深首席科学家。

李沐的主要研究兴趣集中在大规模机器学习,尤其是大规模分布式系统和机器学习算法的协同设计。李沐曾以第一作者的身份在计算机科学领域的大会以及期刊上发表了多篇论文,包括跨度理论(FOCS)、机器学习(NIPS、ICML)、应用层面(CVPR、KDD)、操作系统(OSDI)等方向。

此外,李沐还是B站的一位UP主,注册了“跟着李沐学AI”这一账号,通过视频向大家介绍各种AI知识,制作了几十篇论文的精读课程。不少同学跟着他养成了精读论文的习惯。

李沐不仅是一位学霸,一位不错的老师,他在创业上也有这一定的经验和心得。

李沐在CMU读博期间,恰逢国内创业热潮,他在国内的好友戴文渊、余凯等人纷纷加入创业大军,受此影响,大洋彼岸的李沐与导师Alex Smola、同学等5人也体验了一把创业。他们创办了数据分析算法公司 Marianas Labs,Alex Smol 教授担任 CEO,李沐担任 CTO。后来这家公司被收购了。

“在学术界,当你有一个想法,马上就可以开始操作,并且只需要把想法实现,大概完成 90% 的工作就好;而在工业界,想法不是最重要的,重要的是要把想法落地,剩下的那10% 的工作才是最重要的,甚至可能会花费你 90% 的精力。”“而创业,需要考虑的事情就更复杂了,除了要思考如何把想法落地,还需要考虑团队的合作、人员的调配,要决定团队的发展方向,分析整个工业环境的发展趋势等”,李沐曾谈到。

2016年7月,Alex Smola重返工业界,加入亚马逊,后来在AWS 担任副总裁级别的科学家,李沐也追随导师,加入亚马逊,离职前做到了AWS资深高级科学家。

还有最新加入大模型的阿里的两位AI科学家。贾扬清,本科和研究生阶段就读于清华大学自动化专业,后赴加州大学伯克利分校攻读计算机科学博士。他在博士期间创立并开源了如今业内目熟能详的深度学习框架Caffe,被微软、雅虎英伟达、Adobe等公司采用。2019年3月,贾扬清正式加入阿里巴巴,担任技术副总裁岗位,领导大数据计算平台的研发工作。

杨红霞毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson。她在人工智能领域国际会议、顶级期刊有近百篇页级论文。

杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,M6是阿里巴巴达摩院研发的超大规模多模态预训练模型。

杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型首次发布到2021年底,阿里云发布M6最新进展时,其参数已至10万亿,成为当时全球最大的AI预训练模型。

随着越来越多的人加入大模型创业,可以发现,无论在国内还是在国外,我们AI技术方面的人才并不在少数,然而实际的结果却是,我们并没有率先做出自己的大模型出来,这再次将我们一直以来的短板暴露出来,我们是个很好的追随者,但是做不了领先者。

如何改变这一局面呢?

03 ChatGPT会诞生在哪里?巨头还是创业公司

想做领先者,不可忽视创业公司的作用。

在ChatGPT出来之前,很多国内的投资人都认为,这种没有落地场景的底层技术只有巨头才能玩,创业公司参与就是自寻死路,在他们看来,巨头在技术研发上的积累远超创业公司,在数据和算法资源也是遥遥领先,在资金和人才的储备上也占尽优势,甚至在管理能力方面都是成熟的,然而现实却打脸了。

谷歌作为全球AI领域的领路人,一直被寄予厚望,然而突然杀出一个OpenAI,这着实让它有点措手不及,同时在美国的其他巨头中也没有诞生出ChatGPT。

同样在中国,百度主攻AI多年,据称,许多百度内部的员工都不信百度能做好文心一言。

这一方面说明,一个庞大的企业机器,虽然有着投资人所以为的诸多优势,但由于内部人际关系复杂,问题盘根错节,这造成了人浮于事,效率低下等问题;另一方面,相比创业公司的孤注一掷,巨头有着稳定的现金流业务,这也会让企业家对新业务的重视程度不够。此外,巨头最缺的是创业团队对项目的热情和成功的渴望,而这也是能否成为领先最关键的因素。

不少人觉得,高调进入AI大模型创业就是为了蹭热点、圈钱,真正踏踏实实做事的少之又少,诚然,正如清华大学新闻学院教授、博士生导师沈阳预测,未来AI大模型的市场格局是ChatGPT一家,开源一家,中国一家,三分天下,这个行业必然是九死一生的,但是最后谁是留下来的幸运儿,谁又能知道呢?

从个人投资者来说,不投九死一生的行业可以理解,但是从全国整体来说,我们需要敢于做梦的投资家、企业家,毕竟OpenAI也是美国数位富豪喂出来的。

本文为转载内容,授权事宜请联系原著作权人。