文 | 甲子光年 甲小姐 刘杨楠
2023年4月10日,原搜狗CEO王小川官宣创办百川智能——一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。
百川智能将借助语言AI的突破,构建“中国最好的大模型底座”,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠地获取世界知识和专业服务。
很多人对王小川不陌生。
王小川曾任搜狗CEO,先后主导开发了搜狗搜索、搜狗输入法、搜狗浏览器等产品,首创破局搜索的“三级火箭模式”,先后推动了阿里巴巴和腾讯战略入股搜狗,并于2017年带领搜狗在美国纽交所上市,此后搜狗被腾讯私有化收购,王小川告别搜狗。王小川先后担任第十三届全国政协委员及提案委员会委员、九三学社第十四届中央委员会委员及促进技术创新工作委员会主任、清华大学计算机学科顾问委员会委员等职务,曾获1996年第8届国际信息学奥林匹克竞赛(IOI)金牌、2014年北京市劳动模范称号、2015年北京市科学技术奖一等奖、2018年中国青年五四奖章、2019年第十五届中国青年科技奖、2019年中国电子学会科学技术奖科技进步奖一等奖、2020年钱伟长中文信息处理科学技术一等奖等奖项和荣誉。
站在多年积累之上,再创业的王小川无疑是中国AI大模型创业阵容中最受关注的人之一。王小川一直被外界称为“五道口守门员”,他来到北京二十余年,始终没有离开过清华大学和搜狐大厦所在的五道口区域。离开搜狗542天后,这一次再创业,虽然换了一个身份,但“守门之路”依然继续。
本文,甲小姐于官宣当日在五道口独家对话百川智能CEO王小川,抵达官宣背后更深一层的思考。
1.谈认知:“AGI(通用人工智能)不是OpenAI,不是ChatGPT,也不是某个产品,而是一个大时代”
甲小姐:你曾评价自己很钝感,有选择困难症,一个月前你和我说这波大模型让你感觉“被架在火上烤”,今天来看,这次创业你有多少是被时代推着走的,多少是自己主动的?
王小川:最初看到ChatGPT时,我没把它理解成一个严肃科学问题,比如你问个问题它答错了,但当你要求它“think step by step”,它就答对了,我最初觉得很好笑,直到今年1月底我开始认真看,才发现通用人工智能时代到了。
对于“该不该下场”,我可能是最后一个下判断的,但对于“这是不是AGI(通用人工智能)”,我在用完ChatGPT之后就知道了,我可能是第一个这么斩钉截铁认为它是AGI的人。
甲小姐:你斩钉截铁判断“ChatGPT就是AGI”,业界更谨慎的说法是“看到了AGI的曙光”,连微软也比你的说法保守,微软的说法是“GPT-4可被视为AGI的早期版本”。为什么你这么笃定?
王小川:就像AlphaGo出现时我很早就确信它会赢,我是看论文的人。
甲小姐:你和别人对AGI的定义不同在哪?
王小川:现在对AGI还没定义,但我是做自然语言的,我深知语言多难。我们上学时学人和动物的核心区别是语言,维特根斯坦说“语言的边界就是世界的边界”。我的判断是,当机器掌握语言,通用人工智能时代就到来了。
你也看过侯世达写的《表象与本质》,看完之后就很清楚什么叫AGI了。掌握语言, AGI就来了——这件事的逻辑清晰,不是我作为一个企业家的鸡汤说法。
只是我原来认为光从语言做大模型行不通,必须加图,但现在发现,大模型还没加图就学会了。
甲小姐:你曾在一次访谈中说“写程序是创造生命的过程”,你对健康感兴趣,对AGI感兴趣,都是对生命的兴趣?
王小川:广义上生命分几种,AGI主要指向创造智力。人最根本的需求是“生存”,我反复讲繁荣和延续人类文明,“繁荣”指向“生”,“延续”指向“存”。我说的“生命”,既不是个体的生命,也不是AGI,而是整个人类文明——让人类文明能够更繁荣和延续是我的终极理想,我希望向文明、向生命致敬。
甲小姐:你官宣要“做中国最好的大模型”,这是个具有很强竞争意味的定位。
王小川:第一,我是不怕竞争的。你也知道奥赛是怎么卷过来的,搞搜索是怎么卷过来的,我倒不怕竞争,我只是不希望过多突出竞争,但大家非得问。我觉得更好的逻辑不是竞争,是告诉大家AGI时代已经开启了。
甲小姐:现在对AGI国外也没有形成共识,比如Yann LeCun就不认同OpenAI的一些说法,他提出“世界模型”;而OpenAI CEO提出“万物摩尔定律”,大家似乎到了一个定义新世界基本定律的阶段。你认知AGI的底层逻辑是什么?
王小川:目前我的思考跟OpenAI高度一致,也许是被他们感染。接下来文字模型搞完之后,视觉还有更复杂的事情,有些不是现在能弄清楚的,现在可能是“不知道自己不知道”的状态。但我想强调的是,本质上AGI不是OpenAI,不是ChatGPT,也不是某个产品,而是一个大时代。在我个人公开信的结尾有对这件事的刻画,我还是挺满意的。
甲小姐:从年初下判断这是AGI,到今天官宣创业,仅仅过去了两个月,这两个月你见了多少人?
王小川:不到100人。
甲小姐:这两个月你的认知有变化吗?
王小川:没什么变化,主要还是靠自己思考。我自己的大脑不是一个靠各种数据驱动的深度学习系统,我的大脑就是一个pre-training model(预训练模型),我脑子里存了很多东西,pre-train之后靠大家激活。
甲小姐:未来你会推翻现有结论吗?
王小川:至少我讲的都是我比较确认的东西,肯定还有更多我不知道的细节,但我的核心观点就是“通用人工智能时代已经来临”,这比其他都重要,我很笃定。
甲小姐:你现在进入AI native的生活状态了吗?
王小川:我还得继续强化,还不够。我现在涉及工作的内容问人,语言知识信息类的都问AI。比如我想知道“从10月30号到今天总共过了多少天”,直接问ChatGPT是最简单的,做大模型创业要开媒体见面会的建议也是ChatGPT告诉我的。
2.谈创业:“把自己的名字压进去了,把朋友都带进去了,自己最后就是兜底的这个人”
甲小姐:大模型创业,你比王慧文、李开复等人的官宣晚了不少,为什么?
王小川:因为我不想什么都没有就官宣。
甲小姐:你官宣时,个人公开信落款是“百川智能CEO王小川”,之前的组合都是“搜狗CEO王小川”,我看到那个落款时有点陌生感,这是你第一次把自己的名字放进公司名称里?
王小川:当然。我也觉得很陌生,之前和别人聊,经常一不小心就说成“我们搜狗”怎么样。
甲小姐:对你而言,把名字放进去,比自己投钱更意味深重?
王小川:是的,核心就是把自己放进去。把自己的名字压进去了,把朋友都带进去了,自己最后就是兜底的这个人。
甲小姐:你很习惯价值升维,讲过很多高境界的话,比如“做输入法是帮助人类更好地表达”“做搜索是帮助人类更好地获取信息”“语言是人工智能皇冠上的明珠”,AGI会带来人类文明的“文艺复兴”等等,但创业可能有99%的时间是在面对和世界先进水平的差距,是脏活累活和权衡取舍。你已经成功了一次,再次all in,犹豫过吗?
王小川:没犹豫过。有人想做投资,而我就是要创业的。
甲小姐:这次创业目标关系到个人追求吗?比如钱、名、权力。
王小川:当你有势能去推动一件事情发生改变的时候,钱和名都不在意,只在意这件事本身。
甲小姐:官宣后你会收到很多信息轰炸,最关心什么?
王小川:我最关心的是有没有人愿意来一块儿干。
甲小姐:你的公开信留的招聘邮箱按年龄段分了组,目前团队年龄组成如何?
王小川:几个领军人物都是90年的。
甲小姐:百川团队有部分搜狗旧部,这是否会造成路径依赖?
王小川:不会。很多人可能对搜狗有误解,觉得搜索公司不够AI,其实搜狗现在有12000片GPU在跑着,70%是做推理的,搜狗是非常AI化的公司。搜狗的核心是语言相关工作,NLP是基本功,在大量文本数据中筛选高质量数据的方法和大模型是完全一样的;其次,在评价方法上,从平台输入一个问题,评价它的反馈答案好不好的标准和搜狗也相对一致,所以我们在一头一尾的原始数据治理上相对有更多经验,也更擅长对生成内容的好坏做评价。当然,大模型会涉及独有的经验和算法,但我们学起来也会很快。
甲小姐:你和业界大部分人的观点是相似更多还是不同更多?
王小川:不同的更多。很多人还是从“几板斧”的视角来考虑这件事,比如怎么搞算力,怎么搞算法,怎么找人,找人的时候大家也缺乏对生命的思考,还是在用物理方式堆明星团队。
关于招人,我的观点是不能靠“拼”团队。也许资本喜欢听把明星团队凑一块儿的故事,但公司是个生命,生命不是这么长的——它得深度融合,它的基因得交融,公司是进化出来的,拼出来的团队反而生长速度会很慢。
搭团队既要有一个融合好的团队基础,一个好胚子,也要注入更高级的基因。我最近的核心工作就是把团队理顺了,到月底我们差不多就接近50人了,下旬我就到美国去,也得去抢人。
甲小姐:你的大模型时间表如何?
王小川:第一版今年年中就训出来了,500亿参数,年底可以做到中国最好,达到GPT-3.5以上的水平。当然,这不代表我们中间没有产品发出来。
甲小姐:哪些维度可以定义“中国最好的大模型”?
王小川:基础参数量、在各个评测集上的测试效果、发布产品后的用户体验。
甲小姐:DeepMind和OpenAI虽然初始基因类似,技术都很强,但让他们拉开梯队的是DeepMind更像“AI特种兵”,把单个任务做得很好,但OpenAI最先找到了产品驱动的、scalable的玩法。所以决胜之战可能是你大模型上的“超级产品”是什么。你想清楚产品形态了吗?
王小川:我还在不断迭代,但我知道哪些东西是该有的。
甲小姐:你的超级产品会是to C还是to B?
王小川:To C,今年之内你会看到。
甲小姐:你提到会在医疗和教育两个方向做知识增强,为什么优先选择这两个方向?
王小川:语言是知识的载体。什么行业知识密集,什么行业就适合大模型。教育服务高知群体,医学生要学8年才能走进工作岗位,这明显是知识密集的两个领域。
甲小姐:和李志飞对话时,他说大模型公司的首席科学家第一年会非常难受,看到别人的“孩子”已经满地跑,自己的“孩子”还没有出生,周围很多人会不断问你孩子什么时候出生?你要权衡应该快速发布抢占时间窗口,还是更有定力先把产品做到足够好,你对节奏怎么把握?
王小川:可能看到别的“孩子”跑出来了我会有压力,但我不会难受,因为我和团队在一起,跟他们一块同进同出、同吃同住,知道他们的状态,他们的决定和我的决定是一体的。
甲小姐:重要决定不该是一把手工程吗?
王小川:是一把手工程,但要同欲同心。
3.谈路径:“今天的钱你可以买楼,你可以买卡,你可以买人,但它都不直接变成市场份额,也不一定有那么多网络效应”
甲小姐:你现在设计技术、战略、商业模式时,是完全独立思考,还是对标OpenAI?
王小川:首先我很尊重OpenAI,他们都是很聪明的人,但我更愿意自己想好后根据OpenAI的做法来自我验证,这是一个校对、校准的过程,而不是抄袭或参考。
甲小姐:你的路径和OpenAI有什么区别?
王小川:他们可以用几万张卡跑模型去通向AGI,但有些深水区他们就不碰了,比如搜索、医学,他们可能躲着走,但我要去碰这些东西,我需要更考虑落地应用。
甲小姐:早早关注落地应用可能会让你很难纯粹实现AGI。
王小川:国内都难。
甲小姐:以你的禀赋,也许你有能力像OpenAI一样一往无前地做纯通用人工智能?
王小川:资源、能力到了才行。我之前提出过若干今天看起来自己都觉得非常惊叹的技术创想,比如我之前想过怎么预测下一个词,怎么预测视频的下一帧,但团队做不到,就放下来了。
甲小姐:“团队做不到”指什么?
王小川:首先,网络结构的设计需要科学家,不是工程师就能做的。国内能搞网络结构的人屈指可数,杨植麟搞一篇东西在国内简直就已经(牛得)不行不行了。第二是确实烧钱,这是信仰层面的事,你需要能得到无限资金供给,我觉得现在还不具备。
甲小姐:搜狗时期你很擅长斡旋于大厂之间创造合作,接下来有没有想过找一个中国版“微软”,和大厂共舞?
王小川:我觉得不能照抄openAI,文化不一样,角色不一样。OpenAI有几万张卡跑模型。我们为什么经常有悲观主义?因为你想要和OpenAI一样。
甲小姐:大家只是期待想看到一个团队像他们一样能非常纯粹、没有太多现实约束地一路直奔AGI。
王小川:那团队要打过仗,练起来才行——你要相信团队能干这事,团队要相信你指的方向是正确的。这两个条件成熟才能做,这些东西是需要被验证的。否则你给我钱,团队hold不住,我在搜狗的时候这些是不成熟的。
甲小姐:国内很难再出现微软和OpenAI这样的组合吗?
王小川:有点难,也许以后会有。微软和OpenAI的组合里不是缺微软,是缺OpenAI。OpenAI用了7年时间孤独地做AGI,直到微软看见它,并且相中它。
甲小姐:对你这次创业来讲,钱的问题是不是问题?
王小川:我大概估算过,只是从0到1起步,5000万美元就够了,但要持续做到最好,大概需要3-20亿美元。
但人比钱重要。这个领域不会像之前打车、外卖一样,钱能直接转化成市场份额——今天的钱你可以买楼,你可以买卡,你可以买人,但它都不直接变成市场份额,也不一定有那么多网络效应。
甲小姐:中文语料质量是挑战吗?
王小川:不会,训练肯定是中英文结合,中英文之间也不是翻译的关系,就像一个小孩,妈妈是中国人,爸爸是美国人,小孩不需要翻译,很自然就会了。
甲小姐:算力是问题吗?
王小川:现在谈到算力,人们总有好多假设在里面,比如你需要弄1万张A100显卡。可你为什么要1万张?你要先想清楚。算力这件事其实打开看都是有办法的,而且几年后中国芯片企业也会有突破,这一点我特别有信心。
甲小姐:如果超级产品出来,算力不够怎么办?
王小川:那就是幸福的烦恼。
4.谈生态:“人究竟该怎么跟机器相处,这是我关心的问题”
甲小姐:安卓生态和苹果生态,你更希望百川智能接近谁?
王小川:如果非要选的话是苹果,我会往C端做。
甲小姐:你对封闭创新更感兴趣?
王小川:我觉得这才是象征综合能力的做法,而不是单点能力。安卓开源是工程师就可以搞的事,但C端是一个更复杂的系统,苹果比安卓更综合。
甲小姐:在AGI时代,“做安卓还是做苹果”这个问题过时了吗?
王小川:这个问题可能还会有,但不是我最喜欢视角。我是从“人本”来看的——人究竟该怎么跟机器相处,这是我关心的问题。从这个角度出发,我更知道C端要什么。
甲小姐:有人说“做出中国的ChatGPT不难,但是做成中国的OpenAI很难”。硅谷有很多厉害的人可能宁愿选择加入OpenAI也不愿自己单挑,他们追求AGI的梦想似乎大过了对入场姿势的选择。
王小川:硅谷对于改变世界、创造不同的心态会好很多,千团大战这种事他们是不会干的,我们还是受儒家文化影响,总希望出人头地、赚钱。
甲小姐:你觉得中国AI大模型团队最终会形成“一小龙”“四小龙”还是“四十小龙”?
王小川:不知道。在短期内,创业公司真能做大模型的可能就5个以内,大厂的标配是一人做一个。
甲小姐:你对全球AI产业接下来的趋势有哪些判断?
王小川:现在盯着OpenAI往下干就是趋势(笑),他们是人类的希望,大家都围着他们转。
甲小姐:对于AGI,你是完全乐观,还是带有悲观主义成分?
王小川:美国在研究上确实遥遥领先,但在商业应用里面,我认为追上的机会就大了。
5.谈心态:“现在跟世界的连接更轻松了”
甲小姐:听说你今天(2023年4月10日)下午2点之前都非常忙,在忙什么?
王小川:我昨天晚上写官宣公开信写到凌晨四点多还没写完,睡到早上八点又接着写。
甲小姐:你的公开信ChatGPT参与了吗?
王小川:没有。
甲小姐:你现在的状态和当年在搜狗时不太一样,humble了很多,感觉“紧箍咒”扔掉了。我回看了一下你卸任搜狗CEO的告别信,你说“感谢曾经极致努力的自己,把全部的爱奉献给了搜狗,自己即将去爱亲人、追寻爱情,为大众健康作出贡献”。再创业做百川智能,这些还能实现吗?
王小川:还好,离开搜狗这两年我更接纳自己了,我现在和过去两年比又放松了一层,和世界的连接更轻松了。在搜狗时你作为CEO总会说我们人才很充分了,我们想得很清楚了,我们事也干得很漂亮,你不断传递你是完美的这种状态,但创业不是这样——你会发现自己还有很多不足的地方,需要大家帮忙,这样一种心态对我而言是进步的,可能几位大佬不会这么搞。
甲小姐:现在你对这次创业的感觉已经从“被架在火上烤”变成“围着篝火跳舞”了?
王小川:我现在的感受很真实。越来越多人进场,我既不是非要秒掉他们,但自己也不是一无是处,这是一个很好的状态,反而让我感觉很松弛。
甲小姐:创业九死一生,你会害怕自己的光环消失吗?
王小川:暂时没有,这个问题不到那个时候没法回答。就像我们都说不害怕死亡,但死亡真正来临时就是另外一件事了。
甲小姐:你一直是个“做题家”,人们给你出一道题,你会做到世界第一,但你不一定是“出题高手”。AGI这条道路,你很快就会进入无人区,当没有人给你命题时,你怎么办?
王小川:“怎么去延续人类文明”不就是一个问题吗?
甲小姐:这个问题太广大,很难收敛到具体的做法。
王小川:也许我的答卷和别人不一样,但至少到今天为止我已经自问自答好多问题了。就像我写AGI和工业文明的关系,和互联网文明的关系,和文艺复兴的关系,我都已经回答这些东西了,但别人还没问过。
6.谈追求:“要把整个人类文明当作一个生命来看待,我们希望寻找终极答案”
甲小姐:你今天反复提到“人文”和“人本”,让这次创业有了某种感性色彩,这背后有更深的思考吗?
王小川:现在大家老问机器把人取代了怎么办。有些人一直喊怕被取代,但当你问他用ChatGPT了吗,他还没用。
“找到自我”这件事,对很多人而言是很困难的,包括我们做这件事的意义到底在哪?好多人创业是因为这个事很牛,或者这个事大家都愿意做,但我们是希望寻找终极答案。
与此同时,我们还是在脚踏实地做事的。我对这件事的思考深度超过了很多人,有些人还没意识到这是时代变化,而且相当于把以前所有时代加起来的变化。我们正在创造一种新的生命,它和石头、蒸汽机、电脑的出现都不一样,以前都是工具,但AGI不是工具了——它是你的伙伴,新的朋友,是人类进化的下一个阶段。
甲小姐:《生命3.0》这本书把生命分成了3个阶段——生命1.0是40亿年前开始漫长进化而来的所有生命物种,生命2.0是十万年前出现的智人,可以通过语言和学习来改写自身的“软件”,但不能改“硬件”;生命3.0是人类可以改写自己的“软件”,也可以改写自己的“硬件”。
王小川 :AI只是改写了软件。
甲小姐:改写硬件是另外一拨人做的,比如基因编辑,但各个技术在高处汇合。现在看起来,人类文明要进入下一个寒武纪大爆发的时代了。
王小川:我们常说“上帝”有两种,一种“上帝”无所不能、什么都管;一种“上帝”在创造一个世界后,这个世界就自行运转了。人也是这种状态——一方面创造一个生命,像“上帝”般的位置,但创造出来后就放手让它自己运行了。
甲小姐:“上帝”可以指代我们所追求的终极真理,它preload(预加载)人类世界,我们再去preload下一个世界,层层嵌套。
王小川:也许“上帝”就是我们的preloader(预加载程序)。
甲小姐:你和孙宇晨有一段旧事:2019年,孙宇晨在朋友圈回忆2014年与你的一场会谈节目,他说“永远忘不了他看我这打量骗子的眼神,他说我肯定会失败,和我录制节目是耻辱,最后甚至没法录下去。”孙宇晨嘲讽说,距离那天不到三年,自己公司的市值已经超过了搜狗。你后来回应孙宇晨,“什么叫成功?什么叫骗子?每个人有自己的定义。有的人以为是身价,有的人以为是市值。放到历史长河里,云淡风轻。用极致理性追求真理的科学家,用极致感性追求美的艺术家,以及用大爱对世界或民族做出的贡献的英雄,才能永垂不朽。 ” 我观察人们的人生目标最大的区别在于评价自己的时间尺度不同,有人追求cash(现金),为了这辈子,有人追求asset(资产),为了自己的孙子,有人追求legacy(遗产),为了世世代代。你追求什么?
王小川:核心要回答三个问题:这个世界是什么样的?我是谁?我跟世界有什么关系?
甲小姐:不是所有人都好奇。
王小川:反正我是好奇的。我对娱乐化没什么感觉,比如我能做头条,但我做不了抖音。如果这次创业我们做成了,我们就有机会在中国做一家能真正有技术理想主义的公司。之前没有这种条件和能力,但我有意愿,现在有了这个机会,是让我愿意去大干一场的最大动力。
甲小姐:你理想的AGI,是信马由缰地做一个未知生命,还是去复刻一个人类生命?
王小川:AGI跟人的生命是连结在一起的,要把整个人类文明当作一个生命来看待。
甲小姐:很多人用对立视角比较机器文明与人类文明,但你所说的人类文明已经包含了AGI——相当于一个海洋生物爬上陆地,虽然进化了,但依然是同样的文明,而不是上了陆地就抛弃了海洋。
王小川:是的。
甲小姐:横向对比所有世界级前沿科技议题,AGI是你眼中“皇冠上的明珠”吗?
王小川:这取决于AGI能不能解释人的生命,是否能让所有生命获得一种更大的文明,从繁荣和延续人类文明这个角度来看,AGI是很有意义的。
甲小姐:你一直提“技术理想主义”,你怎么定义“技术理想主义”?
王小川:首先,把技术做好就是目的,而不是用技术去服务商业化;第二,先相信再看见,而不是先看见再相信。
甲小姐:在当下创业环境看,技术理想主义者是一个有利的词吗?
王小川:我认为任何领域都可能入“道”,茶有茶道,花有花道,而极致的技术理想主义者一定是一个纯粹的理想主义者。
甲小姐:无论走哪条道路都能登上珠峰,但在通往AGI之路上,我相信你会逐渐面对很多选择,不是强和弱的选择,而是好与坏的选择。
王小川:探索生命的意义是我永恒的主题。
评论