正在阅读:

源码资本张宏江:为什么这次的AI浪潮来得如此迅猛?

扫一扫下载界面新闻APP

源码资本张宏江:为什么这次的AI浪潮来得如此迅猛?

今天大家一直在谈AI,实际上我们看到的是在过去十年里快速发展的AI里的一个重要的分支,这个分支叫做机器学习,更确切来说是机器学习里面的一个分支,机器学习里面有统计学习和各种各样的方法,这块是机器学习里面的神经网络的一种学习方式。

9月25日,由亚杰商会主办的“2017中关村创新创业系列互动—AI技术的发展”在亚杰汇创始人俱乐部举行,张宏江博士带来了《AI的本质和机会》的主题演讲。创客猫受邀作为合作媒体将到场进行图文直播及报道。

纵横产学研投资各领域的张宏江,是世界多媒体研究领域一流的科学家,是计算机视频检索的开山鼻祖,曾经是微软亚太集团首席技术官,前金山软件CEO,现任源码资本投资合伙人。

以下为张宏江博士演讲全文

张宏江:

我会从四个方面给大家讲讲AI的本质和机会:​

一个是这次AI潮流为什么来的如此迅猛、如此巨大,为什么有这么多的公司一拥而上?我认为我们这次不能够错过这次机会;第二,大数据是AI主要的驱动力,我会给大家讲讲AI发展的前景以及我对AI的看法;最后,作为源码资本的投资合伙人,我也看了很多的项目,所以借此机会跟大家分享下我对AI相关项目的体会,包括现有的企业、传统的企业怎么让自己搭上AI这趟车等等。

这次AI的浪潮来得非常迅猛,从去年3月份李世石和AlphaGo那场围棋大赛收尾以后,媒体界一拥而上,这样的现象自然而然会有一些麻烦出来,当然随之而来也带来了好处,好处就是AI突然变得非常火热,懂AI的、不懂AI的,大家都在探讨AI到底是怎么回事。总的说来,我认为这样的现象是好的,另外中国的热度显然比美国的硅谷更热,这个热所带来的好处就是带来了观众觉醒,大家开始意识到:关于AI,我是不是应该去了解一下?所以我想大家或多或少的都受到了AI浪潮的影响。

为什么这次的AI浪潮来得如此迅猛?​

这次的AlphaGo为什么能够战胜李世石?今年又战胜了柯洁,这到底是什么原因?为什么这次AI的浪潮和前面几拨浪潮不太一样?很重要的三个原因:第一个原因是在AlphaGo里面用了一系列的新算法,一个很重要的算法就是深度学习,这是基于神经网络的一种学习方法,而且在它的另外一层网络上用了所谓的强化学习,当然也用了比较好的搜索的算法。整体来说,他用的这些算法都反映了AI这个领域在过去十几年里快速的进步,从而使得它能够具有非常强的计算能力和决策能力,它本身内部的模型的复杂性远远超过我们以前想象的神经网络和一般的模型,之所以它能够有这么复杂的模型并且有如此强大的决策能力,另外一点往往是外行人容易忽略掉的。

大家都知道AI算法多么厉害,AlphaGo多么厉害,其实背后有一个很重要的原因大家常常容易忽略掉。那就是第二个原因,随着互联网的发展,尤其是过去移动互联网十年的发展,带来了高质量的大数据,我说的高质量大数据是指这些数据是被高质量标志过的。

其实AlphaGo在跟李世石下棋之前,它当时的系统就已经用了人类六到九段棋手的16000次对局中间的,超过3000万点的布局数据,这是非常好的数据。同时因为本身是个机器,左手打右手,所以它自己跟自己下了许多盘以后,自己又搜集了3000万的数据点,这样的话训练它的这些数据可能超过了人类围棋大师一辈子见到过的数据,这是我们以前不可想象的,在今天我们做到了。

另外一个非常重要的原因就是它背后高性能的计算资源,这在上一拨AI潮流的时候,这块是我们不可想象的。AlphaGo在去年跟李世石进行比赛的时候,它装备了1920万个CPU,还装备了280个GPU。为什么我说这个东西很重要呢?我们知道围棋从一段到九段,但这是我们一般外行人看的,其实大家不知道在同一段的选手里面还有一个细分的值,叫做ELO number。当AlphaGo的系统CPU和GCP开始增加的时候,他的ELO number怎么增加呢?当它的CPU的数量是48个,只用一个CPU的时候,ELO是2000多点,随着它用CPU的数量增加,当增加10倍的时候,ELO number增加到了将近3000点,差不多增加了30%。然后当它增加到最后用来比赛的装备的时候,到了1920个CPU,280个GPU的时候,ELO number到了将近3200点。

我想说的是随着CPU数量的增加,机器的能力确实是在提高的,这说明这么智能的机器,其实它的背后是靠大量的计算资源撑起来的。机器在跟柯洁下棋的时候架构做了一些改变,用新的更强的算法,这样对计算的要求稍微降低了一些。整体来说是计算能力的趋势对于整个系统能力的影响。其实在李世石跟AlphaGo下围棋之前有多少人认为李世石会输?只有两个人认为他会输。所以以这个举例来作为引子,我们应该看到机器背后的三大因素:新的算法,非常强大的计算和大数据,这也是我今天谈的主要的内容。

今天大家一直在谈AI,实际上我们看到的是在过去十年里快速发展的AI里的一个重要的分支,这个分支叫做机器学习,更确切来说是机器学习里面的一个分支,机器学习里面有统计学习和各种各样的方法,这块是机器学习里面的神经网络的一种学习方式。再确切点来说就是过去十年的发展是神经网络里面的一种新的架构,叫做深度学习网络,就是深度神经网络。简单来讲,就是神经网络的层数比较多、比较深,这是深度学习的核心所在,所以其实并没有那么高深。

在此浪潮前已经有过两拨大的AI浪潮,AI的第一拨浪潮是在50、60年代,AI的发起人第一次在美国聚会上提出了人工智能的概念,那时候的这拨热基本上还停留在概念上,包括此后的科幻片都是基于这种概念;

第二次浪潮在80年代中,AI真正开始热并且开始有些应用,那时候你做模式识别或是做计算机识别的领域,如果你不用神经网络来做,别人就认为你做的东西是没什么能力的,简单讲这次热潮就是专家系统和神经网络。

神经网络其实就是今天深度学习的基础,那么为什么五六年以后神经网络这拨热就过去了?有三个原因,第一是因为算法有局限性,不如今天的算法这么好;第二个原因是那时候我们没有大数据,也没有强计算。如果当时你是在一个实验室做神经网络的训练,你基本上可以看到这个实验室里所有的工作站都会贴个条子说不要关机,这个机器我在做训练,而且恨不得把实验室所有的机器连在一起做训练,那时候那么多的工作站也未必比我们的手机计算能力强;最后一个原因是高质量的数据也没有今天这个量,所以神经网络的浪潮很快过去了。

直到2006年,Google的首席AI科学家在自然杂志上发表了一篇文章,文章中第一次提出了深度学习的概念。当时这篇文章提出来的系统就是神经网络,深度学习的神经网络的系统,这个系统的应用就是图像识别,很快大家看到了这个算法的优势,然后这个算法就热起来了。

2012年斯坦福大学的教授做了一个运算,用300万的数据做了一个图形识别,然后用深度卷积网络获得了第一笔经费,这之前别人都不会特别在意,但这次很重要的一点就在于,他居然超过了第二名10个百分点,这种差距非常大,因为在激烈的计算中,一般第一名和第二名的差距都是在小数点后面算的,他居然超过了10个百分点,大家突然认识到卷积神经网络学习能力非常非常强,就加快了深度学习的普及。

2016年的AlphaGo,神经网络显然达到了一个里程碑,这拨的浪潮跟前面那拨浪潮从基础架构上虽然都是神经网络,但是在这次热潮里,神经网络、深度学习的算法加上与之相匹配的大数据和强计算资源,使得这次浪潮比上次的浪潮大得多也真实得多。

到底什么是神经网络呢?我们人的大脑的结构里有神经元,每个神经元存在一些触点,这跟其他的神经元的触节相连接,这是大脑的基本结构,大脑的数量是如此之多,神经元的数量是如此多,更重要的是它们之间的连接更多,这形成大脑有计算能力、有记忆能力、有推理能力。神经网络从一开始引入的时候就试图模拟这么一个神经元,它模拟的是用数学方法,因为神经元有一些触角点,可以来接收信息,然后有一个突出点来输出信息,中间是非线性函数的运算,一个神经元它有输入的几个触角,也有输出的触角,当把这些神经元一个一个排起来的时候,你就会看到形成一个网络。

我们试图模拟这个架构,但是并没有模拟到这个过程。当你模拟了这么多神经元以后,你可以想像当输入有一排信号过来的时候,输出也有一系列的信号,输出的信号是什么样,所要求的输出的信号是什么样的值,其实你可以对它做一些预设,这就是训练的过程。因为输入的是原始数据,或者数据的特殊量,当它接触到这些信号的时候,输出一定的信号,这就是一个过程,深层网络就是层数比较多。在整个训练的过程中,你训练的是这些链接的权重值,用矩阵的方式来说这是一个矩阵,从而当有一种输出的时候,经过变化会有一种输出,这是最典型的深度学习的方式。

高性能的计算资源和高质量的大数据​

计算资源跟20年前也就是跟90年代初相比有了突飞猛进的变化,一是因为计算能力的提高,也就是说同样的计算能力,它的价格是随着时间有一个迅速的降低。这就是今天为什么我们作为一个小的实验室或者小的公司也能够用得起的原因所在,相对来说比较大的计算资源,正是因为一方面这个计算能力迅速地提高,另外一方面单位计算能力的价格迅速地降低。

另外,如果仅仅有计算资源和计算能力,还未必能够获得今天如此巨大的在深度学习算法上的成功,因为除了CPU以外还有GPU。我们做神经网络,尤其是用卷积网络的时候,知道用GPU来加速是非常非常有效的一种方式,不光是计算能力本身的迅速成长,而且新的计算架构,GPU本身也使得这个技术,使我们的方法变得更加的强大。

一个典型的AI的代表,就是nvidia,因为有大量的人工智能的需求,使得它有更多的芯片拿出来,基本上这就是并行架构的处理芯片,这是一个最典型的芯片。另外一点,如果我没有太多的科研经费,买不起大规模的GPU的集群,怎么办呢?这也就是为什么大家都能做深度学习的原因。因为你买不起所以你可以租云,云在过去的十年已经成为IT服务的重要支撑。你不需要一定要自己买,你可以租几天、几周、几个月,根据你的需求你可以租几片CPU,也可以租上百片的GPU,这是云。等你训练完那些神经网络以后,你可以把这种服务再退掉,从而使你不需要持续地为这些设备来付费。所以这是在IT技术上一个很重要的变化:云计算使得我们哪怕是小公司、小团队也能够用起非常强大的资源。

在AI背后还有一个非常非常重要的力量是数据的爆炸,这个数据爆炸真正普及的时候是在2007年iPhone上市的时候,后来是Android,使得智能手机大规模地普及,形成了今天的移动互联网,在这个浪潮中非常大的一个变化就是数据量爆炸性地增长。

IDC是全球的数据公司,他认为2013年到2020年的这七年中人类的数据会增长十倍,也就是说今天我们大概一天产生的数据是22GB,2020年将会到47GB,如果你把这个数据放在标准的iPad里面,120G的硬盘,就相当于可以把iPad摞在一块,从地球到月球走九圈半。

微信两年前的数据显示,微信一天在朋友圈里面传的照片就超过了10亿张,这只是在朋友圈里传的照片。现在twitter每天是5亿条,今日头条每天处理的数据量也都超越了6.3个BP,这都是移动互联网普及的结果,而且这种数据都有时间、地点,也都知道是谁在手机上传的,所以数据标注也非常好,这些数据都可以用来训练机器学习的系统,训练神经网络,从而使神经网络具备某一类的推理能力。在这里最常见的就是精准广告的能力,因为它能对你的需求,你本人的兴趣有很好的判断,从而推送精准的广告。

我认为大数据爆发性成长,导致AI能力提高的一个很好的例子就是人脸识别这件事在中国解决了,而且中国的这种产品在世界上是领先的。我现在用的手机是小米note2,这是我在20年前梦寐以求的功能,使你每天都可以拍大量的照片,除了存储空间要钱的话,拍照片本身不要钱,消耗一点电量而已。你拍的照片越来越多,你会发现一个问题,想找一张照片就很麻烦,但在今天照片可以按时间和地点排,如果能按人的会更加方便,你会知道我大致什么时候跟什么朋友出去的照片,或者我今天跟大家做一个会议拍照片,就有我的人在里面。时间、地点加上的人的话,照片就可以多了一个搜索空间,这样找起来就会更方便,所以这是今天在小米手机上能做到一点。这是怎么做的呢?这就是核心的人脸识别的能力,这是我20年前梦寐以求,而且有专利为例。我1997年在惠普工作室工作的时候申请的专利,就是人脸识别。

我们认为机器学习已经从传统的建模,发展到今天用数据来推动,这是一个非常非常重要的转移。我们的数据越多,我们的精度越高的时候,对于学习的结果就会越好。同样当你用任何一种神经网络的算法,当你的数据增加的时候,你可以看到它的性能的改善,同样你用不同的方法也可以看到它的性能也是根据数据的增加而改善的,当然最后改善的速度会缓慢下来,意思就是说对同样的算法一定是数据多了,你的性能会得到更好的改善,当然可能到了某个点以后就饱和了。

今天从企业的角度来说,数据是推动智能引擎的能量。英特尔的CEO一年前说过自动驾驶的电动车每天产生的数据是4T,今天最贵的电脑的硬盘是1T,所以一天的数据量要四个笔记本能装上。数据处理是英特尔的核心,所以他今年年初的时候花了153亿买了自动驾驶技术的一家公司,他其实看重的是他的数据。

AI在未来一定是辅助人增长的​

AI在未来一定是辅助人增长的,所有过去人类创造的机器都是辅助人的,汽车、飞机都是辅助人的交通工具。另外,关于人工智能可以代替人类的这种说法我们心理上的确不太能接受,但是如果有扫地机器人也挺好的。最后还有种说法是人工智能在未来会超越人,当然,我们知道机器其实在很多的时候确实能够代替人、超越人,但是我们想想为什么会做到这点?AI今天为什么在很多的应用场景上超过人?先说一个应用场景就是AlphaGo。

那时候很多有关李世石跟AlphaGo比赛的报道,其中有一篇报道里有句话我印象非常深刻,那句话是这样说的“当李世石的第四局千辛万苦终于赢了AlphaGo的时候,李世石脱着疲惫的身躯回家泡热水澡,睡了好觉,那天晚上AlphaGo自己跟自己下了100万盘棋,从此人类再也没有希望赢机器了。”的确,第一在速度和精力上显然人是不如机器的,这其实很好理解;第二就是说人能不能像特斯拉一样,每天在世界上有几十万辆车在路上跑,在搜集自动驾驶习惯的数据传到云上去,同时使它能进行并行的数据搜集和处理、学习,其实人类很难做到这一点的,所以机器学习的能力也是机器比人强的地方;第三就是你能想到能在世界上如此多的人脸数据,迅速找出罪犯的总计,在规模上显然人又不如机器。将这三点放一块来讲就是机器比你速度快,比你能迅速学习,比你规模大,它能做到的事情超过人类,其实我们不应该觉得特别的吃力。

那么是不是那些人类能做但无法清晰表达的事情,AI做得不如你呢?其实下围棋,为什么有各种各样的下围棋的宇宙流,这是一种艺术、一种流派,它其实是一种没法应用数据表达清楚的,今天机器已经超过人类了,在围棋这件事上。那其他的角色呢?投资,现在至少在基金投资上、指数投资上,已经证明机器比人强,因为人可能还有一些感性的因素在里面。在政策的规划上,战争的推演上,没有理由说AI做得不比人强,因为机器现在逐渐还有自主学习的能力,人类其实说不清楚的靠反馈、靠琢磨学会的东西,开车、骑自行车,我们没有一个人是看驾驶手册就能学会开车的,这些靠学习掌握的能力,包括滑雪,今天AI都能做了,也就是说我们原来认为模糊的,都能用数学表达清楚的,计算机可能不能做,今天通过机器学习的方式计算机也能做,所以在很多场景上超过人不是不可能的事。

柯洁跟AlphaGo下棋之后他有一个感叹,他觉得他自己在跟上帝下棋,他说3000年人类围棋的艺术,突然发现在AlphaGo面前变得太容易了,AlphaGo好像有上帝的视角。什么叫上帝的视角呢?用数据表达一下,我们学数学的人都知道,如果你站得山坡的高度就那么高,你看的就是那么高。3000年人类围棋的艺术就是这个小山坡,而AlphaGo经过这么大量的训练的之后它其实站得更高看,一览众山小。人类的那些知识的积累只是机器看到的其中一部分,机器看到了人类远远没看到的地方,所以它打败你这件事是非常正常的,只要一个应用场景,你设计出的AI能够覆盖的空间比人之前覆盖的空间大,基本上机器就会打败人类。

我特别喜欢图灵的这句话,“虽然我们能够强迫机器成为我们的佣人,实在不行我们可以拔电源,但是当这个佣人具有这样的能力的时候,我们心里面还是要非常谦卑的。”当人类被AlphaGo打败的时候,其实它提醒了大家,这时候未来你会看到很多很多的事情,人类会被AI打败。这时候你可以想一想,当初上帝创造了人之后,猩猩的感觉。

那么哪些行业会被机器所取代呢?从投资的角度来说,一定是最先冲击数据多又钱多的地方,比如金融,数据多钱多。我想未来翻译这件事肯定会被AI取代,驾驶、投资,一般的会计记账也能被计算机取代,简单的新闻写作也能被机器取代,总之还有很多很多的工作,所以才有人提出未来的数据是有神人和闲人,可以设计管理这些机器,而这是一种稍微高端的说法。作为安慰,我想资本家和创业者是不会被取代的。

机器学习显然有它的问题,尤其是神经网络的机器学习有很大的问题,这个问题不是系统本身的问题,是人觉得有问题,并不是系统觉得有问题。什么意思呢?就是说计算机学出来的东西,神经网络学出来的东西都有正确的判断,但是它没法解释,因为是数据驱动的。所以今天人们终于制造出来一个机器,它能够做比你还正确的决定,但没法告诉你为什么这么做,这点让我们觉得很不舒服。比如纽约有一家医院,把70万个病例输给了一套系统,深度学习的系统,从此以后这个系统在预测某一类人会得某种病的预测上,超过了这个医院所有的大夫,尤其是在预测精神分裂症这种疾病上非常非常准确,但是它不会解释为什么,它唯一做到的是看了70万个病例,你想想人一辈子谁能看70万个病例。政府总是觉得,这个东西没法解释就是一个绊脚石,比如说军方要轰炸某一个目标的时候,飞机飞过去,要是自己就炸了,这类决定一定会有大量的错误,如果人类犯错会原谅,但是机器犯错误我们不能原谅。

我非常认同丹尼尔·丹内特《从细菌到巴赫》这本书里的一句话,他说其实人类智力进化的本质的特征就是进化到一个系统,这个系统既是它的创造者,但无法解释它的行为。其实今天人类的很多行为上帝能解释吗?今天我们的很多行为跟3000年前人类的行为相比有很大的变化,每个人在做决定的时候我们真正能解释吗?其实也未必。那么,人觉得解释不了无所谓,事后再解释,但是我们对机器的要求好像不能自我解释就会有问题。实际上我们所面临的,就是人类历史上过去从来没有创造一个工具,连它的创造者都不能理解。因为发电人类可以理解,汽车怎么开人类能理解,但是当你创造一个AI系统做了非常正确的决定,人类不知道它怎么做的,这时候会觉得有些问题,这是至少干扰人们应用AI的一个潜在的问题。

我想说其实AI并没有人们想得那么厉害,因为AI真正能解决的无论是图像还是语音识别的问题,这部分都只是在感知这件事,是在单一传感器的感知,看或者听,这是两个单一的感知,显然机器今天已经做得跟人一样了,甚至比人更好。

微软在一个月前宣布英文的语音识别系统超过了人,所以在感知这块超过了人,这是毫无疑问的。从而可以说语音或者图像,然后自动驾驶,也是感知过程,今天不行未来肯定行。但是在认知,就是在自然语言处理跟NLP这块,在广义的NLP这块AI还差很远,在自动推理、自我学习、交互,也是还需要非常非常长的路去走,所以你看到一些所谓的对话聊天基于人,我希望你要知道它不是真正的理解了你的对话,只是每说一句话它在网上搜一下,有没有类似的回应,这种对话系统是这样的,在自然语言理解意义上,在今天广义上还是做不到的,个人助理在广义上也做不到,特殊的场景可以做到,就是打电话订票。

展望未来:AI领域里的创新与创业​

AlphaGo是非常了不起的突破,因为AlphaGo本身是一种自我做决定的,这就是为什么我们觉得AlphaGo是非常了不起的事。今天大家看到很多的智能音响,一般人买回去以后很快发现音响干活,智能那部分不干活,因为这是一个对话型的,自然语言理解的。如果我们投资一家AI企业该怎么做?在过去人类经济发展的历史中有过几次革命,而且这几次革命都给人类带来了巨大的财富和翻天覆地的变化。

第一,农业革命,从一开始简单的小作坊的操作到真正学会种植,差不多2000年前,一直到18世纪,在工业革命之前这是种植收获,简单的农业时代;

第二,工业时代,从19世纪开始,蒸气机的出现,人们这时候开始了真正的制造,出现了大英帝国,欧洲、美国、日本,这是工业革命,200多年的历史,给人类带来了非常巨大的变化;

最后,信息革命,20世纪下半叶,也就是五六十年代开始到今天。AI革命是大家把计算机的能力和人的潜力合在一起,这是AI革命的核心所在。我们应该去相信AI革命与前面几次革命一样,是能够带来一些新的发展机会和一些新的投资和发财机会的。但是从投资的角度来说,我们在判断科技创新的时候,一定要把创新这件事想清楚,因为科技创新是有很多变化的,它不是一蹴而就的。比如说当一个新的技术来了以后,经常我们说的长江后浪推前浪,前浪死在沙滩上,你的技术太早也会死去,就是所谓的三大重叠,技术要经过非常长期的冰河期才能真正开始形成主流,在许多技术面前,可能某种技术突然脱颖而出,就像机器学习这块,在过去十年之中脱颖而出,成为了深度学习。

在AI这个领域到底哪些技术能够成为超级步骤?哪些能突破冰河?哪些是最好的第三浪?这是我们需要思考的。另外,我们做一家公司,基本上你要提供价值,就是说企业创造价值有几个方面,一个是技术革命,我们做技术出身的认为这是最正宗的做公司的模式,今天我们看到的大部分互联网的成功企业,其实是专业模式的创新、管理的创新,所谓的管理创新其实就是提高效率或者是生产资料的创新,在这块需要大家注意的一点是:过去的生产资料是资本、自然资源,今天中间加了一个数据,所以这是我们要记住的,当然还有一些创意、品牌之类的。

在AI革命的这些年里我们看到每一拨新的IT科技的浪潮都会孕育出平台级的公司,很多人都想我要能做一个AI的平台公司,就可以成为下一个百亿、千亿美金的公司。PC最早是提高效率,自动化,所以出现了微软、英特尔,也出现了苹果这样的公司。互联网是信息的流动,从而出现了雅虎、Google。移动是连接,Android是连接,Facebook是连接,腾讯也是连接。沿这个逻辑推理一下,我们要想清楚在AI时代,这块提供的是智能,这是毫无疑问的,那么要提供哪些价值?就会以什么样的产品形态、什么样的公司形态出现,这个我们要问清楚自己,我们创业的时候要想清楚。

另外,我们在做任何一个新的技术的时候,我们都要分层。AI整个产业链是有基础、有技术、有应用,数据本身是基础,有计算能力的是基础,BAT都有数据和计算能力。然后就是应用层,我们专门做应用的解决方案,比如说你提供一种经营资料,最新的服务,你做精准广告也是一种应用,所以我们最怕的是你把自己局限在这块,就是只有技术,这是非常担心的。我看到很多的创业公司基本上就在这儿,几个人只有技术,你想想我们知道任何一个技术无论它多么复杂,随着时间的迁移都会被颠覆,所以你不能形成一个应用场景,或者这种应用场景不能把控,或者数据不能把控,这是非常危险的。

在计算机领域我们知道在IT这块过去的几十年,成功的公司基本上就是从硬件、操作系统、杀手级应用这几个维度来看。PC时代微软有了操作系统,有了Office这样的超级应用,在互联网时代Google有了搜索,在移动时代腾讯有了微信,这些都是杀手级的应用,杀手级的应用最后就会变成平台。AI同样,你可以说AI的芯片,好像这些巨头都在里面占着了。AI的操作系统云,巨头也都有了,杀手级应用,所以要想清楚做的东西到底是这三块当中的哪块,或者是说这三块哪个最容易出现平台级的公司。这是你要想清楚的。这三块其实都在杭州。

以源码资本来说,我们投公司的时候先从应用出发。大家记住一点:AI是一种能力,是一个赋能者。你看应用这块哪个市场大,我们说零售、金融、交通,然后是规模,另外是数据基础,零售的数据多,通讯数据多,金融数据也多,传媒广告数据多,最后是收益和风险,这是我们投资的一个排列组合。显然大家创业的时候,需要想想自己在哪,你最好在一个市场很大,你自己又能够不断地获得数据,而且风险可控的一个场景下来做创业。

在人工智能这一拨的技术浪潮的公司,互联网不一样的地方就在于互联网基本上是商业模式驱动,搜索以前没有,to C这块是赢家通吃。这块做成熟以后进入互联网+。在AI这块不一样的地方是数据和技术驱动,而且它是从颠覆性的行业开始,使得这个行业变得更加有效率,很多的方法通过AI来取代,而且强调了在应用方面。最重要的一点是我们应该认识到AI实际上是AI+,只有AI加应用场景你才具有价值,这是我们要记住的。我们要重视技术发展的曲线,有些技术现在炒得特别热的时候,未必是很快就能有应用,这里有不同的标注,这种圈是三到五年,然后有些是五到十年,我们看机器学习三到五年可以应用的,认知计算可能是十年以后,这是一个参考。认知这块我们知道这个技术不是三年能突破的,这块创业的人要想清楚,这就是我前面说的三大重叠,这是非常非常难把握的,每个人对自己的技术都觉得要改变世界,但是很容易三年之后出现另外一个技术全面覆盖。

AI在一个公司里面在哪里能创造价值?基本上无论是在产品的定义,未来的规划,还是在生产过程,还是在推广,还是在最后增加用户的体验,这四块AI都非常非常关键。一家传统公司要想用好AI,想把AI真正用起来,举例来说麦肯锡有五个重要因素:第一是你要有一个很好的应用场景,这个应用场景对用户非常有价值;第二是你要有数据,要建一个非常好的全面打通的数据系统,不能够数据孤岛。第三你要有技术能力,要有工具;第四你要把整个的流程集成在一块,不能有孤岛;最后在你的文化上还是要有非常开放的态度,所以这是一个公司能把AI用好的很重要的因素。

在哪些应用场景里面AI可能会比较早成功?这是需求、时间的问题。显然走在最前面的一定是金融和高科技产业,第一本身有技术,第二本身也有钱,第三是本身也有技术,还有互联网,然后交通、自动生产线。 

做投资的人一定会问我泡沫的问题。AI的技术发展到今天,它的能力是没有什么泡沫的,但是在AI宣传上、企业的融资、募资上,一定有泡沫。今天所有的公司都恨不得说自己是AI公司,尤其泡沫最严重的图像识别的企业。中国有上千家图像识别的企业,有上百家做自动驾驶的公司,我们数数这世界上有几家做汽车的公司,所以显然这块有泡沫。我想跟大家多说几句,只有算法和技术是形成不了这个商业模式的,因为这些商业的巨头,包括Google、百度,开源的AI可以提供,你的技术门槛会降低得非常快。你说我在做芯片,你不要觉得你自己能设计出整套的算法就能做很好的芯片,因为芯片是非常复杂的生态链,你到底做生态哪块,是做低功效的芯片,还是要做某个应用里面的最好的解决办法。大家记住:做AI的公司你自己有没有数据,你能不能够不断地在生产过程中控制数据,能够比别人早占有和使用数据,这是你要想清楚的,大部分应用公司的技术壁垒会随着时间迅速地降低,所以光有技术没有用的。

为什么我认为今日头条这家公司在AI领域是一匹黑马?其实说黑马我觉得已经不对了,因为它已经是非常成功的公司了。今日头条做的根本是连接人的信息,其实互联网过去这么多年的发展就是在做同样的事情,或者说人类过去3000年的历史基本上也在做同样的事情,最早的人类信息的连接和存储,到以后的活字印刷,使信息有比较好的载体,而且利于传播,比在竹子上成本低很多。然后到2000年PC互联网时代,那就是让信息透明化,让人们很容易找到信息,这是PC互联网时代。到了移动互联网时代,你有一个设备每天都跟着你,对你的了解甚至超过你自己,这是智能手机。这时候终于可以让信息来找你了,就是说当有系统对你的信息的需求了解地如此准确,这就解决了一个问题,不是零散化,而是它来找你,这就是今日头条做的事情。

当然这个事情只能够在移动互联网做,新闻推荐这事15年前就有人做了,那个做法跟今天的做法完全不是一回事,因为那时候对于人的了解是远远达不到今天一个手机对人的了解透彻深入的。加上人工智能,其实是让一个系统具备了了解你、认识你、知道你的生活规律、知道你的消费行为,从而更好地把信息传递到你的手中。不光是以文字的方式、视频的方式、长视频、短视频,以微头条,以各种各样的方法传达你手里面,甚至告诉你,你的朋友在看什么文章。这种交互的学习只会对你了解的越来越深,也同样能够做精准的广告,这是为什么过去两年今日头条的收入如此快速的成长。

如果我们把今日头条的技术上分解一下,人有一系列的描述,描述你所处的环境,这边是所有的文章计算机自动的分析,然后匹配的最好,这底下驱动的是机器学习所有的方法。同样在手机上你注意看到,已经不光是新闻了,信息流的方式,有视频,有问答,有百科全书,有图像、有直播,再加上你的朋友圈,加上你的群。真正连接了人与信息,这样的话我们再看一些数据,今日头条有超过7亿用户在全球,日活跃用户超过1亿,月活跃用户超过2亿,平均日使用时长76分钟,一个人一天有几个76分钟?另外比它时间还长的,90分钟的就是微信,90分钟加76分钟,可能你回家跟家人都没有更多的时间所在了,这就是它的魅力所在,也是它能形成正循环的原因,这些数据使它学习的更好,制造了需求。这就是AI一个最好的应用,也同样把广告打的非常精准,使你不烦它的广告,不是说它今天做到了,就是从趋势上要做这个事情。

我最后总结就是,我们做AI,我们做公司,或者投资公司,我们基本上要记住三点。第一,AI非常重要,我们要相信AI技术已经在成为公司竞争的最核心的差异化能力。这是第一点,定义你这家公司能不能比别人更具有竞争优势的重要一点。

第二,产业基本上是三种方式,第一种方式就是人工智能即服务,这是巨头的核心,百度把它的自动驾驶能力开放出来,Google把自动学习的能力开放出来,百度把语言的能力开放出来,你把你的AI能力作为一种服务开放给大家,这是云服务的概念。第二种就是自主开发,我公司有人、有数据,我有懂AI的人自主开发,从而形成我自己的应用,等我的能力扩大以后,像今日头条一样,也许可以把它作为一种AI的能力输出,也许我永远给自己用。第三种我们今天看到大量的公司实际上是服务,因为它只有技术但是其他的没有,没有应用场景。这种公司就像所有的咨询公司市值做不大,随着技术壁垒的降低,你的竞争力在这块是站不住的。

最后,做AI的公司还要记住两点,那就是数据和人才。我们说算法很重要,技术很重要,但技术和算法最终是人,数据非常非常重要,数据是最终的护城河。

AI领域是中国创业创新非常好的机会,高盛的报告也专门提到中国,中国在AI这块非常有竞争力。他给了两张图,一张图是世界上的学术杂志里面提到深度学习和深度神经网络的,这些文章的作者,按国家来分,中国在2014年的人数超过美国了。然后引用的文章同样中国超过美国,所以这是非常令人鼓舞的。另外一张是我在那张网页上拍的照片,大概2015年年底或者是216年年初的数据,每一分钟在中国的互联网上发生的事情,什么意思?中国有数据,咱们有人、有数据,显然AI能在中国创造机会。

文丨创客猫 蒙娜

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

源码资本张宏江:为什么这次的AI浪潮来得如此迅猛?

今天大家一直在谈AI,实际上我们看到的是在过去十年里快速发展的AI里的一个重要的分支,这个分支叫做机器学习,更确切来说是机器学习里面的一个分支,机器学习里面有统计学习和各种各样的方法,这块是机器学习里面的神经网络的一种学习方式。

9月25日,由亚杰商会主办的“2017中关村创新创业系列互动—AI技术的发展”在亚杰汇创始人俱乐部举行,张宏江博士带来了《AI的本质和机会》的主题演讲。创客猫受邀作为合作媒体将到场进行图文直播及报道。

纵横产学研投资各领域的张宏江,是世界多媒体研究领域一流的科学家,是计算机视频检索的开山鼻祖,曾经是微软亚太集团首席技术官,前金山软件CEO,现任源码资本投资合伙人。

以下为张宏江博士演讲全文

张宏江:

我会从四个方面给大家讲讲AI的本质和机会:​

一个是这次AI潮流为什么来的如此迅猛、如此巨大,为什么有这么多的公司一拥而上?我认为我们这次不能够错过这次机会;第二,大数据是AI主要的驱动力,我会给大家讲讲AI发展的前景以及我对AI的看法;最后,作为源码资本的投资合伙人,我也看了很多的项目,所以借此机会跟大家分享下我对AI相关项目的体会,包括现有的企业、传统的企业怎么让自己搭上AI这趟车等等。

这次AI的浪潮来得非常迅猛,从去年3月份李世石和AlphaGo那场围棋大赛收尾以后,媒体界一拥而上,这样的现象自然而然会有一些麻烦出来,当然随之而来也带来了好处,好处就是AI突然变得非常火热,懂AI的、不懂AI的,大家都在探讨AI到底是怎么回事。总的说来,我认为这样的现象是好的,另外中国的热度显然比美国的硅谷更热,这个热所带来的好处就是带来了观众觉醒,大家开始意识到:关于AI,我是不是应该去了解一下?所以我想大家或多或少的都受到了AI浪潮的影响。

为什么这次的AI浪潮来得如此迅猛?​

这次的AlphaGo为什么能够战胜李世石?今年又战胜了柯洁,这到底是什么原因?为什么这次AI的浪潮和前面几拨浪潮不太一样?很重要的三个原因:第一个原因是在AlphaGo里面用了一系列的新算法,一个很重要的算法就是深度学习,这是基于神经网络的一种学习方法,而且在它的另外一层网络上用了所谓的强化学习,当然也用了比较好的搜索的算法。整体来说,他用的这些算法都反映了AI这个领域在过去十几年里快速的进步,从而使得它能够具有非常强的计算能力和决策能力,它本身内部的模型的复杂性远远超过我们以前想象的神经网络和一般的模型,之所以它能够有这么复杂的模型并且有如此强大的决策能力,另外一点往往是外行人容易忽略掉的。

大家都知道AI算法多么厉害,AlphaGo多么厉害,其实背后有一个很重要的原因大家常常容易忽略掉。那就是第二个原因,随着互联网的发展,尤其是过去移动互联网十年的发展,带来了高质量的大数据,我说的高质量大数据是指这些数据是被高质量标志过的。

其实AlphaGo在跟李世石下棋之前,它当时的系统就已经用了人类六到九段棋手的16000次对局中间的,超过3000万点的布局数据,这是非常好的数据。同时因为本身是个机器,左手打右手,所以它自己跟自己下了许多盘以后,自己又搜集了3000万的数据点,这样的话训练它的这些数据可能超过了人类围棋大师一辈子见到过的数据,这是我们以前不可想象的,在今天我们做到了。

另外一个非常重要的原因就是它背后高性能的计算资源,这在上一拨AI潮流的时候,这块是我们不可想象的。AlphaGo在去年跟李世石进行比赛的时候,它装备了1920万个CPU,还装备了280个GPU。为什么我说这个东西很重要呢?我们知道围棋从一段到九段,但这是我们一般外行人看的,其实大家不知道在同一段的选手里面还有一个细分的值,叫做ELO number。当AlphaGo的系统CPU和GCP开始增加的时候,他的ELO number怎么增加呢?当它的CPU的数量是48个,只用一个CPU的时候,ELO是2000多点,随着它用CPU的数量增加,当增加10倍的时候,ELO number增加到了将近3000点,差不多增加了30%。然后当它增加到最后用来比赛的装备的时候,到了1920个CPU,280个GPU的时候,ELO number到了将近3200点。

我想说的是随着CPU数量的增加,机器的能力确实是在提高的,这说明这么智能的机器,其实它的背后是靠大量的计算资源撑起来的。机器在跟柯洁下棋的时候架构做了一些改变,用新的更强的算法,这样对计算的要求稍微降低了一些。整体来说是计算能力的趋势对于整个系统能力的影响。其实在李世石跟AlphaGo下围棋之前有多少人认为李世石会输?只有两个人认为他会输。所以以这个举例来作为引子,我们应该看到机器背后的三大因素:新的算法,非常强大的计算和大数据,这也是我今天谈的主要的内容。

今天大家一直在谈AI,实际上我们看到的是在过去十年里快速发展的AI里的一个重要的分支,这个分支叫做机器学习,更确切来说是机器学习里面的一个分支,机器学习里面有统计学习和各种各样的方法,这块是机器学习里面的神经网络的一种学习方式。再确切点来说就是过去十年的发展是神经网络里面的一种新的架构,叫做深度学习网络,就是深度神经网络。简单来讲,就是神经网络的层数比较多、比较深,这是深度学习的核心所在,所以其实并没有那么高深。

在此浪潮前已经有过两拨大的AI浪潮,AI的第一拨浪潮是在50、60年代,AI的发起人第一次在美国聚会上提出了人工智能的概念,那时候的这拨热基本上还停留在概念上,包括此后的科幻片都是基于这种概念;

第二次浪潮在80年代中,AI真正开始热并且开始有些应用,那时候你做模式识别或是做计算机识别的领域,如果你不用神经网络来做,别人就认为你做的东西是没什么能力的,简单讲这次热潮就是专家系统和神经网络。

神经网络其实就是今天深度学习的基础,那么为什么五六年以后神经网络这拨热就过去了?有三个原因,第一是因为算法有局限性,不如今天的算法这么好;第二个原因是那时候我们没有大数据,也没有强计算。如果当时你是在一个实验室做神经网络的训练,你基本上可以看到这个实验室里所有的工作站都会贴个条子说不要关机,这个机器我在做训练,而且恨不得把实验室所有的机器连在一起做训练,那时候那么多的工作站也未必比我们的手机计算能力强;最后一个原因是高质量的数据也没有今天这个量,所以神经网络的浪潮很快过去了。

直到2006年,Google的首席AI科学家在自然杂志上发表了一篇文章,文章中第一次提出了深度学习的概念。当时这篇文章提出来的系统就是神经网络,深度学习的神经网络的系统,这个系统的应用就是图像识别,很快大家看到了这个算法的优势,然后这个算法就热起来了。

2012年斯坦福大学的教授做了一个运算,用300万的数据做了一个图形识别,然后用深度卷积网络获得了第一笔经费,这之前别人都不会特别在意,但这次很重要的一点就在于,他居然超过了第二名10个百分点,这种差距非常大,因为在激烈的计算中,一般第一名和第二名的差距都是在小数点后面算的,他居然超过了10个百分点,大家突然认识到卷积神经网络学习能力非常非常强,就加快了深度学习的普及。

2016年的AlphaGo,神经网络显然达到了一个里程碑,这拨的浪潮跟前面那拨浪潮从基础架构上虽然都是神经网络,但是在这次热潮里,神经网络、深度学习的算法加上与之相匹配的大数据和强计算资源,使得这次浪潮比上次的浪潮大得多也真实得多。

到底什么是神经网络呢?我们人的大脑的结构里有神经元,每个神经元存在一些触点,这跟其他的神经元的触节相连接,这是大脑的基本结构,大脑的数量是如此之多,神经元的数量是如此多,更重要的是它们之间的连接更多,这形成大脑有计算能力、有记忆能力、有推理能力。神经网络从一开始引入的时候就试图模拟这么一个神经元,它模拟的是用数学方法,因为神经元有一些触角点,可以来接收信息,然后有一个突出点来输出信息,中间是非线性函数的运算,一个神经元它有输入的几个触角,也有输出的触角,当把这些神经元一个一个排起来的时候,你就会看到形成一个网络。

我们试图模拟这个架构,但是并没有模拟到这个过程。当你模拟了这么多神经元以后,你可以想像当输入有一排信号过来的时候,输出也有一系列的信号,输出的信号是什么样,所要求的输出的信号是什么样的值,其实你可以对它做一些预设,这就是训练的过程。因为输入的是原始数据,或者数据的特殊量,当它接触到这些信号的时候,输出一定的信号,这就是一个过程,深层网络就是层数比较多。在整个训练的过程中,你训练的是这些链接的权重值,用矩阵的方式来说这是一个矩阵,从而当有一种输出的时候,经过变化会有一种输出,这是最典型的深度学习的方式。

高性能的计算资源和高质量的大数据​

计算资源跟20年前也就是跟90年代初相比有了突飞猛进的变化,一是因为计算能力的提高,也就是说同样的计算能力,它的价格是随着时间有一个迅速的降低。这就是今天为什么我们作为一个小的实验室或者小的公司也能够用得起的原因所在,相对来说比较大的计算资源,正是因为一方面这个计算能力迅速地提高,另外一方面单位计算能力的价格迅速地降低。

另外,如果仅仅有计算资源和计算能力,还未必能够获得今天如此巨大的在深度学习算法上的成功,因为除了CPU以外还有GPU。我们做神经网络,尤其是用卷积网络的时候,知道用GPU来加速是非常非常有效的一种方式,不光是计算能力本身的迅速成长,而且新的计算架构,GPU本身也使得这个技术,使我们的方法变得更加的强大。

一个典型的AI的代表,就是nvidia,因为有大量的人工智能的需求,使得它有更多的芯片拿出来,基本上这就是并行架构的处理芯片,这是一个最典型的芯片。另外一点,如果我没有太多的科研经费,买不起大规模的GPU的集群,怎么办呢?这也就是为什么大家都能做深度学习的原因。因为你买不起所以你可以租云,云在过去的十年已经成为IT服务的重要支撑。你不需要一定要自己买,你可以租几天、几周、几个月,根据你的需求你可以租几片CPU,也可以租上百片的GPU,这是云。等你训练完那些神经网络以后,你可以把这种服务再退掉,从而使你不需要持续地为这些设备来付费。所以这是在IT技术上一个很重要的变化:云计算使得我们哪怕是小公司、小团队也能够用起非常强大的资源。

在AI背后还有一个非常非常重要的力量是数据的爆炸,这个数据爆炸真正普及的时候是在2007年iPhone上市的时候,后来是Android,使得智能手机大规模地普及,形成了今天的移动互联网,在这个浪潮中非常大的一个变化就是数据量爆炸性地增长。

IDC是全球的数据公司,他认为2013年到2020年的这七年中人类的数据会增长十倍,也就是说今天我们大概一天产生的数据是22GB,2020年将会到47GB,如果你把这个数据放在标准的iPad里面,120G的硬盘,就相当于可以把iPad摞在一块,从地球到月球走九圈半。

微信两年前的数据显示,微信一天在朋友圈里面传的照片就超过了10亿张,这只是在朋友圈里传的照片。现在twitter每天是5亿条,今日头条每天处理的数据量也都超越了6.3个BP,这都是移动互联网普及的结果,而且这种数据都有时间、地点,也都知道是谁在手机上传的,所以数据标注也非常好,这些数据都可以用来训练机器学习的系统,训练神经网络,从而使神经网络具备某一类的推理能力。在这里最常见的就是精准广告的能力,因为它能对你的需求,你本人的兴趣有很好的判断,从而推送精准的广告。

我认为大数据爆发性成长,导致AI能力提高的一个很好的例子就是人脸识别这件事在中国解决了,而且中国的这种产品在世界上是领先的。我现在用的手机是小米note2,这是我在20年前梦寐以求的功能,使你每天都可以拍大量的照片,除了存储空间要钱的话,拍照片本身不要钱,消耗一点电量而已。你拍的照片越来越多,你会发现一个问题,想找一张照片就很麻烦,但在今天照片可以按时间和地点排,如果能按人的会更加方便,你会知道我大致什么时候跟什么朋友出去的照片,或者我今天跟大家做一个会议拍照片,就有我的人在里面。时间、地点加上的人的话,照片就可以多了一个搜索空间,这样找起来就会更方便,所以这是今天在小米手机上能做到一点。这是怎么做的呢?这就是核心的人脸识别的能力,这是我20年前梦寐以求,而且有专利为例。我1997年在惠普工作室工作的时候申请的专利,就是人脸识别。

我们认为机器学习已经从传统的建模,发展到今天用数据来推动,这是一个非常非常重要的转移。我们的数据越多,我们的精度越高的时候,对于学习的结果就会越好。同样当你用任何一种神经网络的算法,当你的数据增加的时候,你可以看到它的性能的改善,同样你用不同的方法也可以看到它的性能也是根据数据的增加而改善的,当然最后改善的速度会缓慢下来,意思就是说对同样的算法一定是数据多了,你的性能会得到更好的改善,当然可能到了某个点以后就饱和了。

今天从企业的角度来说,数据是推动智能引擎的能量。英特尔的CEO一年前说过自动驾驶的电动车每天产生的数据是4T,今天最贵的电脑的硬盘是1T,所以一天的数据量要四个笔记本能装上。数据处理是英特尔的核心,所以他今年年初的时候花了153亿买了自动驾驶技术的一家公司,他其实看重的是他的数据。

AI在未来一定是辅助人增长的​

AI在未来一定是辅助人增长的,所有过去人类创造的机器都是辅助人的,汽车、飞机都是辅助人的交通工具。另外,关于人工智能可以代替人类的这种说法我们心理上的确不太能接受,但是如果有扫地机器人也挺好的。最后还有种说法是人工智能在未来会超越人,当然,我们知道机器其实在很多的时候确实能够代替人、超越人,但是我们想想为什么会做到这点?AI今天为什么在很多的应用场景上超过人?先说一个应用场景就是AlphaGo。

那时候很多有关李世石跟AlphaGo比赛的报道,其中有一篇报道里有句话我印象非常深刻,那句话是这样说的“当李世石的第四局千辛万苦终于赢了AlphaGo的时候,李世石脱着疲惫的身躯回家泡热水澡,睡了好觉,那天晚上AlphaGo自己跟自己下了100万盘棋,从此人类再也没有希望赢机器了。”的确,第一在速度和精力上显然人是不如机器的,这其实很好理解;第二就是说人能不能像特斯拉一样,每天在世界上有几十万辆车在路上跑,在搜集自动驾驶习惯的数据传到云上去,同时使它能进行并行的数据搜集和处理、学习,其实人类很难做到这一点的,所以机器学习的能力也是机器比人强的地方;第三就是你能想到能在世界上如此多的人脸数据,迅速找出罪犯的总计,在规模上显然人又不如机器。将这三点放一块来讲就是机器比你速度快,比你能迅速学习,比你规模大,它能做到的事情超过人类,其实我们不应该觉得特别的吃力。

那么是不是那些人类能做但无法清晰表达的事情,AI做得不如你呢?其实下围棋,为什么有各种各样的下围棋的宇宙流,这是一种艺术、一种流派,它其实是一种没法应用数据表达清楚的,今天机器已经超过人类了,在围棋这件事上。那其他的角色呢?投资,现在至少在基金投资上、指数投资上,已经证明机器比人强,因为人可能还有一些感性的因素在里面。在政策的规划上,战争的推演上,没有理由说AI做得不比人强,因为机器现在逐渐还有自主学习的能力,人类其实说不清楚的靠反馈、靠琢磨学会的东西,开车、骑自行车,我们没有一个人是看驾驶手册就能学会开车的,这些靠学习掌握的能力,包括滑雪,今天AI都能做了,也就是说我们原来认为模糊的,都能用数学表达清楚的,计算机可能不能做,今天通过机器学习的方式计算机也能做,所以在很多场景上超过人不是不可能的事。

柯洁跟AlphaGo下棋之后他有一个感叹,他觉得他自己在跟上帝下棋,他说3000年人类围棋的艺术,突然发现在AlphaGo面前变得太容易了,AlphaGo好像有上帝的视角。什么叫上帝的视角呢?用数据表达一下,我们学数学的人都知道,如果你站得山坡的高度就那么高,你看的就是那么高。3000年人类围棋的艺术就是这个小山坡,而AlphaGo经过这么大量的训练的之后它其实站得更高看,一览众山小。人类的那些知识的积累只是机器看到的其中一部分,机器看到了人类远远没看到的地方,所以它打败你这件事是非常正常的,只要一个应用场景,你设计出的AI能够覆盖的空间比人之前覆盖的空间大,基本上机器就会打败人类。

我特别喜欢图灵的这句话,“虽然我们能够强迫机器成为我们的佣人,实在不行我们可以拔电源,但是当这个佣人具有这样的能力的时候,我们心里面还是要非常谦卑的。”当人类被AlphaGo打败的时候,其实它提醒了大家,这时候未来你会看到很多很多的事情,人类会被AI打败。这时候你可以想一想,当初上帝创造了人之后,猩猩的感觉。

那么哪些行业会被机器所取代呢?从投资的角度来说,一定是最先冲击数据多又钱多的地方,比如金融,数据多钱多。我想未来翻译这件事肯定会被AI取代,驾驶、投资,一般的会计记账也能被计算机取代,简单的新闻写作也能被机器取代,总之还有很多很多的工作,所以才有人提出未来的数据是有神人和闲人,可以设计管理这些机器,而这是一种稍微高端的说法。作为安慰,我想资本家和创业者是不会被取代的。

机器学习显然有它的问题,尤其是神经网络的机器学习有很大的问题,这个问题不是系统本身的问题,是人觉得有问题,并不是系统觉得有问题。什么意思呢?就是说计算机学出来的东西,神经网络学出来的东西都有正确的判断,但是它没法解释,因为是数据驱动的。所以今天人们终于制造出来一个机器,它能够做比你还正确的决定,但没法告诉你为什么这么做,这点让我们觉得很不舒服。比如纽约有一家医院,把70万个病例输给了一套系统,深度学习的系统,从此以后这个系统在预测某一类人会得某种病的预测上,超过了这个医院所有的大夫,尤其是在预测精神分裂症这种疾病上非常非常准确,但是它不会解释为什么,它唯一做到的是看了70万个病例,你想想人一辈子谁能看70万个病例。政府总是觉得,这个东西没法解释就是一个绊脚石,比如说军方要轰炸某一个目标的时候,飞机飞过去,要是自己就炸了,这类决定一定会有大量的错误,如果人类犯错会原谅,但是机器犯错误我们不能原谅。

我非常认同丹尼尔·丹内特《从细菌到巴赫》这本书里的一句话,他说其实人类智力进化的本质的特征就是进化到一个系统,这个系统既是它的创造者,但无法解释它的行为。其实今天人类的很多行为上帝能解释吗?今天我们的很多行为跟3000年前人类的行为相比有很大的变化,每个人在做决定的时候我们真正能解释吗?其实也未必。那么,人觉得解释不了无所谓,事后再解释,但是我们对机器的要求好像不能自我解释就会有问题。实际上我们所面临的,就是人类历史上过去从来没有创造一个工具,连它的创造者都不能理解。因为发电人类可以理解,汽车怎么开人类能理解,但是当你创造一个AI系统做了非常正确的决定,人类不知道它怎么做的,这时候会觉得有些问题,这是至少干扰人们应用AI的一个潜在的问题。

我想说其实AI并没有人们想得那么厉害,因为AI真正能解决的无论是图像还是语音识别的问题,这部分都只是在感知这件事,是在单一传感器的感知,看或者听,这是两个单一的感知,显然机器今天已经做得跟人一样了,甚至比人更好。

微软在一个月前宣布英文的语音识别系统超过了人,所以在感知这块超过了人,这是毫无疑问的。从而可以说语音或者图像,然后自动驾驶,也是感知过程,今天不行未来肯定行。但是在认知,就是在自然语言处理跟NLP这块,在广义的NLP这块AI还差很远,在自动推理、自我学习、交互,也是还需要非常非常长的路去走,所以你看到一些所谓的对话聊天基于人,我希望你要知道它不是真正的理解了你的对话,只是每说一句话它在网上搜一下,有没有类似的回应,这种对话系统是这样的,在自然语言理解意义上,在今天广义上还是做不到的,个人助理在广义上也做不到,特殊的场景可以做到,就是打电话订票。

展望未来:AI领域里的创新与创业​

AlphaGo是非常了不起的突破,因为AlphaGo本身是一种自我做决定的,这就是为什么我们觉得AlphaGo是非常了不起的事。今天大家看到很多的智能音响,一般人买回去以后很快发现音响干活,智能那部分不干活,因为这是一个对话型的,自然语言理解的。如果我们投资一家AI企业该怎么做?在过去人类经济发展的历史中有过几次革命,而且这几次革命都给人类带来了巨大的财富和翻天覆地的变化。

第一,农业革命,从一开始简单的小作坊的操作到真正学会种植,差不多2000年前,一直到18世纪,在工业革命之前这是种植收获,简单的农业时代;

第二,工业时代,从19世纪开始,蒸气机的出现,人们这时候开始了真正的制造,出现了大英帝国,欧洲、美国、日本,这是工业革命,200多年的历史,给人类带来了非常巨大的变化;

最后,信息革命,20世纪下半叶,也就是五六十年代开始到今天。AI革命是大家把计算机的能力和人的潜力合在一起,这是AI革命的核心所在。我们应该去相信AI革命与前面几次革命一样,是能够带来一些新的发展机会和一些新的投资和发财机会的。但是从投资的角度来说,我们在判断科技创新的时候,一定要把创新这件事想清楚,因为科技创新是有很多变化的,它不是一蹴而就的。比如说当一个新的技术来了以后,经常我们说的长江后浪推前浪,前浪死在沙滩上,你的技术太早也会死去,就是所谓的三大重叠,技术要经过非常长期的冰河期才能真正开始形成主流,在许多技术面前,可能某种技术突然脱颖而出,就像机器学习这块,在过去十年之中脱颖而出,成为了深度学习。

在AI这个领域到底哪些技术能够成为超级步骤?哪些能突破冰河?哪些是最好的第三浪?这是我们需要思考的。另外,我们做一家公司,基本上你要提供价值,就是说企业创造价值有几个方面,一个是技术革命,我们做技术出身的认为这是最正宗的做公司的模式,今天我们看到的大部分互联网的成功企业,其实是专业模式的创新、管理的创新,所谓的管理创新其实就是提高效率或者是生产资料的创新,在这块需要大家注意的一点是:过去的生产资料是资本、自然资源,今天中间加了一个数据,所以这是我们要记住的,当然还有一些创意、品牌之类的。

在AI革命的这些年里我们看到每一拨新的IT科技的浪潮都会孕育出平台级的公司,很多人都想我要能做一个AI的平台公司,就可以成为下一个百亿、千亿美金的公司。PC最早是提高效率,自动化,所以出现了微软、英特尔,也出现了苹果这样的公司。互联网是信息的流动,从而出现了雅虎、Google。移动是连接,Android是连接,Facebook是连接,腾讯也是连接。沿这个逻辑推理一下,我们要想清楚在AI时代,这块提供的是智能,这是毫无疑问的,那么要提供哪些价值?就会以什么样的产品形态、什么样的公司形态出现,这个我们要问清楚自己,我们创业的时候要想清楚。

另外,我们在做任何一个新的技术的时候,我们都要分层。AI整个产业链是有基础、有技术、有应用,数据本身是基础,有计算能力的是基础,BAT都有数据和计算能力。然后就是应用层,我们专门做应用的解决方案,比如说你提供一种经营资料,最新的服务,你做精准广告也是一种应用,所以我们最怕的是你把自己局限在这块,就是只有技术,这是非常担心的。我看到很多的创业公司基本上就在这儿,几个人只有技术,你想想我们知道任何一个技术无论它多么复杂,随着时间的迁移都会被颠覆,所以你不能形成一个应用场景,或者这种应用场景不能把控,或者数据不能把控,这是非常危险的。

在计算机领域我们知道在IT这块过去的几十年,成功的公司基本上就是从硬件、操作系统、杀手级应用这几个维度来看。PC时代微软有了操作系统,有了Office这样的超级应用,在互联网时代Google有了搜索,在移动时代腾讯有了微信,这些都是杀手级的应用,杀手级的应用最后就会变成平台。AI同样,你可以说AI的芯片,好像这些巨头都在里面占着了。AI的操作系统云,巨头也都有了,杀手级应用,所以要想清楚做的东西到底是这三块当中的哪块,或者是说这三块哪个最容易出现平台级的公司。这是你要想清楚的。这三块其实都在杭州。

以源码资本来说,我们投公司的时候先从应用出发。大家记住一点:AI是一种能力,是一个赋能者。你看应用这块哪个市场大,我们说零售、金融、交通,然后是规模,另外是数据基础,零售的数据多,通讯数据多,金融数据也多,传媒广告数据多,最后是收益和风险,这是我们投资的一个排列组合。显然大家创业的时候,需要想想自己在哪,你最好在一个市场很大,你自己又能够不断地获得数据,而且风险可控的一个场景下来做创业。

在人工智能这一拨的技术浪潮的公司,互联网不一样的地方就在于互联网基本上是商业模式驱动,搜索以前没有,to C这块是赢家通吃。这块做成熟以后进入互联网+。在AI这块不一样的地方是数据和技术驱动,而且它是从颠覆性的行业开始,使得这个行业变得更加有效率,很多的方法通过AI来取代,而且强调了在应用方面。最重要的一点是我们应该认识到AI实际上是AI+,只有AI加应用场景你才具有价值,这是我们要记住的。我们要重视技术发展的曲线,有些技术现在炒得特别热的时候,未必是很快就能有应用,这里有不同的标注,这种圈是三到五年,然后有些是五到十年,我们看机器学习三到五年可以应用的,认知计算可能是十年以后,这是一个参考。认知这块我们知道这个技术不是三年能突破的,这块创业的人要想清楚,这就是我前面说的三大重叠,这是非常非常难把握的,每个人对自己的技术都觉得要改变世界,但是很容易三年之后出现另外一个技术全面覆盖。

AI在一个公司里面在哪里能创造价值?基本上无论是在产品的定义,未来的规划,还是在生产过程,还是在推广,还是在最后增加用户的体验,这四块AI都非常非常关键。一家传统公司要想用好AI,想把AI真正用起来,举例来说麦肯锡有五个重要因素:第一是你要有一个很好的应用场景,这个应用场景对用户非常有价值;第二是你要有数据,要建一个非常好的全面打通的数据系统,不能够数据孤岛。第三你要有技术能力,要有工具;第四你要把整个的流程集成在一块,不能有孤岛;最后在你的文化上还是要有非常开放的态度,所以这是一个公司能把AI用好的很重要的因素。

在哪些应用场景里面AI可能会比较早成功?这是需求、时间的问题。显然走在最前面的一定是金融和高科技产业,第一本身有技术,第二本身也有钱,第三是本身也有技术,还有互联网,然后交通、自动生产线。 

做投资的人一定会问我泡沫的问题。AI的技术发展到今天,它的能力是没有什么泡沫的,但是在AI宣传上、企业的融资、募资上,一定有泡沫。今天所有的公司都恨不得说自己是AI公司,尤其泡沫最严重的图像识别的企业。中国有上千家图像识别的企业,有上百家做自动驾驶的公司,我们数数这世界上有几家做汽车的公司,所以显然这块有泡沫。我想跟大家多说几句,只有算法和技术是形成不了这个商业模式的,因为这些商业的巨头,包括Google、百度,开源的AI可以提供,你的技术门槛会降低得非常快。你说我在做芯片,你不要觉得你自己能设计出整套的算法就能做很好的芯片,因为芯片是非常复杂的生态链,你到底做生态哪块,是做低功效的芯片,还是要做某个应用里面的最好的解决办法。大家记住:做AI的公司你自己有没有数据,你能不能够不断地在生产过程中控制数据,能够比别人早占有和使用数据,这是你要想清楚的,大部分应用公司的技术壁垒会随着时间迅速地降低,所以光有技术没有用的。

为什么我认为今日头条这家公司在AI领域是一匹黑马?其实说黑马我觉得已经不对了,因为它已经是非常成功的公司了。今日头条做的根本是连接人的信息,其实互联网过去这么多年的发展就是在做同样的事情,或者说人类过去3000年的历史基本上也在做同样的事情,最早的人类信息的连接和存储,到以后的活字印刷,使信息有比较好的载体,而且利于传播,比在竹子上成本低很多。然后到2000年PC互联网时代,那就是让信息透明化,让人们很容易找到信息,这是PC互联网时代。到了移动互联网时代,你有一个设备每天都跟着你,对你的了解甚至超过你自己,这是智能手机。这时候终于可以让信息来找你了,就是说当有系统对你的信息的需求了解地如此准确,这就解决了一个问题,不是零散化,而是它来找你,这就是今日头条做的事情。

当然这个事情只能够在移动互联网做,新闻推荐这事15年前就有人做了,那个做法跟今天的做法完全不是一回事,因为那时候对于人的了解是远远达不到今天一个手机对人的了解透彻深入的。加上人工智能,其实是让一个系统具备了了解你、认识你、知道你的生活规律、知道你的消费行为,从而更好地把信息传递到你的手中。不光是以文字的方式、视频的方式、长视频、短视频,以微头条,以各种各样的方法传达你手里面,甚至告诉你,你的朋友在看什么文章。这种交互的学习只会对你了解的越来越深,也同样能够做精准的广告,这是为什么过去两年今日头条的收入如此快速的成长。

如果我们把今日头条的技术上分解一下,人有一系列的描述,描述你所处的环境,这边是所有的文章计算机自动的分析,然后匹配的最好,这底下驱动的是机器学习所有的方法。同样在手机上你注意看到,已经不光是新闻了,信息流的方式,有视频,有问答,有百科全书,有图像、有直播,再加上你的朋友圈,加上你的群。真正连接了人与信息,这样的话我们再看一些数据,今日头条有超过7亿用户在全球,日活跃用户超过1亿,月活跃用户超过2亿,平均日使用时长76分钟,一个人一天有几个76分钟?另外比它时间还长的,90分钟的就是微信,90分钟加76分钟,可能你回家跟家人都没有更多的时间所在了,这就是它的魅力所在,也是它能形成正循环的原因,这些数据使它学习的更好,制造了需求。这就是AI一个最好的应用,也同样把广告打的非常精准,使你不烦它的广告,不是说它今天做到了,就是从趋势上要做这个事情。

我最后总结就是,我们做AI,我们做公司,或者投资公司,我们基本上要记住三点。第一,AI非常重要,我们要相信AI技术已经在成为公司竞争的最核心的差异化能力。这是第一点,定义你这家公司能不能比别人更具有竞争优势的重要一点。

第二,产业基本上是三种方式,第一种方式就是人工智能即服务,这是巨头的核心,百度把它的自动驾驶能力开放出来,Google把自动学习的能力开放出来,百度把语言的能力开放出来,你把你的AI能力作为一种服务开放给大家,这是云服务的概念。第二种就是自主开发,我公司有人、有数据,我有懂AI的人自主开发,从而形成我自己的应用,等我的能力扩大以后,像今日头条一样,也许可以把它作为一种AI的能力输出,也许我永远给自己用。第三种我们今天看到大量的公司实际上是服务,因为它只有技术但是其他的没有,没有应用场景。这种公司就像所有的咨询公司市值做不大,随着技术壁垒的降低,你的竞争力在这块是站不住的。

最后,做AI的公司还要记住两点,那就是数据和人才。我们说算法很重要,技术很重要,但技术和算法最终是人,数据非常非常重要,数据是最终的护城河。

AI领域是中国创业创新非常好的机会,高盛的报告也专门提到中国,中国在AI这块非常有竞争力。他给了两张图,一张图是世界上的学术杂志里面提到深度学习和深度神经网络的,这些文章的作者,按国家来分,中国在2014年的人数超过美国了。然后引用的文章同样中国超过美国,所以这是非常令人鼓舞的。另外一张是我在那张网页上拍的照片,大概2015年年底或者是216年年初的数据,每一分钟在中国的互联网上发生的事情,什么意思?中国有数据,咱们有人、有数据,显然AI能在中国创造机会。

文丨创客猫 蒙娜

本文为转载内容,授权事宜请联系原著作权人。