不久前DeepMind的人工智能系统AlphaGo大败韩国国手李世乭,使人们对这种技术的潜力浮想联翩,其热度也空前高涨。
但在谷歌子公司DeepMind,AlphaGo绝不是唯一的项目——连主要项目都算不上。其联合创始人德米斯·哈萨比斯(Demis Hassabis)近日表示,DeepMind要“揭开智能的秘密”,至于要如何做到,他的想法可不是一点两点。(人工智能的“超级英雄”:李世石真正的对手其实是他)
时至今日,哈萨比斯自己也走过了一段颇不寻常的人生历程,但回想起来,一切却都合情合理。作为当年的国际象棋神童,他曾五次夺得脑力奥运会(Mind Sports Olympiad)“全能脑力王”冠军,年纪轻轻便已声名远播。工作之后,他先是效力于Bullfrog和Lionhead等游戏开发商,做过《主题公园》(Theme Park)和《黑与白》(Black &White)等偏重AI的游戏,后来自立门户成立Elixir工作室。
2005年前后,哈萨比斯离开游戏业,去攻读神经科学博士学位,后于2010年与人联合创办DeepMind。
就在AlphaGo战胜李世乭后不久,哈萨比斯接受了这次采访,如果此时他心思不在媒体上,那也是完全可以理解的。
除了AlphaGo,我们的谈话还触及到计算机游戏、下一代智能手机助手、DeepMind在谷歌所扮演的角色、机器人、AI如何辅助科研等等话题。
“围棋一直是人工智能研究中的一个圣杯。”
对于不是很了解AI或围棋的人,你怎么描述人工智能这场胜利引起的文化震动?
哈萨比斯:我要说的有几点。围棋一直是完全信息博弈的最高峰。就其可能性而言,它比国际象棋复杂得多,所以,它一直是人工智能研究中的一个圣杯,或者说是巨大挑战,尤其是在“深蓝”(Deep Blue)攻克国际象棋以后。你也知道,虽然在围棋AI方面的投入很多,但进展一直并不明显。
蒙特卡洛树搜索是十年前一个不小的创新,但我想AlphaGo所做的,无非就是在神经网络中引入了“直觉”——如果可以管它叫直觉的话。而顶尖围棋手区别于一般棋手的地方,就是这种直觉。
让我没想到的是,就连迈克·雷蒙(Michael Redmond)在现场解说的时候都有点不太利索,他还是个专业九段棋手!从这里可以看出来,为围棋写价值函数有多么难。
AlphaGo有没有哪几着棋出乎你的意料之外?
哈萨比斯:有。在双方第一局对战时,AlphaGo在李世乭的左侧地盘大胆突进,我们都大吃一惊,我想李世乭也没有料到,从他的面部表情可以看出来。那应该是相当出人意料的一着。
因为这种攻击性?
哈萨比斯:对,攻击性,还有胆量。而且,这本来是李世乭所擅长的。他以喜好剑走偏锋而闻名,这次比赛也不例外,我们之前就有这方面的预期。李世乭开局四处挑起战况,在那个时候,胜负还很难预料。围棋程序历来不善于应对这种局面。它们的局部计算能力不错,但全局判断就比较薄弱了。
举办这些比赛,输也好,赢也好,都是为了评估AlphaGo的能力。从这次的比赛中,你有哪些认识?
哈萨比斯:我们了解到,这个结果虽不能说超出了自己的期待,但至少跟希望的差不多吧。之前我们本来是跟人说,胜负该是两两之数。
接着你的第一个问题,谈到AI的重要性,我提到过的另一点就是它和深蓝的区别。深蓝是一个手动打造的程序,程序员将来自象棋大师的信息精炼成具体规则和启发式算法,而我们的做法是给AlphaGo灌输学习能力,让它在实践中去学习,这样做更类似于人类。
下一步是什么?未来还会不会举行别的AI大决战?
哈萨比斯:“最终,我们想把AI应用到现实世界的问题中去。”
我想就完全信息博弈而言,围棋就是最高峰。当然还有其他的顶尖棋手可以对弈。还有其他的游戏——比如无限额扑克就很难,多人游戏有它的难度,因为它是一种不完全信息博弈。还有很多游戏是人类明显玩得比计算机好的,比如在韩国比较热门的《星际争霸》。
策略性游戏需要你在信息不完全——也叫做“部分可观测”——的情况下,施展高水平的策略能力。围棋的特点就是,棋盘上有什么一清二楚,所以对计算机来说会略微容易一些。
从你个人角度来说,有没有兴趣搞一场《星际争霸》人机大战?
哈萨比斯:也许吧。我们对一个东西感兴趣,前提是它跟我们的研究项目在同一条道上。所以打赢游戏虽然趣味十足,但不是DeepMind的目的所在。我个人非常热爱游戏,以前也开发过游戏。
但前提是它们能充当有用的测试平台,可以在上面编写算法思路,测试其可扩展性和实际性能,这样做很有效率。最终,我们想把AI应用到现实世界的问题中去。
90年代的时候,计算机杂志上常出现你的名字,跟各种野心勃勃的游戏联系在一起。后来渐渐看到你的名字和DeepMind一起出现,我心想,“还挺配你的。”你能不能画一条线,把之前在游戏业的职业生涯跟现在的工作联系起来?
哈萨比斯:可以,我的终极目标一直是像DeepMind这样一个东西。从某种意义上说,这个计划我酝酿了二十多年了。如果你站在最终建立AI企业的角度,再看我之前的经历,你会发现我的选择都不是那么随机的。如果你熟悉我在Bullfrog这些地方所做的事情,你就会知道,AI是我一切工作的核心组成部分。
彼得·莫利纽(Peter Molyneux,Lionhead创始人)的游戏恰好也都是AI游戏。开发《主题公园》对当时十六七岁的我来说,是一件在内心深处种下种子的事情,我意识到如果我们真的尝试去拓展AI,它可以变得何等强大。那款游戏卖出几百万份,很多人都喜欢玩,因为有AI,游戏会根据你的玩法不断进化。我们把它当作正事来做,我也想把它延伸开来,作为日后游戏生涯的努力方向。
后来我从游戏业抽身,回到学术界,去搞神经科学,是因为到了2005年前后,我感觉到很难再进一步——我们打着开发游戏的旗号,实则是在偷偷做AI研究,结果搞得很艰难,毕竟发行商要的只是游戏。
是不是因为在那个年代,游戏就是AI最显而易见的应用方向?
哈萨比斯:我想是的。我们那时候做的AI其实是非常尖端的。90年代的时候,关于AI的学术研究被束之高阁,神经网络、深度学习、强化学习,这一大批新技术都还没有真正地普及或规模化。所以,最好的AI都进了游戏。它们不是现在这种学习型的人工智能,更接近于有限状态机(finite-state machine),但也相当复杂,而且会进化。
像《黑与白》这样的游戏都涉及到了强化学习——我觉得它仍然是AI应用于游戏的一个最复杂的案例。到了2004、2005年前后,游戏业很明显开始叛离90年代的氛围——那种活跃和创造力,想到什么就可以去做出来的氛围——变得越来越讲究图形效果、系列作品和FIFA比赛之类,已经没原来那么有趣了。
在游戏界,我能做的都已经做了,是时候开始收集不同的信息,为发布DeepMind做准备了。那就要靠神经科学;我想看看人脑是怎么解决问题的,并从中得到点启发。要达到这个目的,还有什么比读一个神经科学博士更好的办法呢?
如果能运用今天的学习型AI,电子游戏将会上升到一个全新的层次。
可能对你来说太没有挑战性了,但能不能把AI的进展应用到现在的游戏中去呢?
哈萨比斯:嗯,要是这样就太好了。最近EA有人联系到我……[若有所思状]这个事确实应该做,就是要做的事情太多了![笑]这些技术都挺广义的,比较好应用,我也很乐意去做。
只不过要有时间和精力,目前我们专注的是医疗保健和推荐系统这些方面。将来或许可以,这样我的游戏生涯就圆满了。如果你的对手是能够不断进化的,这样的游戏会有很大的市场。而且游戏开发者应该会很高兴,不必每做一款游戏,都建立一个新的AI,或许他们只要训练一个AI来帮他们开发游戏就好了。
我一直想,你在家玩游戏的时候,肯定被那些非玩家角色郁闷得够呛。
哈萨比斯:没错[笑]是的,在大型多人在线游戏里面,那一直让我极度郁闷。我从来没有真正进入过角色,因为那些非玩家角色实在是太蠢了。他们没有任何记忆,不会改变,没有任何来历。“如果能运用今天的学习型AI,电子游戏将会上升到一个全新的层次。
关于未来AI的主要用途,你在提到过医疗保健、智能手机助手和机器人。我们来一一展开一下。谈到医疗保健,IBM的“沃森”已经在癌症诊断等方面做了一些工作——DeepMind能贡献些什么?
哈萨比斯:我们在这方面还刚刚起步。之前我们宣布了和英国国民保健署(NHS)的合作,但这还只是构建一个平台,为机器学习的应用创造条件。照我的理解,沃森和我们所做的工作很不一样,它更像一个专家系统,所以是一种风格迥异的AI。
这类AI一般会从事于医疗影像诊断、生命体征的纵向追踪或一段时间内的生活量化(Quantified Self),帮助人们拥有更加健康的生活方式。这些对强化学习来说,还是挺适合的。
和NHS的合作中,你们推出了一款应用,但跟AI或机器学习的关系好像不是很大。你们是怎么想的?NHS为什么要用它,而不用其他人的软件?
哈萨比斯:据我所知,NHS的软件还挺烂的,所以第一步就是让它实现现代化。这些软件还没有进行移动化改造;当今消费者习以为常的东西,他们都没有。医生护士们应该都非常郁闷,因为这东西在拖他们的后腿。
所以第一个阶段就是给他们提供更多有用的工具,比如可视化和基本统计信息。我们就先构建出来,看具体怎么样,然后,更先进的机器学习技术才能介入进来,并发挥作用。
“我们当然希望这些智能手机助手能够名副其实地智能一些。”
谈谈是智能手机助理。我看你在演讲里用过一张来自《她》(Her)的图片——难道这就是人类的终局?
哈萨比斯:没有,《她》只代表了一种比较浅显的主流观点。我只是觉得,我们当然希望这些智能手机助手能够名副其实地智能一些,具备语境理解能力,更能理解你想做些什么。
目前的系统大都非常脆弱——一旦你偏离预编程的模板,它们就一无是处。所以关键是要让它们真正具备进化能力、灵活性,更经得住考验。
实现这些改进需要哪方面的突破?为什么不能明天就开始改进?
哈萨比斯:不是不可以,只是你需要一种不同的解决方式。还是涉及到预编程和学习的对立统一。目前,几乎所有的智能手机助手都是预编程的,特殊问题特殊解决,这意味着它们都比较脆弱,只能完成预编程的任务。
而现实世界纷繁复杂,用户会做各种不可预知的事情,你不可能提前知晓。在DeepMind,我们相信,实现智能的唯一方式就是从零开始循序渐进地学习。当然,这也是我们创立之初就秉承的宗旨。
AlphaGo得以大成,有赖于一开始灌输给它的很多棋路。但智能手机上的各种输入要比这复杂多了,这又怎么运用起来呢?
哈萨比斯:是啊,这方面有大量的数据供你学习。其实这是未来几个月我们要尝试的东西,对于AlphaGo的算法,我们可以去掉最初的监督式学习,让它去自我对弈,做到真正意义上从零开始。训练时间会变得更长,因为随机试错要花费很长时间,也许要几个月。但我们认为,从零开始的纯粹学习是可以做到的。
可以做到,是不是因为现在的算法已经达到很高程度?
哈萨比斯:不是,我们之前就能做到了。它不会让程序更加强大,只不过是一个纯粹的学习过程,也就是没有加入监督的成分。这些算法可以在没有任何监督的情况工作。去年做的雅达利(Atari)游戏项目就没有任何人类知识的引导,从像素着手,真的就是从屏幕上的随机操作开始的。
游戏要相对容易一点,是不是因为它们更好区分胜负?
哈萨比斯:是因为得分更有规律性。在围棋里面,不论你最后是输是赢,你都只有一个分数。这叫做信度分配问题;问题在于,一盘棋你走出100多步,到最后,你并不能切确地知道哪一步决定了你的输赢,所以说“信号”很弱。而在大部分的雅达利游戏里,你大多数的动作都会得到一个分数,从而有更多的蛛丝马迹可以追踪。
这些进展什么时候能让手机系统智能水平出现质的飞跃,你能否给出一个时间表?
哈萨比斯:我想未来两三年就会逐渐出现。一开始会比较微妙,某些方面只会逐步地改善。也许四五年、五六年以后,性能上就会出现显著的飞跃。
在你指出的未来可能性当中,这个跟谷歌整体的联系最为明显。
哈萨比斯:是的。
谷歌有没有给你任何指示说,这一切要怎么契合它的产品路线图或者是商业模式?
哈萨比斯:没有,我们可以相当自由地优化研究进展。这是我们的使命,也是我们加入谷歌的初衷——也就是更快地实现这个使命。过去的几年,我们也都如愿以偿。
当然,我们参与了很多谷歌内部产品的相关工作,但它们都处在非常早期的阶段,所以还不能拿出来探讨。当然,我觉得智能手机助手是非常核心的——桑德尔·皮凯(Sundar Pichai,现任谷歌CEO)就多次提到说,它对谷歌的未来至关重要。
谷歌的支持对AlphaGo“非常重要”
谷歌还有其他的项目,比如Google Brain,还推出了涉及到机器学习的功能,比如Google Photos、搜索,以及一大堆面向用户的东西。
哈萨比斯:对,很多。
你们会不会和Google Brain有交集,有没有相互重叠的部分?
哈萨比斯:当然有,两边其实非常互补。我们每周都要交流。Google Brain主要专注于深度学习,有像杰夫·迪恩(Jeff Dean)这样出色的工程师,让深度学习渗透到公司每一个角落,所以我们才有了像Google Photos搜索这样好用的东西。他们的工作非常出色。
另外,他们在山景城,更靠近产品部门,研究周期常常在12到18个月左右,而我们更多的是做算法开发,一个项目能持续两三年,不一定一开始就有直接的产品。
谷歌对AlphaGo的支持有多重要?没有谷歌你们能不能做?
哈萨比斯:非常重要。AlphaGo在比赛的时候,其实用不到太多的硬件;但我们要训练它,做很多不同的版本,让它们在云端里对撕,这其中要用到很多硬件。要高效地完成这些过程,也需要很多的硬件。所以没有那些资源,我们不可能在这么短的时间内走到今天这一步。
再讲到机器人。日本作为对机器人情有独钟的国家,其企业开发的机器人主要分成两种。一种就是像发那科(Fanuc)公司的那些工业机器人,在某个具体用途上做得非常好。另一种是礼宾机器人,像软银的Pepper等等,都挺有野心的,但用例有限。对于这个领域的现状,你怎么看?
哈萨比斯:正如你所说,发那科的机器人确实四肢发达,但缺少智能。礼宾机器人就有点像是智能手机助手——反正我见过的那些都是这样,预先设定了应答模板,一旦你脱离预定轨道,它们就傻眼了。
那自然就要问到,机器学习之类的技术将如何提升机器人的能力?
哈萨比斯:就是提供一种完全不同的方法。从零开始构建学习新事物和应对突发事件的能力。我想,任何要在现实世界中和真人用户打交道的机器人或软件,都需要这样的能力,这样它们才能真正派上用场。我觉得到头来,学习必定是最佳途径。
你觉得学习型机器人的用例当中,最快实现的会是哪些?
哈萨比斯:其实,这方面我们没有特别关注。自动驾驶汽车也算机器人,但大部分是狭隘的AI,尽管用到了学习型AI的一些方面来实现计算机视觉。特斯拉所采用的,就是标准的现成技术,一种基于深度学习的计算机视觉技术。我想,老年人护理机器人,或者家政机器人,肯定都是日本很感兴趣的,它们对社会非常有用。特别是在老龄化社会——这是一个相当紧迫的问题。
“如果有一天,AI参与了某种新粒子的发现过程,那应该还挺酷的。”
为什么基于学习的方法在这一类用例里面要优越得多呢?
哈萨比斯:你只要想想:“为什么现在还没有这些东西?”为什么还没有一个机器人可以跟在你屁股后面,帮你收拾?原因是,每个人的房子在布局、家具等等各个方面都很不一样,即便是在同一个屋子,每一天它状态也都不一样,有时候脏乱,有时候整洁。
这就无法通过给机器人进行预编程来设定出收拾屋子方案。而且,你可能还要考虑到自己折衣服时的个人偏好。这个问题其实非常复杂。我们可能觉得这些事很容易做,但实际上,它们都涉及到非常复杂的过程。
问一个私人问题,你有没有扫地机器人?
哈萨比斯:嗯……我们确实有一个,但它不是很好用,所以……[笑]
因为我就有一个,它并不是非常好用,但我会去了解它的脾气,然后尽量忍让,因为我很懒,虽然不完美但我也忍了。所以我就想,当机器人变得更加先进以后,我们会在停止在哪个点上。会不会还没实现真正人类水平的人机交互,我们就止步了,觉得说剩下的忍一忍就好?
哈萨比斯:可能吧。如果一个机器人价格实惠,又能帮你整理碗盘,打扫屋子,那大家为什么不买呢。这些扫地机器人是蠢,而且不具备任何真正意义上的智能,但还是很受欢迎。所以确实,我觉得渐渐的,会有一些有用的东西出来。
那对于未来人类、机器人、AI这三者之间的互动,你有哪些长远的期待?大家想象得都比较科幻,往往都脑洞大开。
哈萨比斯:我个人并不是很关注机器人。对于AI,我很想做的一件事就是用它加速科学进步。我很希望看到由AI辅助的科学研究:提供一个AI研究助理,帮你揽下很多枯燥的工作,挖掘有趣的文章,在海量数据中发现结构,然后把它呈现给人类专家和科学家,帮他们更快地实现突破。
几个月前,我在欧洲核子研究中心作了一场演讲;他们产生的数据似乎比地球上任何人都要多,而且说不定哪个地方的庞大硬盘上,就存着证明某种新粒子的数据,但就是没有人有空去分析,因为数据实在是太多了。
所以我想,如果有一天,AI参与了某种新粒子的发现过程,那应该还挺酷的。
翻译 / 雁行
评论