阿尔法狗之父哈萨比斯访谈：人工智能未来将如何碾压一切|界面新闻

不久前DeepMind的人工智能系统AlphaGo大败韩国国手李世乭，使人们对这种技术的潜力浮想联翩，其热度也空前高涨。

但在谷歌子公司DeepMind，AlphaGo绝不是唯一的项目——连主要项目都算不上。其联合创始人德米斯·哈萨比斯（Demis Hassabis）近日表示，DeepMind要“揭开智能的秘密”，至于要如何做到，他的想法可不是一点两点。（人工智能的“超级英雄”：李世石真正的对手其实是他）

时至今日，哈萨比斯自己也走过了一段颇不寻常的人生历程，但回想起来，一切却都合情合理。作为当年的国际象棋神童，他曾五次夺得脑力奥运会（Mind Sports Olympiad）“全能脑力王”冠军，年纪轻轻便已声名远播。工作之后，他先是效力于Bullfrog和Lionhead等游戏开发商，做过《主题公园》（Theme Park）和《黑与白》（Black &White）等偏重AI的游戏，后来自立门户成立Elixir工作室。

2005年前后，哈萨比斯离开游戏业，去攻读神经科学博士学位，后于2010年与人联合创办DeepMind。

就在AlphaGo战胜李世乭后不久，哈萨比斯接受了这次采访，如果此时他心思不在媒体上，那也是完全可以理解的。

除了AlphaGo，我们的谈话还触及到计算机游戏、下一代智能手机助手、DeepMind在谷歌所扮演的角色、机器人、AI如何辅助科研等等话题。

“围棋一直是人工智能研究中的一个圣杯。”

对于不是很了解AI或围棋的人，你怎么描述人工智能这场胜利引起的文化震动？

哈萨比斯：我要说的有几点。围棋一直是完全信息博弈的最高峰。就其可能性而言，它比国际象棋复杂得多，所以，它一直是人工智能研究中的一个圣杯，或者说是巨大挑战，尤其是在“深蓝”（Deep Blue）攻克国际象棋以后。你也知道，虽然在围棋AI方面的投入很多，但进展一直并不明显。

蒙特卡洛树搜索是十年前一个不小的创新，但我想AlphaGo所做的，无非就是在神经网络中引入了“直觉”——如果可以管它叫直觉的话。而顶尖围棋手区别于一般棋手的地方，就是这种直觉。

让我没想到的是，就连迈克·雷蒙（Michael Redmond）在现场解说的时候都有点不太利索，他还是个专业九段棋手！从这里可以看出来，为围棋写价值函数有多么难。

AlphaGo有没有哪几着棋出乎你的意料之外？

哈萨比斯：有。在双方第一局对战时，AlphaGo在李世乭的左侧地盘大胆突进，我们都大吃一惊，我想李世乭也没有料到，从他的面部表情可以看出来。那应该是相当出人意料的一着。

因为这种攻击性？

哈萨比斯：对，攻击性，还有胆量。而且，这本来是李世乭所擅长的。他以喜好剑走偏锋而闻名，这次比赛也不例外，我们之前就有这方面的预期。李世乭开局四处挑起战况，在那个时候，胜负还很难预料。围棋程序历来不善于应对这种局面。它们的局部计算能力不错，但全局判断就比较薄弱了。

举办这些比赛，输也好，赢也好，都是为了评估AlphaGo的能力。从这次的比赛中，你有哪些认识？

哈萨比斯：我们了解到，这个结果虽不能说超出了自己的期待，但至少跟希望的差不多吧。之前我们本来是跟人说，胜负该是两两之数。

接着你的第一个问题，谈到AI的重要性，我提到过的另一点就是它和深蓝的区别。深蓝是一个手动打造的程序，程序员将来自象棋大师的信息精炼成具体规则和启发式算法，而我们的做法是给AlphaGo灌输学习能力，让它在实践中去学习，这样做更类似于人类。

下一步是什么？未来还会不会举行别的AI大决战？

哈萨比斯：“最终，我们想把AI应用到现实世界的问题中去。”

我想就完全信息博弈而言，围棋就是最高峰。当然还有其他的顶尖棋手可以对弈。还有其他的游戏——比如无限额扑克就很难，多人游戏有它的难度，因为它是一种不完全信息博弈。还有很多游戏是人类明显玩得比计算机好的，比如在韩国比较热门的《星际争霸》。

策略性游戏需要你在信息不完全——也叫做“部分可观测”——的情况下，施展高水平的策略能力。围棋的特点就是，棋盘上有什么一清二楚，所以对计算机来说会略微容易一些。

从你个人角度来说，有没有兴趣搞一场《星际争霸》人机大战？

哈萨比斯：也许吧。我们对一个东西感兴趣，前提是它跟我们的研究项目在同一条道上。所以打赢游戏虽然趣味十足，但不是DeepMind的目的所在。我个人非常热爱游戏，以前也开发过游戏。

但前提是它们能充当有用的测试平台，可以在上面编写算法思路，测试其可扩展性和实际性能，这样做很有效率。最终，我们想把AI应用到现实世界的问题中去。

90年代的时候，计算机杂志上常出现你的名字，跟各种野心勃勃的游戏联系在一起。后来渐渐看到你的名字和DeepMind一起出现，我心想，“还挺配你的。”你能不能画一条线，把之前在游戏业的职业生涯跟现在的工作联系起来？

哈萨比斯：可以，我的终极目标一直是像DeepMind这样一个东西。从某种意义上说，这个计划我酝酿了二十多年了。如果你站在最终建立AI企业的角度，再看我之前的经历，你会发现我的选择都不是那么随机的。如果你熟悉我在Bullfrog这些地方所做的事情，你就会知道，AI是我一切工作的核心组成部分。

彼得·莫利纽（Peter Molyneux，Lionhead创始人）的游戏恰好也都是AI游戏。开发《主题公园》对当时十六七岁的我来说，是一件在内心深处种下种子的事情，我意识到如果我们真的尝试去拓展AI，它可以变得何等强大。那款游戏卖出几百万份，很多人都喜欢玩，因为有AI，游戏会根据你的玩法不断进化。我们把它当作正事来做，我也想把它延伸开来，作为日后游戏生涯的努力方向。

后来我从游戏业抽身，回到学术界，去搞神经科学，是因为到了2005年前后，我感觉到很难再进一步——我们打着开发游戏的旗号，实则是在偷偷做AI研究，结果搞得很艰难，毕竟发行商要的只是游戏。

是不是因为在那个年代，游戏就是AI最显而易见的应用方向？

哈萨比斯：我想是的。我们那时候做的AI其实是非常尖端的。90年代的时候，关于AI的学术研究被束之高阁，神经网络、深度学习、强化学习，这一大批新技术都还没有真正地普及或规模化。所以，最好的AI都进了游戏。它们不是现在这种学习型的人工智能，更接近于有限状态机（finite-state machine），但也相当复杂，而且会进化。

像《黑与白》这样的游戏都涉及到了强化学习——我觉得它仍然是AI应用于游戏的一个最复杂的案例。到了2004、2005年前后，游戏业很明显开始叛离90年代的氛围——那种活跃和创造力，想到什么就可以去做出来的氛围——变得越来越讲究图形效果、系列作品和FIFA比赛之类，已经没原来那么有趣了。

在游戏界，我能做的都已经做了，是时候开始收集不同的信息，为发布DeepMind做准备了。那就要靠神经科学；我想看看人脑是怎么解决问题的，并从中得到点启发。要达到这个目的，还有什么比读一个神经科学博士更好的办法呢？

如果能运用今天的学习型AI，电子游戏将会上升到一个全新的层次。

可能对你来说太没有挑战性了，但能不能把AI的进展应用到现在的游戏中去呢？

哈萨比斯：嗯，要是这样就太好了。最近EA有人联系到我……[若有所思状]这个事确实应该做，就是要做的事情太多了！[笑]这些技术都挺广义的，比较好应用，我也很乐意去做。

只不过要有时间和精力，目前我们专注的是医疗保健和推荐系统这些方面。将来或许可以，这样我的游戏生涯就圆满了。如果你的对手是能够不断进化的，这样的游戏会有很大的市场。而且游戏开发者应该会很高兴，不必每做一款游戏，都建立一个新的AI，或许他们只要训练一个AI来帮他们开发游戏就好了。

我一直想，你在家玩游戏的时候，肯定被那些非玩家角色郁闷得够呛。

哈萨比斯：没错[笑]是的，在大型多人在线游戏里面，那一直让我极度郁闷。我从来没有真正进入过角色，因为那些非玩家角色实在是太蠢了。他们没有任何记忆，不会改变，没有任何来历。“如果能运用今天的学习型AI，电子游戏将会上升到一个全新的层次。

关于未来AI的主要用途，你在提到过医疗保健、智能手机助手和机器人。我们来一一展开一下。谈到医疗保健，IBM的“沃森”已经在癌症诊断等方面做了一些工作——DeepMind能贡献些什么？

哈萨比斯：我们在这方面还刚刚起步。之前我们宣布了和英国国民保健署（NHS）的合作，但这还只是构建一个平台，为机器学习的应用创造条件。照我的理解，沃森和我们所做的工作很不一样，它更像一个专家系统，所以是一种风格迥异的AI。

这类AI一般会从事于医疗影像诊断、生命体征的纵向追踪或一段时间内的生活量化（Quantified Self），帮助人们拥有更加健康的生活方式。这些对强化学习来说，还是挺适合的。

和NHS的合作中，你们推出了一款应用，但跟AI或机器学习的关系好像不是很大。你们是怎么想的？NHS为什么要用它，而不用其他人的软件？

哈萨比斯：据我所知，NHS的软件还挺烂的，所以第一步就是让它实现现代化。这些软件还没有进行移动化改造；当今消费者习以为常的东西，他们都没有。医生护士们应该都非常郁闷，因为这东西在拖他们的后腿。

所以第一个阶段就是给他们提供更多有用的工具，比如可视化和基本统计信息。我们就先构建出来，看具体怎么样，然后，更先进的机器学习技术才能介入进来，并发挥作用。

“我们当然希望这些智能手机助手能够名副其实地智能一些。”

谈谈是智能手机助理。我看你在演讲里用过一张来自《她》（Her）的图片——难道这就是人类的终局？

哈萨比斯：没有，《她》只代表了一种比较浅显的主流观点。我只是觉得，我们当然希望这些智能手机助手能够名副其实地智能一些，具备语境理解能力，更能理解你想做些什么。

目前的系统大都非常脆弱——一旦你偏离预编程的模板，它们就一无是处。所以关键是要让它们真正具备进化能力、灵活性，更经得住考验。

实现这些改进需要哪方面的突破？为什么不能明天就开始改进？

哈萨比斯：不是不可以，只是你需要一种不同的解决方式。还是涉及到预编程和学习的对立统一。目前，几乎所有的智能手机助手都是预编程的，特殊问题特殊解决，这意味着它们都比较脆弱，只能完成预编程的任务。

而现实世界纷繁复杂，用户会做各种不可预知的事情，你不可能提前知晓。在DeepMind，我们相信，实现智能的唯一方式就是从零开始循序渐进地学习。当然，这也是我们创立之初就秉承的宗旨。

AlphaGo得以大成，有赖于一开始灌输给它的很多棋路。但智能手机上的各种输入要比这复杂多了，这又怎么运用起来呢？

哈萨比斯：是啊，这方面有大量的数据供你学习。其实这是未来几个月我们要尝试的东西，对于AlphaGo的算法，我们可以去掉最初的监督式学习，让它去自我对弈，做到真正意义上从零开始。训练时间会变得更长，因为随机试错要花费很长时间，也许要几个月。但我们认为，从零开始的纯粹学习是可以做到的。

可以做到，是不是因为现在的算法已经达到很高程度？

哈萨比斯：不是，我们之前就能做到了。它不会让程序更加强大，只不过是一个纯粹的学习过程，也就是没有加入监督的成分。这些算法可以在没有任何监督的情况工作。去年做的雅达利（Atari）游戏项目就没有任何人类知识的引导，从像素着手，真的就是从屏幕上的随机操作开始的。

游戏要相对容易一点，是不是因为它们更好区分胜负？

哈萨比斯：是因为得分更有规律性。在围棋里面，不论你最后是输是赢，你都只有一个分数。这叫做信度分配问题；问题在于，一盘棋你走出100多步，到最后，你并不能切确地知道哪一步决定了你的输赢，所以说“信号”很弱。而在大部分的雅达利游戏里，你大多数的动作都会得到一个分数，从而有更多的蛛丝马迹可以追踪。

这些进展什么时候能让手机系统智能水平出现质的飞跃，你能否给出一个时间表？

哈萨比斯：我想未来两三年就会逐渐出现。一开始会比较微妙，某些方面只会逐步地改善。也许四五年、五六年以后，性能上就会出现显著的飞跃。

在你指出的未来可能性当中，这个跟谷歌整体的联系最为明显。

哈萨比斯：是的。

谷歌有没有给你任何指示说，这一切要怎么契合它的产品路线图或者是商业模式？

哈萨比斯：没有，我们可以相当自由地优化研究进展。这是我们的使命，也是我们加入谷歌的初衷——也就是更快地实现这个使命。过去的几年，我们也都如愿以偿。

当然，我们参与了很多谷歌内部产品的相关工作，但它们都处在非常早期的阶段，所以还不能拿出来探讨。当然，我觉得智能手机助手是非常核心的——桑德尔·皮凯（Sundar Pichai，现任谷歌CEO）就多次提到说，它对谷歌的未来至关重要。

谷歌的支持对AlphaGo“非常重要”

谷歌还有其他的项目，比如Google Brain，还推出了涉及到机器学习的功能，比如Google Photos、搜索，以及一大堆面向用户的东西。

哈萨比斯：对，很多。

你们会不会和Google Brain有交集，有没有相互重叠的部分？

哈萨比斯：当然有，两边其实非常互补。我们每周都要交流。Google Brain主要专注于深度学习，有像杰夫·迪恩（Jeff Dean）这样出色的工程师，让深度学习渗透到公司每一个角落，所以我们才有了像Google Photos搜索这样好用的东西。他们的工作非常出色。

另外，他们在山景城，更靠近产品部门，研究周期常常在12到18个月左右，而我们更多的是做算法开发，一个项目能持续两三年，不一定一开始就有直接的产品。

谷歌对AlphaGo的支持有多重要？没有谷歌你们能不能做？

哈萨比斯：非常重要。AlphaGo在比赛的时候，其实用不到太多的硬件；但我们要训练它，做很多不同的版本，让它们在云端里对撕，这其中要用到很多硬件。要高效地完成这些过程，也需要很多的硬件。所以没有那些资源，我们不可能在这么短的时间内走到今天这一步。

再讲到机器人。日本作为对机器人情有独钟的国家，其企业开发的机器人主要分成两种。一种就是像发那科（Fanuc）公司的那些工业机器人，在某个具体用途上做得非常好。另一种是礼宾机器人，像软银的Pepper等等，都挺有野心的，但用例有限。对于这个领域的现状，你怎么看？

哈萨比斯：正如你所说，发那科的机器人确实四肢发达，但缺少智能。礼宾机器人就有点像是智能手机助手——反正我见过的那些都是这样，预先设定了应答模板，一旦你脱离预定轨道，它们就傻眼了。

那自然就要问到，机器学习之类的技术将如何提升机器人的能力？

哈萨比斯：就是提供一种完全不同的方法。从零开始构建学习新事物和应对突发事件的能力。我想，任何要在现实世界中和真人用户打交道的机器人或软件，都需要这样的能力，这样它们才能真正派上用场。我觉得到头来，学习必定是最佳途径。

你觉得学习型机器人的用例当中，最快实现的会是哪些？

哈萨比斯：其实，这方面我们没有特别关注。自动驾驶汽车也算机器人，但大部分是狭隘的AI，尽管用到了学习型AI的一些方面来实现计算机视觉。特斯拉所采用的，就是标准的现成技术，一种基于深度学习的计算机视觉技术。我想，老年人护理机器人，或者家政机器人，肯定都是日本很感兴趣的，它们对社会非常有用。特别是在老龄化社会——这是一个相当紧迫的问题。

“如果有一天，AI参与了某种新粒子的发现过程，那应该还挺酷的。”

为什么基于学习的方法在这一类用例里面要优越得多呢？

哈萨比斯：你只要想想：“为什么现在还没有这些东西？”为什么还没有一个机器人可以跟在你屁股后面，帮你收拾？原因是，每个人的房子在布局、家具等等各个方面都很不一样，即便是在同一个屋子，每一天它状态也都不一样，有时候脏乱，有时候整洁。

这就无法通过给机器人进行预编程来设定出收拾屋子方案。而且，你可能还要考虑到自己折衣服时的个人偏好。这个问题其实非常复杂。我们可能觉得这些事很容易做，但实际上，它们都涉及到非常复杂的过程。

问一个私人问题，你有没有扫地机器人？

哈萨比斯：嗯……我们确实有一个，但它不是很好用，所以……[笑]

因为我就有一个，它并不是非常好用，但我会去了解它的脾气，然后尽量忍让，因为我很懒，虽然不完美但我也忍了。所以我就想，当机器人变得更加先进以后，我们会在停止在哪个点上。会不会还没实现真正人类水平的人机交互，我们就止步了，觉得说剩下的忍一忍就好？

哈萨比斯：可能吧。如果一个机器人价格实惠，又能帮你整理碗盘，打扫屋子，那大家为什么不买呢。这些扫地机器人是蠢，而且不具备任何真正意义上的智能，但还是很受欢迎。所以确实，我觉得渐渐的，会有一些有用的东西出来。

那对于未来人类、机器人、AI这三者之间的互动，你有哪些长远的期待？大家想象得都比较科幻，往往都脑洞大开。

哈萨比斯：我个人并不是很关注机器人。对于AI，我很想做的一件事就是用它加速科学进步。我很希望看到由AI辅助的科学研究：提供一个AI研究助理，帮你揽下很多枯燥的工作，挖掘有趣的文章，在海量数据中发现结构，然后把它呈现给人类专家和科学家，帮他们更快地实现突破。

几个月前，我在欧洲核子研究中心作了一场演讲；他们产生的数据似乎比地球上任何人都要多，而且说不定哪个地方的庞大硬盘上，就存着证明某种新粒子的数据，但就是没有人有空去分析，因为数据实在是太多了。

所以我想，如果有一天，AI参与了某种新粒子的发现过程，那应该还挺酷的。

翻译 / 雁行