AlphaGo之父戴密斯·哈萨比斯：除了下围棋，AI还要塑造人类未来

by 氧分子 · 2016 年 03 月 14 日

DeepMind两战两胜围棋大师李世石，激起了人们对人工智能潜力的热烈讨论。然而DeepMind的产品远不止AlphaGo而已——连主打产品都算不上。正如公司联合创始人戴米斯·哈萨比斯在本周早先说过的，DeepMind想要“解决智能问题”。为了实现这一目标，他有很多想法。

戴密斯·哈萨比斯(Demis Hassabis)一贯不走寻常路，不过现在回顾起来却另类得不无道理。他是儿童国际象棋天才，曾5次获得脑力奥林匹克运动会全能脑力冠军，年纪轻轻就通过在游戏开发公司Bullfrog和Lionhead研发侧重于人工智能的游戏《主题公园》和《黑与白》名噪一时，后又成立了自己的工作室Elixir。2005年，哈萨比斯从游戏产业中抽身，转而读了个神经科学博士，随后在2010年成为了DeepMind的联合创始人。

在AlphaGo首战告捷后的上午，哈萨比斯接受了The Verge的采访。当谷歌一位负责人告诉他一夜之间韩国媒体发表了超过3300篇关于他的文章后，他难掩惊讶。“太难以置信了，不是吗？”他说道。“看到小众的东西变得这么流行还真是有趣。”

除了AlphaGo，我们的谈话还涉及了电玩、下一代智能手机助手、DeepMind在谷歌旗下扮演的角色、机器人、人工智能如何辅助科学研究等等。料很多，慢慢看。

（以下内容酌情略有删减）

“ 围棋一向是人工智能研究的终极目标

对既不了解AI也不了解围棋的人，你要如何描述昨天发生的事所引起的文化共鸣？

AlphaGo之父：除了下围棋，AI还要塑造人类未来

我想就此说几点。围棋一直以来都是完美信息博弈的巅峰。在可能性上，它远比国际象棋复杂。因此在AI研究领域，尤其是继“深蓝”之后，围棋一直是大家的终极目标。正如你所知，尽管付出的努力不少，却收效甚微。

AlphaGo之父：除了下围棋，AI还要塑造人类未来

“蒙特卡罗树搜索”是十年前的重大创新，但我们将直觉层面引入了AlphaGo的神经网络，而顶级棋手之所以杰出正是因为他们的直觉力。连比赛现场解说员迈克尔·雷德蒙都无法算出胜负，这真令我震惊，他可是职业九段！这正显示出了围棋的估值函数写起来有多难。

比赛过程中，AlphaGo有没有哪几手棋是出乎你意料的？

有的。当AlphaGo向左下角李世乭的地盘猛攻时，我们相当震惊——从李世乭的表情来看，我想他也这么觉得。这是很出人意料的一招。

因为进攻太猛？

应该说一方面攻得太猛，一方面又太鲁莽了！并且它对李世乭将计就计。李世乭以富有创造力的进攻著称，他在比赛中也是这么做的，我们猜到他会这样。比赛开局，一切还没落定，他就全盘各处进攻。传统的围棋程序非常不善于应对这样的比赛，它们在局部计算上并不差，但需要大局观的时候就显出劣势了。

“ 为什么说谷歌围棋的胜利如此重要？

举办比赛的初衷之一就是为了考察AlphaGo的实力。你从昨晚的比赛看出了什么？

事情比我们希望的还要好。我们之前认为比赛的胜率是50:50。我现在还是这么认为；一切皆有可能，李世乭也会以不同的战术应战。因此能一探究竟是很有趣的。

继续你的第一个问题，人工智能的意义，你也听我说起了AlphaGo和“深蓝”的不同。“深蓝”是定制的程序，程序员从国际象棋大师那里将信息提炼为具体规则和启发式算法，而我们则赋予了AlphaGo学习的能力，让它自己从练习和培训中学习，这点更与人类更接近。

如果AlphaGo照这样赢下去，接下来是什么？未来会有其他的人工智能比赛吗？

对于完美信息博弈，围棋已经是顶点了。当然，还有其他的围棋大师可以与之对决。也还有其他的竞技项目——无限注扑克很难，多玩家的形式很有挑战性因为这是一种不完美信息博弈。当然，还有各种人类比计算机玩得好的电竞游戏，比如在韩国大受欢迎的《星际争霸》。策略游戏对非完美信息世界中的策略能力有很高的要求，是谓“部分观察”。但围棋中你可以看到整个棋盘，对计算机来说难度会小些。

你对称霸《星际争霸》有兴趣吗？

也许吧。我们的目标不是要横扫竞技项目。我爱游戏，也曾经编写过电脑游戏。但前提是游戏能作为测试我们编写的算法的平台，这样来测试算法效率较高而已。最终我们是想要将它应用于解决现实世界中的重大问题。

能谈一下你现在从事的和之前从事的游戏业的区别吗？

像DeepMind这样的东西是我一直以来的终极理想。从某种意义上说，我已经为之计划了20多年。我之前所做的都是为了从事有朝一日投身到人工智能的领域。如果你熟悉我在Bullfrog等公司所做的事情，你就会知道，我所围绕和涉及的工作重心全是AI。

从16、7岁制作《主题公园》起，我就意识到了人工智能的巨大潜力。我们的游戏有数百万的销量，无数人沉浸其中，都是因为AI的功劳。在此基础上，我曾尝试在游戏制作生涯中更进一步，然后就转向了神经科学的学习，因为在2005年左右我觉得已经很难再打着制作游戏的旗号进行AI研究了。毕竟发行商想要的只是游戏，对吧？

所以截止到那时，AI最大的用武之地就是游戏咯？

我认为是这样的，而且当时我们做的还是前沿得不得了的AI。90年代，学术研究进度放缓，所有诸如神经网络、深度学习和强化学习这些新科技都还没得到普及。所以事实上最好的AI都是在游戏中出现的。那还不是我们今天搞的这种学习型AI，而是有限状态的机器，但是它们已经相当复杂并且可以自适应了。像《黑与白》这样的游戏就用到了强化学习——我至今仍然认为这是强化学习在游戏中最复杂的典范。但是到了04、05年，游戏产业已经发生了变化，不再像90年代那样既有趣又有创意，可以容你随意实现自己的想法了，而是充斥着与游戏画面、销售和FIFA游戏这些相关的东西，变得不再那么有趣。我在游戏领域中已经发挥到极致，是时候搜集不同的信息来准备创立DeepMind了。这就关系到了神经科学。我想从人脑解决问题的过程中得到启发，那么还有什么比读个神经科学PhD更好的方法呢？

IBM已经将“沃森”应用于癌症诊断中。DeepMind又能给我们带来什么呢？

现在谈这个还有点早。几周前我们宣布了和NHS的合作，而那只是为机器学习提供平台的开始。以我的理解，“沃森”跟我们所做的还是很不一样的。“沃森”更像个专家系统，是一种不同类型的AI。这类AI做的是对图像进行医学分析，纵向跟踪重要信号或随着时间自我积累，来帮助人们建立更健康的生活方式。这对强化学习来说是很适合的。

谈谈智能手机助手吧。你在开赛日的讲话中用到了电影《她》中的画面。所以未来就是那样的吗？

不，我的意思是《她》代表了对这类事物的主流观点。我认为人们想要的是智能、连贯且深刻理解你真正想表达的意思的智能手机助手。

AlphaGo之父：除了下围棋，AI还要塑造人类未来

现阶段这类系统还不堪一击——一旦涉及到程序没有的模板，它们就全无用处。因此关键是要让它们变得真正具有自适应力，更灵活稳健。

优化这些系统需要什么样的突破？为什么不能明天就开始着手进行？

能是能，我只是觉得要换个角度。这还是预编程序与学习程序的区别。目前基本所有智能手机助手都是特定预编的，这就意味着它们只能做预设好的事。然而现实世界混乱而复杂，手机用户会做出各种不可预判的行为。DeepMind的根本理念是，AI的唯一途径就是从根本上进行学习并且有通用性。

AlphaGo是从学习大量棋谱起步的。然而对于智能手机来说输入数据要多样得多。

AlphaGo之父：除了下围棋，AI还要塑造人类未来

是的，学习正是通过海量的资料来完成的。事实上，我们打算在接下来的数月里尝试AlphaGo算法——我们想去掉一开始的督导学习部分，完全让他自学，彻底从零开始。这样需要花费的时间要更长，因为随机下棋需要花更多的时间来训练试错，或许得好几个月。但是我们认为让它纯自学成才是可能的。

你说的可能是因为现在的算法比过去先进？

不，之前的算法也可以。这样并不会让程序变强，只是让它自学，没有监督辅导的部分。我们认为这个算法不需要督导也可以。我们去年用雅达利游戏测试时就没有任何人类知识的引导，只是从在屏幕上随机行动开始的。

雅达利游戏比较容易吧，因为失败更显而易见？

比较容易是因为比分更有规律。在围棋中，无论结束时你是赢是输都只得1分。这就是信用赋值问题，关键之处在于围棋中你下了一百手棋，但是不确定哪几步导致了输赢，所以信号是很弱的。而在绝大部分雅达利游戏中，你做的绝大多数事都会让你得分，所以你得到的线索会更多。

对于人工智能改变手机，你能不能给出个时间范围？

AlphaGo之父：除了下围棋，AI还要塑造人类未来

我想，在接下来的2-3年内你就会看到苗头了。开始可能变化不大，只是有些方面进步了。或许在4-5年后功能上会有一大步飞跃。

谷歌有没有左右你们配合他们的产品方针或商业模型来行事？

AlphaGo之父：除了下围棋，AI还要塑造人类未来

没，我们可以自由掌控对研究进度的优化。我们的使命就是如此，我们就是为此才加入谷歌的，因为这样可以提升我们的研究进度。过去两年就是这么过来的。

AlphaGo之父：除了下围棋，AI还要塑造人类未来

当然，我们也在做许多谷歌内部产品，但那些还只初具雏形，不便公开。当然，智能手机助手是重中之重，桑达尔·皮查伊也多次谈到它是谷歌未来发展的核心。

“ 谷歌的支持对AlphaGo来说“非常重要” 你们和谷歌大脑有互动和交叉吗？

当然，我们其实非常有互补性。我们每周都要交流。谷歌大脑主要注重于深度学习，有杰夫·迪恩这样了不起的工程师，所以他们已经深入到了公司的每个角落，才有了像谷歌照片搜索这么棒的东西。他们做得出色极了。他们也位于Mountain View总部，所以离产品部更近，研究周期只有12-18个月。而我们做的是算法开发，周期要2-3年，一开始也并没有明确的产品指向。

谷歌对AlphaGo的支持有多重要？没有谷歌你们能成功吗？

非常重要。AlphaGo在比赛中并不需要用到很多硬件，但是训练中我们需要很多硬件支持，尝试不同版本，让它们在云端展开对战。要想高效实现这些就需要大量的硬件，如果没有这些资源我们是无法在这么短时间里完成的。

我在日本工作，现在机器人在日本有两种用途。一种是发那科这样的公司的工业机器人，还有一种是软银的Pepper这样的管家式机器人等等。从某些角度说都很厉害，但使用范围有限。你怎么看？

是的，正如你所说，发那科机器人的物理功能很强，但他们缺乏智力。管家机器人则有些类似智能手机助手——也是以模板响应来预编的。

如果你的行为超出这个范围，他们就傻眼了。

那么机器学习会如何提升机器人的能力呢？

这是完全不同的另一方面了。你要从头创造学习新事物的能力，还要具备应对意外的能力。对于任何机器人和软件来说，在现实世界中与现实用户互动，这些能力都是必须的，这样才能让它们派上用场。我相信学习的道路终归是对的。

眼下，学习型机器人最实际的用途是什么？

说实话我们没怎么考虑过这点。显然，无人驾驶车可算是机器人，但目前为止还是狭义人工智能——尽管在计算机视觉方面用到了学习型AI。特斯拉用的是几乎现成的基于深度学习的计算机视觉技术。我确信日本在考虑研发老年护理机器人，我觉得家务机器人对社会也是极有用的，尤其是考虑到人口老龄化这个严峻问题。

学习型机器人为什么会在这些领域尤为出众呢？

你应该先想想“为什么我们还没有这些东西呢？”为什么没有能包揽家务的机器人？原因就在于每人的家在布局和家具等方面都完全不同。即使在室内，情况每一天也不尽相同——有时会变得凌乱，有时会变得整洁。所以你没法给机器人预编程序来打扫房间，对吧？更不用说人们在如何叠衣服上都有不同的偏好。这正是问题的复杂之处。这些对人类来说很简单，但事实上在做这些事的时候，我们是在处理异常复杂的情况。

我问一句：你用扫地机器人吗？

呃……我们的确有一台，但不太好用……（笑）

从长远看，你对人类、机器人及人工智能在未来的互动有何期待？

我个人并没太多考虑过机器人。真正令我对运用这种AI感到激动的领域是科学。我期待能由AI研究助手来完成一些枯燥的工作，挖掘有趣的文章，在数量庞大的数据中摸索出结构并呈现给人类专家和科学家，使他们能够更快地取得突破。几个月前我在CERN进行了一次演讲。

显然，他们产生的数据比地球上任何其他人都多，也许在他们庞大硬盘的某处就藏着新粒子，只是因为数据太多而没人来分析发现。所以，要是有一天AI能参与发现新粒子，就太酷了。

真是精彩的结语。

来源：The Verge 作者：Sam Byford 编译：未来论坛商白

文章转载请注明出处为 “未来论坛”微信账号（ID：futureforum）
未来论坛官网：www.futureforum.org.cn