百度吴恩达谈深度学习局限:AI经济价值目前仅来自监督学习

《财富》昨日刊登吴恩达专访,吴恩达介绍了百度内部深度学习平台等人工智能应用。吴恩达还指出,近年来 AI 发展主要得益于数据(燃料)和计算力(引擎)的发展,眼下数据比计算力发展稍快(给引擎的燃料还够),但硬件发展日益加快,在某些领域甚至超过了数据(给引擎的燃料不够),要努力保持两者同步发展 AI 才能继续往前。

百度首席科学家吴恩达(Andrew Ng)

百度首席科学家吴恩达(Andrew Ng)

2016 年 5 月 23 日,《财富》网站刊登了对吴恩达在加州森尼韦尔的百度人工智能实验室接受了《财富》杂志的专访,他谈了几个问题:(1)为什么现在人工智能这么火;(2)企业是如何利用人工智能来赚钱;(3)为什么人工智能灭世论严重夸大。

目前 AI 创造的经济价值几乎全部来自监督学习

Fortune:你将如何定义人工智能,或者说商业上可行的人工智能?

吴恩达:我们在过去几年中看到,计算机在处理数据以进行预测这方面做得越来越好了。这既包括预测用户最有可能点击什么样的广告,也包括在图片中识别出人、预测哪些网页最符合你的搜索查询需求——以及数百个其他的诸如此类的例子。许多这样的应用可以让用户的数字体验变得更美好,而有些时候这些改变也提高了企业的技术最低门槛。

Fortune:是否可以说,目前主流的人工智能主要关心从数据中识别出模式,而不太关心建造出能像人类一样思考的计算机?

吴恩达:尽管人工智能常常被过度宣传,我仍认为人工智能的进展程度已远远超出了许多人的想象。目前,几乎所有由人工智能创造的经济价值都来自监督学习技术。监督学习的意思是,基于系统曾经接受过的其他实例的输入,来学习对结果进行预测或对东西进行分类。这些任务可以是:“给你一幅图片,请把那个人从图里找出来”,“给你一个网页,请预测用户是否会点击这个网页”或者“给你一封电子邮件,请判断它是否是垃圾邮件。”

语音识别是这方面的另一个例子,在语音识别中输入的是音频剪辑,而输出是音频内容转换成的文本。

机器学习这几年之间发生了什么

Fortune:由于苹果 Siri 提供的新功能,语音识别最近比较火。下一步怎样才能让智能助理型的应用更加有用呢?

吴恩达:我们想要追求的目标是,让与计算机交谈变得像与人交谈一样自然。这是一个远期目标,我们短期内不能实现它,但当我们实现这个目标后,就会有更多的用户想使用它。目前,很大程度上只是一些技术热衷者在使用语音功能。世界上的大部分人并不使用语音来与电脑互动。

与机器交谈的感觉仍然和与人交谈的感觉非常不同:你只能够交谈某些方面的东西,你不能在交谈中打断机器人。有些时候,机器人的回应会比较慢。有些时候,你说的东西会令机器非常困惑。比方说,如果我对计算机说,“请打电话给卡洛,号码 555-1000……不,等等,1005”,计算机就很难理解我的话,也很难采取正确的行动。

Fortune:几年之前,没有几家人工智能是面向消费者的,而今天像语音识别和能理解照片的算法这样的技术已很普遍。这几年之间发生了什么?

吴恩达:机器学习方面的大量进展是由计算能力的提高和数据的增长所驱动的——不过我这个观点在学界可能不太受欢迎。我们可以把它类比于建造太空火箭:你需要大功率火箭发动机,你也需要大量的燃料。如果你有许多燃料但只拥有小功率发动机,你的火箭大概无法飞离地面。如果你拥有大功率发动机但只有一点点燃料,你的火箭即使飞上天也无法进入轨道。

只有当你同时具有了大功率发动机和大量燃料时你才能去探索太空中的奇妙之地。作为类比,大型电脑相当于火箭发动机(在百度我们已经可以建造超级电脑了),而大规模数据则相当于火箭燃料。

在过去十年中,数据的增长或者说火箭燃料的增长略微超出了我们建造火箭发动机以利用燃料的能力。不过目前,我们在扩增火箭发动机方面的能力已经追了上来,在有些时候甚至反过来超过了我们提供火箭燃料的能力。我们必须努力工作才能同时扩展这两种能力。

Fortune:好像现在每当深度学习被应用于某个任务时,它都能为那个任务产生最佳结果。我们是否也能够把深度学习应用于企业销售数据,从而比传统企业软件或流行的“大数据”工具更快地找到有意义的商业洞见?

吴恩达:深度学习的一大局限是,它所创造的几乎所有价值都来自“从输入到输出的映射”的方法。比方说你有一些企业数据,其中 X 或许是用户在亚马逊上的帐号,而 Y 是“用户是否进行了购物?”这样一个问题。如果你拥有关于 X-Y 配对的大量数据,那么你就能够利用深度学习来进行预测。然而,如果让电脑自己在数据中进行探索和发现,这方面的算法在很大程度上尚处于摇篮期。

正因为如此,那些关于人工智能邪恶杀人机器人和超级智能的宣传都是严重夸大的。上面提到的 “从 X 到 Y 的映射”只是一种很狭窄的学习方式。而人类可以以多得多的方式来学习。这种“从 X 到 Y 的映射”方法在技术上被称为监督学习。我认为,关于监督学习之外的其他学习方式,我们仍然没有找到正确的思路。

中国市场上的人工智能

Fortune:在美国谷歌和 Facebook 的工作引人瞩目。能否告诉我们,百度用人工智能做了些什么?

吴恩达:百度有一件事情做的很不错,它创造了一个机器学习内部平台。这个平台能够让全公司的工程师、包括那些不研究人工智能的人都能以各种创造性的方式来利用深度学习——他们会用深度学习创造出一些像我这样的人工智能研究者从未想到过的东西。除了我们核心的网络搜索、图像搜索和广告业务外,深度学习还支持着大量的创意产品,这些创意产品构成一条非常长的长尾。

例如,我们的电脑安全产品使用深度学习来识别安全威胁。我从未想过深度学习可以做这个,也不知道该怎么做。我们也使用深度学习来提前预测一个硬盘何时会崩溃,而这就既增加了系统的可靠性,也降低了数据中心的成本。

Fortune:百度也制造了类似谷歌眼镜的产品,还制造了数字助理,甚至智能自行车。这些产品有市场吗?还是说它们目前只是一些有趣的实验而已?

吴恩达:我认为这些目前还属于研究性探索。不过,通过我们从社区中获得的反馈,我们了解到对智能自行车和可穿戴摄像机的需求是确实存在的。

吴恩达谈深度学习局限:AI 经济价值目前仅来自监督学习

实际上几周之前,我们刚刚在中国发布一个名叫 Dulife 的新产品的 demo,该产品使用计算视觉和自然语言处理技术来告诉盲人其面前有什么东西。比方说,在中国,有好几种面值不同的钞票大小相同,而盲人必须通过触摸才能知道它们哪里不一样。然而,当钞票被反复使用后,它的盲文部分会磨损,这样盲人就很难辨别其面值。在这种情境中,计算机视觉可以告诉盲人,这是一张 20 元的纸币,还是一张 50 元的纸币。这种产品是盲人十分需要的。

Fortune:在这些移动和可穿戴设备方面,中国市场是否与美国市场以及其他市场有什么不同呢?

吴恩达:中国市场非常不一样。其中一个差异是,中国目前最大、最热的技术趋势是 O2O,即从线上到线下。 O2O 的概念指的是,用你的移动设备把你周围的外在服务连接起来,无论这些服务是洗车、送餐、寻找附近的打折电影、美甲还是雇佣私家厨师。在美国也有这些东西,不过中国巨大的人口密度使得 O2O 可以迅速成长。

还有,在中国许多用户的第一件计算性设备是智能手机。当你的第一件计算性设备是手机的时候,你就会学习用最有效的方式来使用手机做事,而不一定会改为使用电脑。

我们可能正在接近 AI 期望值的顶点

Fortune:什么时候我们会不再把人工智能当成新鲜事物来看待,而是像对待许多其他技术一样把它视为理所当然呢?

吴恩达:我想,就像在 Gartner 公司的技术成熟曲线(Gartner Hype Cycle)上,我们可能正在接近人工智能期望值的顶点。我认为,对人工智能超级智能的恐惧曾经达到过顶点,而如今这种恐惧的高潮已经过去了。很难讲,或许我是错的,但我希望的是这样一个未来:到那时,我们将不再夸大人工智能,而是集中精力去探索人工智能的进步。

Fortune:这么说,我们近期是不是还达不到这样的水平:我们的设备或应用程序能识别出我们或我们周围的东西,而我们对此能习以为常?

吴恩达:我认为,在计算视觉方面还要等很久,因为目前计算视觉的产品并不多。不过我可以分享一个盈利很好的计算视觉产品。

在百度的广告系统中,如果你向用户展示一段文本,这没问题。运用我们的深度学习技术,我们可以帮助广告商选择一个小图片,这个小图片可以与文本并列放置。这样,你不仅会读到一小段关于在巴厘岛度假的广告,还会看到一幅巴厘岛的小图片,而你只需要几分之一秒的时间就能理解它。这一服务能让用户更快地明白某个广告是关于什么的,它极大的促进了我们在沟通用户与广告商方面的能力。

题图来自吴恩达 Twitter,他生日时团队送的礼物

英语原文: Derrick Harris,Baidu’s chief scientist explains why computers won’t take over the world just yet,fortune.com

译者:朱焕

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网(http://www.yangfenzi.com)延伸阅读:

吴恩达为李彦宏再造一个百度?
百度智能+:百度技术体系核心全面人工智能化
如何打造数据科学团队,你想知道的都在这里
李彦宏、杨元庆、徐小平、饶毅、施一公跨界联合竟然是为了这!
吴恩达&林元庆:只有改变道路和心态,无人车才可能真正上路
雷鸣对话吴恩达:超级大咖深度解析人工智能的发展现状与未来
吴恩达加盟百度背后:基于人工智能的共同愿景
除了度秘,百度世界还发布了脸优、百连和“糯米+”O2O生态战略
MOOCs Coursera创始人吴恩达:翻转课堂

分享给您的好友:

您可能还喜欢…

  1. 2017年3月2日,国家发改委让百度来牵头组建这样一个深度学习的国家实验室,这既是一个很大的鼓励,也是一个很大的责任。我们不仅仅要做成全国的第一,也要在世界上做到让人仰慕,让人家将来像朝圣一样到这儿看一看。

    人工智能是百度核心的核心,百度对于人工智能是非常serious的。

    仅仅过去两年我们在研发上的投入就高达两百亿。在中国五百强企业当中,我们论收入肯定不是排在第一的,但是论研发占收入的比例,那绝对是第一的。

    我们是深度学习的国家队,不是国足那个国家队,起码要做像女排那样的国家队。

    3月2日,“深度学习技术及应用国家工程实验室”揭牌仪式在百度大厦举行,国家发改委高技术产业司副司长孙伟,百度董事长兼首席执行官李彦宏,以及中国科学院院士、清华大学教授张钹等共建单位代表出席了揭牌仪式并致辞,来自企业、科研、媒体等各领域近百人出席了揭牌仪式。

    “中国大脑”建议落地,李彦宏:我很满足

    两年前,李彦宏以政协委员的身份在两会上提出建设“中国大脑”的倡议,而“深度学习技术及应用国家工程实验室”的揭牌,是当初“中国大脑”概念的落地执行,也是中国将人工智能发展提升到国家战略的重要标志。

    李彦宏说,百度4年前成立IDL研究室,2年前提出中国大脑的提案,现在承建国家人工智能工程实验室。“人工智能是百度核心的核心,百度对于人工智能是非常serious的。”

    “我自己也非常高兴能够亲自见证这个国家工程实验室的揭牌,不仅是因为百度来牵头,也是多多少少结了我的一个心愿。”他说,“当时用了‘中国大脑’这么一个词,实际上就是希望以国家的力量去建立一个全世界最大规模的深度学习计算平台。”时隔两年,这个国家实验室由百度来牵头,“我觉得我已经很满足了”。

    国家决定,
    由百度牵头首个国家人工智能实验室

    “深度学习技术及应用国家工程实验室”将成为首个国家级的人工智能工程实验室。前不久,国家发改委正式批复,由百度牵头筹建这个实验室。(点击蓝字,查看详情)它将有人工智能产品大规模产业化、人工智能应用技术、人工智能寄出技术、深度学习工程平台4个层级,包含7个重点技术平台方向的整体技术方向架构。

    百度深度学习实验室主任林元庆说:

    “实验室将在听觉、视觉感知和语言理解三个人工智能基础领域,实现技术突破,在大规模国际公开评估集上达到世界一流的评估效果。尤其是推动由当前的简单场景问题向多元化复杂场景问题过渡,包括多主体图像理解,噪声背景下的语音识别和多轮对话及问答交互等。”

    与此同时,实验室还将通过对大规模密集型计算、海量数据训练、计算机视听觉、生物特征识别、复杂环境感知、新型人机交互、机器翻译、标准化服务和深度学习知识产权等方向的研究,建立深度学习技术及应用研究研发平台,产出专利、标准及工程产品原型,构建示范环境,并从国家层面提高技术支撑能力,加强产业合作和人才培养。

    在“深度学习技术及应用国家工程实验室”未来的运行发展过程中,百度将支持深度学习技术工程平台建设,从软件,设备和人才等方面推动建立大规模深度学习工程平台。

    李彦宏说:仅仅过去两年我们在研发上的投入就高达两百亿。在中国五百强企业当中,我们论收入肯定不是排在第一的,但是论研发占收入的比例,那绝对是第一的。有了研发的支持,实验室将着力解决我国人工智能基础支撑能力不足等问题,推动我国深度学习技术及应用领域的产学研标用全面发展。

    百度肩负国家AI使命:科技创新,谁行谁上

    作为中国大型互联网企业中最早把深度学习提到核心技术创新地位的企业,百度公司在语音、图像及无人驾驶等众多深度学习技术领域都达到了全球领先水平。这次承建实验室,百度将继续发挥在人工智能领域的“特长”,完成国家赋予的使命。

    李彦宏在揭牌仪式上表示:“今天发改委让我们来牵头组建这样一个深度学习的国家实验室,这既是一个很大的鼓励,也是一个很大的责任。我们不仅仅要做成全国的第一,也要在世界上做到让人仰慕,让人家将来像朝圣一样到这儿来看一看。”

    他同时也表态:“我们是深度学习的国家队,不是国足那个国家队,起码要做像女排那样的国家队。”

    《人民日报》评论员文章写道:百度承建“深度学习技术及应用国家工程实验室”,是作为既接地气,又站在产业前沿的“领头雁”,来承担发展人工智能的国家使命,是互联网行业乃至中国科技创新典型的代表。

    中国正在跑步进入人工智能时代,百度牵头的深度学习实验室将是科技提升竞争力的“国家队”。

    虽然百度是民营企业,可承建国家级人工智能实验室本不以身份作为区别,因为国家说了——

    “科技创新,谁行谁上”