斯坦福张首晟:大数据时代感受物理、科技、人文的跨界之美

氧分子网注:本文为斯坦福大学物理系教授张首晟,为吴军的著作《文明之光》所写的序言,读过之后顿时感觉:果然杰出的科学家都有着极其优秀的人文素养啊!膜拜!!

从小我就酷爱读历史,那些可歌可泣的故事深深地打动我的心灵,历史似乎就是一盘棋,命运时时在那些伟人的掌控之中。然而,我也经常会问一些可笑的问题,例如:当年如果荆轲刺秦王成功,中国的历史将会如何演化?如果布鲁图刺杀凯撒大帝不成功,欧洲的历史又会怎样?如果普鲁士军队来到拿破仑与威灵顿打得不可开交的滑铁卢战场迟了两小时,世界又将转向哪个方向?如果,如果……人类的历史好像就被那些偶然的因素牵着走。

学习物理把我带进了另一个世界,牛顿方程下的宇宙,就像一个瑞士手表,每分每秒都在精密地运转。小到树上的苹果,大到太阳系的行星,都被一个简单而优美的万有引力定律所描写。这两个截然不同的世界都深深地吸引了我,但是物理世界的必然与历史世界的偶然却深深困惑了我。

当我深入学习到统计物理学,才开始慢慢看到了两者的相似之处。牛顿方程之所以能精密描述行星的运动,是因为这是个简单体系,仅有几个少量的自由度。当我们观察气体中的分子,液体中的小颗粒,它们的运动是杂乱无章的,似乎也被偶然的因素所左右。而统计物理把这些杂乱无章的个体运动提高到整个系统的行为,那些偶然的因素在统计平均中消失了,提炼出了能量守恒与熵增的普适规律,偶然走向了必然。爱因斯坦曾经说过,在知识的未来,牛顿力学,相对论,量子力学都会被修改,而统计力学的定律却是永恒的。

所以我要问,能否用同样的眼光来看历史呢?历史的浩瀚章节,戏剧式的人物故事,尽管偶然,就像液体中的小颗粒一样难以预测,但是,我们把时空尺度渐渐放大,这些偶然因素是否会在大数平均下相互抵消而消失,从而提炼出真理呢?

正当我在深思这些问题的时候,受到我好友吴军的邀请,读他的大作“文明之光”,并为书写序言。我在欣喜中一口气把书读完,深受启发。书中写的不是人们已知的帝王将相,英雄美人,而是一部光辉灿烂的文明史。这部书帮助我从噪声中寻找信号,深思主宰人类历史的真理。

每当我们读历史之时,往往会问,在这之前发生了什么?历史的起源是有人以来最常问的深刻问题,不同的民族,不同的宗教,不同的文化都有自己的传说,自己的“创世纪”.人类文明数千年,直到我们这时代,才真正了解了时间的原点。今天,我们知道,宇宙是在大爆炸中产生的,宇宙的年龄为137.98±0.37亿年,地球的年龄约为45.4亿年,恐龙是在6500万年前消失的,现代智人的年龄约为20万年,人类有文字的历史约为5500年,正如“文明之光”引言中所提,如将地球的年龄缩短成一年,人类出现仅在最后的半小时。所以,我们要读懂人类文明史,更需要从宇宙形成的原点出发,用大历史的眼光来看一切。在大历史的尺度下,更能把那些偶然因素在统计平均的意义下去掉,留下宇宙演化与文明进步的真理。

因为人类是由原子和分子组成的奇妙物种,我们要找到普适于宇宙与人类的第一性原理,必须从最基本的概念出发,那就是能量、信息与时空。它们的结合,产生了能量密度与信息密度的概念。(值得注意的一点是,物理学家引进了熵的概念,后来发现墒的统计意义就是信息,两者是等价的。)

宇宙大爆炸后,刚开始,宇宙中充满着基本均匀的微小尘埃,随着时间推移,尘埃的密度也开始发生涨落,有些密度比较高的地方,通过万有引力的作用,把别处尘埃逐渐吸引过来,尘埃间的距离会非常靠近,能量和质量的密度也会大大提高,超过临界值之后,有一种新的力会起更大的作用,即强相互作用力,它使得原子核在碰撞时产生核聚变反应,聚变反应成为新能量的来源,通过这个机制,形成了恒星和星系,从此恒星点燃了宇宙之光。

相似地,人类刚刚起源的时候,分散在地球表面,通过狩猎和采集维持生存,此时人类的能源更多来自于狩猎的动物,由于动物资源有限,所以人口密度不会达到临界状态,直到一万年前,人类发现了农业,开始了耕种,农作物通过光合作用带来能量,维持人类的生存,可以说人类利用了一个新的能源,即太阳能。这一新能源导致能量密度极大提高,造成人口密度也极大提高,形成了村庄。由于能量密度的提高,为人们更紧密的信息交流提供了机会和条件,因而产生了语言和文字,从此点燃了文明之光。

由此可以看出,整个宇宙复杂性(Complexity)的产生,无论是恒星的产生,还是人类文明的产生,都需要能量密度达到一定高度。

我也在思考,我们经常提到文明,那么什么是文明?文明的定义是什么?生物世界通常只有一个传播信息的办法,就是通过基因。而人类创造了一个平行于基因的信息体系,就是通过语言和文字,代代相传,称之为文明。所以我将文明简单定义为:平行于生物基因,可以代代相传的一个信息系统。在“文明之光”中,很多章节都提到了新能源的发现,人类每次新能源的革命,都带来了巨大的文明革命,例如蒸汽机、电力和核能的发明,都为人类文明带来的巨大的变革。

在经典的史书中,对帝王战争的记述占据了绝大的篇幅,在战争中,秦始皇、亚历山大大帝、凯撒大帝得到了他们个人至高的荣耀,却给百姓来带了兵荒马乱、妻离子散的残酷悲剧。而在人类的文明史中,战争占有什么样的地位?在我看来,战争最大的遗产是颠覆性地打开了信息交流的新渠道。

亚历山大大帝戎马一生,英名盖世,征服了当时他所知的世界,但他英年早逝,还没建立起自己的皇朝,他的帝国就崩溃了,他给人类文明留下了什么呢?是一个图书馆!亚历山大大帝有两位老师,一位是他的父亲,教他用武力征服世界,另一位则是亚里士多德,教他吸取世界知识,“文明之光”中提到,在亚里士多德的影响下,亚历山大始终对科学十分热心,对知识十分尊重,并提供人力和财力支持,使得古希腊文明广泛传播。当他征服埃及之后,建立了海边的港口城市,命名为亚历山大城。亚历山大在生的大目标是征服一切已知的世界,而他建立的图书馆的大目标是收藏人类一切的书籍与知识。当时每只船进入亚历山大港口时,都要被搜查,若找到一本图书馆里没有的书,就会被“充公”一年,等图书馆工作人员抄写完毕,重赏后才物归原主,这样年复一年,亚历山大图书馆收集了当时人类几乎所有的书籍,声名远扬,成了古代信息密度最高的地方,也吸引了古代最杰出的学者。信息密度超过了临界值,加上杰出学者的智慧,导致了一场古代社会的“知识大爆炸”.图书馆馆长埃拉托斯特尼(公元前276-前193)在一本书上读到埃及西厄这个地方,在夏至那天的正午,立竿而不见影,于是他出了一个奇妙的办法,通过亚历山大城的竿影便能测出整个地球的周长。当时人类对数学已有了许多碎片化的知识,但是没有一个完整系统,欧几里得在图书馆里阅读万卷书之后,写出了千古奇书《几何原本》,用公理化的体系,不但奠定了整个几何学的基础,也制定了整个科学研究的方法。“文明之光”中提到大科学家阿基米德与托勒密都曾在亚历山大图书馆里学习与工作,分别创立了物理学与天文学的基础。

亚历山大大帝通过战争打通了古代世界的交流,而亚历山大图书馆,则空前地汇聚了人类的知识与处理人类知识的大学者,达到了信息与信息处理的超高密度,创造了古代世界知识大爆炸的奇迹。由此看来,能使亚历山大大帝流芳千古的,并不是他在战场上的丰功伟绩,而是他留下的这个图书馆。

凯撒大帝被视为古罗马帝国的无冕之皇,现在人们每次提起他,大多讲的是他在战场上的丰功伟绩,和他与埃及艳后的浪漫史,以及他最后被自己钟爱的养子布鲁图刺杀。但我更想知道,他对人类文明起了什么作用?作为古罗马帝国的缔造者,凯撒大帝为了征服别的民族和国家,开始修建罗马大道。西方古语有云,条条大路通罗马,可以想见罗马大道的规模。罗马大道修建时是为了军事目的,用于运输军队和军事供给。道路的延伸带来了罗马版图和权利的扩张,加强了罗马帝国对被征服地区的统治。渐渐地,这个军事网络逐渐发展为金融、文明交流网络,起到了原先修建罗马大道时意想不到的作用。经济上,罗马大道使得罗马帝国征税非常方便,并极大地促进了商业的发展。文化上,罗马大道促进了非罗马地区的文明化进程,使得罗马的政治制度、法律制度、经济模式、生活方式等得到了广泛普及。但出人意料的一个例子便是基督教的传播。基督教起源于犹太国,犹太国当时是一个很小的国家,根本无法与罗马帝国在世界上的地位相提并论,耶稣基督和他的十二门徒就是来自这个小国。通过罗马大道,门徒们非常有效的传播了他们的宗教信仰,基督教从一个小小犹太国的信仰,发展为现在世界的三大宗教之一,是一个传奇的历史,可以说是人类网络效应第一个例子。从古罗马皇帝尼罗(公元37-68)压迫基督教徒,到君士坦丁大帝(公元272—337)把基督教定为古罗马国教,当中只有短短不到三百年时间。基督教在整个罗马帝国的传播,也是一个网络效应的传奇。最终,古罗马帝国逐渐衰亡,但基督教却流传下来,对世界文明造成了深刻影响。

令人叹息的是,在亚历山大大帝在修图书馆的年代,秦始皇下令焚书坑儒,春秋战国百家争鸣的盛况成为了历史绝唱;在凯撒大帝在修罗马大道的年代,秦始皇修建了万里长城,抵抗外敌的同时,却也禁锢了文化的传播。

公元476年西罗马帝国没落,欧洲进入了黑暗的中世纪,古希腊罗马光辉的文明在当时的欧洲几乎完全被遗忘。出于宗教狂热,罗马教皇乌尔班二世下令进行十字军东征,要从穆斯林教徒手中重新占领耶路撒冷。十字军东征总体上是失败的,使东西方各国生灵涂炭,但很多人不知道的是,十字军东征也在无意中搭建了西方世界与穆斯林文化的桥梁,对欧洲文化产生了长远的影响。当时穆斯林世界的文明发展远远超过了欧洲,阿拉伯的化学、天文、数字等知识便被带回了欧洲,尤其重要的是,阿拉伯保存了古希腊古罗马的文明,十字军东征把这些起源于欧洲,但又在欧洲丢失了的文明,重新带回了家乡,最终导致了西方文艺复兴的革命。十字军东征带回的书籍中就包括古希腊天文学家托勒密的著作,他的思想便是通过阿拉伯学者之手重为欧洲所知。文艺复兴所要恢复的,便是古希腊古罗马的光辉,但这个光辉,却是通过阿拉伯世界保留并传播过来的,十字军东征无意中打开了这道文化大门。

战争有时会带来意外的效果,颠覆性地打通了文明交流的新渠道,而技术的发展带来了航海、铁路、飞机与网络,相当于缩短了地球的周长,提高了文明的交流,有效增加的信息的密度。这些都是物理层次的渠道,然而还有更神奇的渠道,打开了人类知识不同领域之间的交流。欧几里得的《几何原本》,奠定了几何学的基础,本是数学领域的大作,然而,这里面有来自于数学却高于数学的思想方式,可以广泛地应用到整个人类的知识。丰富多彩的几何学,根基于五条不言自明的公理,每条几何定理都可以从这五条公理推导出来。希腊人的几何学被罗马人加以运用。今天我们来到罗马的万神庙,处处可以看出这个千年前的建筑是来自几何学的奇迹。当我们仰望万神庙的天窗时,似乎可以看到欧几里得在天堂的笑容。这是几何学在工程学的直接应用,比较容易理解。但罗马人不仅把欧几里得几何学用于建筑,更把几何公理的思想用于法律,引入了自然法的概念。法律既然要让万民遵守,必须建筑在几条简单且人人都认为不言而喻的自然法上。法律保护个人财物,视为神圣而不可侵犯。罗马法是在当年历史条件下最理性的法典。由于对个人财产的保护,使每个罗马公民都发愤图强,使得罗马繁荣昌盛。一千多年之后,欧几里得的思想主导着美国建国的独立宣言,把人人平等的思想,提为不言而喻的建国公理。林肯总统为了解放黑奴,提出了宪法第十三条修正案,就在议会争论最为激烈的时候,他手中时时紧握着欧几里得的《几何原本》。几何五大公理之一,说所有直角都是相等的,更使林肯总统深信人人平等才是建国最核心的基础。古代罗马的强大,今日美国的繁荣,是因为那些建国元勋,真正接受了来自于欧几里得的灵感,理解并提炼了科学的精神,活学活用,悟出了治国之道。由此可见,人类文明跨领域的交流可以创造新的奇迹。

回顾大历史,我们发现文明的主线,是能量与信息。帝王将相,英雄豪杰,不过是为能量与信息的交流铺路,有效提高了信息的密度。用这样的眼光看大历史与人类文明,我们能对未来有何展望呢?在人类历史的滚滚长河中,我们这代人可以说是历史的幸运儿。前面提到,我们这代人,首次找到了时间的原点,历史的起点,这是人类文明史上唯一的。而更重要的是,我们迎来了信息大爆炸的网络时代,整个人类的知识,只要轻轻一点鼠标,就会立刻呈现在我们的眼前。然而,今天不论是个人的发展,还是研究领域的推进,都越深越窄,看到的只是树而不是林,很少有人能像文艺复兴时代的大师达芬奇一样,一个人的脑袋里能装进当时整个人类的知识精华,包括艺术、医学、工程、科学等,从而爆发出惊人的创意。前面也提起,当先人把来自于科学的公理思想用于法律的精神与治国之道,带来了罗马的强大与美国的繁荣。在今天的世界,用铁路与航海来建立地理的联络已不是那么重要,而建立知识的桥梁,连接不同领域的孤岛,才是推进文明的动力。知识跨领域的连接能有效提高信息的密度,必然导致我们网络时代的文明大爆炸。本着这个意愿,邀请读者们看一位工程师写的文明史,与一位物理学家写的历史序言,也许是在这个方向上迈出的小小的一步。

分享给您的好友:

您可能还喜欢…

1 Response

  1. 徐英瑾谈大数据、哲学与人工智能说道:

    复旦大学哲学学院的徐英瑾教授,专长为分析哲学史、心灵哲学、人工智能哲学以及分析哲学与欧陆哲学比较研究。大约从2004年开始,他将注意力投向“人工智能”(Artificial Intelligence,简称AI)。他不仅开设了“人工智能哲学”课程,同时也撰写了大量相关论文和评论,并出版了关于人工智能的专著。人工智能“在很多人看来,是一个工程技术色彩浓郁的学术领域,哲学研究则高度思辨化和抽象化,二者之间应当是风马牛不相及的。但这实际上是一种误解。”徐英瑾说。此篇访谈,是他相关观点的一个集中的反映,可以体现他对当下人工智能发展的思考。

    采访︱郑诗亮

    您大概是中国大陆少有的持续关注人工智能的哲学研究者了。您还专门为复旦学生开了一门叫做“人工智能哲学”的课。这门课第一讲的标题,也是我想向您提出的问题:为何人工智能科学需要哲学的参与?或者换句话来说,一个哲学研究者眼中的人工智能,应该是什么样的?

    徐英瑾:对我来说,我现在推崇的就是AGI——Artificial General Intelligence。在一般所谓的Artificial Intelligence(人工智能)中间加了一个General(普遍),这就意味着,它要做普遍的计算,工作起点与现在人们理解的人工智能是不一样的。

    现在的做法,是先在某一专门领域造一台无比厉害的机器,比如,在问答游戏领域造一个Watson,让它战胜一切人类选手,再在围棋领域造一个AlphaGo,让它战胜一切人类棋手。这是基于一种商业的逻辑:先在某一领域深入下去,取得成功,弄出很大的声势,然后吸引资本进入,接下来再尝试将相关技术推广到其他领域。但是这种做法,在哲学上是行不通的。

    以小朋友的成长为例。任何伟大的人,爱因斯坦也好,李世乭也罢,小时候总是各方面都有潜能的,然后随着他逐渐成长,某一方面的能力变得特别突出,即便如此,其他方面的能力也至少是在平均水平,就算比平均水平低,也不会低多少,否则就无法正常地工作了。简单来说,这是一个养成的过程。我所设想的人工智能,就应该是这样的,它是具有普遍性的,跟人类一样,有一个养成和学习的过程,能够适应多个领域的工作。

    而现在的做法,是分成好多个领域,一个领域一个领域地来做,做完之后,再合在一起,情绪、认知这些方面都不去管。那么,问题来了,你怎么知道这些领域最后合在一起,就能产生人工智能呢?打个比方,很大程度上这就相当于,去国际军火市场随机购买军火,然后整合成一支部队,或者去不同国家采购零件,然后拼凑成一架飞机。这显然是不可能成功的。

    而且,按照目前的做法,还会形成一种路径依赖,比如说对大数据的追捧。将来即便发现这条路走错了,要想再去走正确的路就很难了。这就好像一支军队用了很久的苏式装备,一旦换成美式装备,全军都会不适应。这个问题很容易就能想到,但是现在竟然就连这方面的批评都那么少,简直不可思议。

    您从什么时候开始关注人工智能哲学的?

    徐英瑾:差不多从2004年左右开始吧,我在翻译王浩文集的同时,读到玛格丽特·博登的《人工智能哲学》这部论文集。当时人工智能远远没有现在这么热门,但是我觉得,这是未来哲学应该处理的问题。博登的书只是一部入门之作,从此书开始,我找了大量相关资料阅读。关于人工智能哲学研究,我主要是和美国天普大学的计算机专家王培老师合作,他研究人工智能的体系,认为它就是为了在小数据的情况下进行应急推理。那个时候我还不知道有大数据,当然,大数据的前身,如贝叶斯、神经网络等都有了——今天的深度学习是当时的神经网络的高度加强版,根上的东西从欣顿(Geoffrey Hinton)那时就有了。后来大数据越来越热,我才关注到相关讨论。不过,这种关注对我的研究实际上是一种干扰,因为我知道它是错的。

    说到大数据,您在这方面发表了不少文章,比如有一篇就叫“大数据等于大智慧吗?”最近也频频谈论大数据问题。您在这方面的观点是什么?

    徐英瑾:如果用一句话来概括的话,就是,我谈论大数据的目的在于反对大数据。现在有一种很不好的风气,就是“IP”横行,“大数据”也被当作了IP,更糟糕的是,连我对大数据的批评也成了这个IP的一部分。事实上,我的批评背后,有我的理论关怀,就是日本哲学家九鬼周造的学说。九鬼周造写过一本书,叫《偶然性的问题》,说整个西洋哲学都喜欢从必然性的角度来解决问题,必然性解决不了就用概率论,但偶然性是永远不能被驯服的。大数据是试图驯服偶然性的一种尝试,但它终将无法驯服。

    中国历史上,这样的例子很多,尤其是军事史。你看那些大的战役的指挥者,彭城之战的项羽也好,赤壁之战的周瑜、鲁肃也罢,他们最终作出决策,靠的是什么呢,难道是大数据吗?其实是核心情报的评估和基于常识的推理,以及一点点碰运气式的瞎蒙。因为战争是充满无知之幕的。那些以小胜多的战役,如果光看大数据,那么一切都会指向多的那一方要获胜,少的那一方无疑是找死,可是事实是什么呢?

    所以,我所设想的新一代人工智能,是能够“认命”的机器人。说“认命”,不是说服从偶然性,而是利用偶然性;不是说无所作为,而是顺势而为。

    您的这种观点,说不定会遭到工程技术人员抱怨:哲学流派、观点那么多,我们怎么搞得清楚?

    徐英瑾:工程技术人员的抱怨,有一点我是同情的:两千年来,哲学问题的确没什么实质性的进展。那么,面对这种情况,我们要采取什么策略呢?印度有部电影叫《噢,我的神啊》(OMG:Oh My God!),男主角是个外星人,他跑到地球上之后,不知道哪个神管用,就每个神都拜一拜。哲学流派、观点很多,保不齐哪一个管用,每一个都要有人去尝试。不能所有的人都搞大数据,都搞神经网络、深度学习,这很危险。现在资本都往这几个领域里面涌,这是缺乏哲学思维的,某种意义上也是缺乏风险管理思维。一件这么不靠谱的事情,你怎么能只试一个方向、一种流派?

    而且,更糟糕的是,这方面的研究人员常常满脑子技术乌托邦,拿生活经验去细想一下,其实是很荒谬的。举个例子来说,现在 “奇点”被炒得火热,大意是说,奇点革命一旦到来,人类社会将被颠覆。事实上怎么样呢?我这一代人经历了改革开放初期的物质贫乏,一直到今天的物质极大丰富,我们七八岁时关于二十一世纪的乌托邦式想象,今天实现了几个?深层次的社会结构并没有怎么改变,比如医疗领域,各种新技术的出现其实强化了现有的社会结构,加剧了贫富阶层之间的差距,又谈何颠覆呢?大家把人工智能吹嘘得好像很厉害,其实它一点都不厉害,还有一堆问题没有解决,你去担心它毁灭人类干什么?这就和堂吉诃德一样,把风车当作怪物,自己吓唬自己。

    在您看来,目前这种以大数据为基础的人工智能,继续发展下去,可能会取得什么样的结果?

    徐英瑾:我认为,再继续这样热炒下去,就是技术泡沫,最后什么也做不出来。关于人工智能的发展,业内有点历史意识的人,脑子里往往有一张图表,下方是时间,上方是发展水平,目前的人工智能在这张表上的确在上升,但不久就会遇上瓶颈。就像我前面说的,它在哲学上是行不通的,很多理论问题还没有得到解决。我个人还是更倾向于小数据。

    您关于小数据的观点,在学界有代表性吗?您能就某个方面的实例来详细谈谈,有哪些人工智能的理论问题还没有得到解决吗?

    徐英瑾:在人工智能学界,小数据不算主流,但在其他领域就不一样了,心理学界对小数据的思考就很深入,德国的吉仁泽(Gerd Gigerenzer)做了大量的工作,人工智能学界还没有关注到。这是很可惜的事情。

    说到有待解决的理论问题,我可以拿脑研究来作为例子。现在有一种倾向,是试图从大脑出发来制造人工智能。这方面的风险实在太大,很多人不明白大脑究竟有多复杂。

    大脑有10^11个神经元,彼此之间存在着极为复杂的联系,其中存在的可能性是个天文数字。在很大程度上,我们进行情感判断和复杂推理的脑区可能是不一样的,对此学术上依然没有弄清楚。现在出了很多这方面的论文,但是并没有给出统一意见,这是因为,大脑和大脑之间还存在着个体差异和民族、文化差异,被试者要经过一定的统计学处理之后才能去除这类差异。这种操作是很复杂的,而且成本很高,现在进行脑研究主要靠核磁共振成像,这是很昂贵的手段,不足以支持大样本研究。这就导致,现在的研究成果不是科学上要求必须这么做,而是经费上只能允许这么做。但是最终得出的结论却严重地僭越了自身的地位,夸大了自身的代表性。

    神经生物学告诉我们,人的神经元是具有文化可塑性的,上层的文化影响会在底层的神经分布当中得到体现,所以,对脑神经做科学研究,是无法剔除文化因素的影响的。人一旦早年处在某个文化共同体当中,神经受到了塑造,今后再想改变就比较难了。这在语言学习当中得到了非常鲜明的体现。日本人说英语比较慢,因为日语是动词后置的,而英语不是,所以他们说英语要做词序变换,导致语速变慢。这就是他们特有的语言编码方式。

    因此,你现在如果真的要创造一个大脑,那么它不能是生物的,而必须是硅基的。即使它的构成是类神经元的,也依然是硅基的,否则就是在克隆人了。如果你要对大脑进行抽象,你只能抽象出它的数学成分。这里面有个问题:纯数学不能构成对世界的描述。纯数学每个单位后面要加量纲,量纲要选择哪些东西,取决于你看待这个世界的视角和方向。这就是哲学和理论层面的问题。大脑其实是一层一层的,最底层是生物、化学的东西,再往上就是意识、感觉的东西。那么,任何一个生物组织,对它的数学模拟,到底是事后诸葛亮式、近似式的追问,还是能够把握它的本质?这是一个很可怕的理论黑洞,不仅是一个工程学黑洞,首先是一个哲学黑洞。这么大一个黑洞,你认为十年二十年能够把它搞清楚,你说风险大不大?比较稳妥的,还是去寻找一条可靠的路径。

    您觉得人工智能的可靠路径是什么?

    徐英瑾:首先应该放在自然语言处理上。但是,现在就连这方面的研究,也依然是在做大数据,比如翻译软件,它的处理方式就是看现有的译文是怎么翻的,然后它就怎么翻。这是完全不对的。正确的处理方式,是定下一个高目标:将日语写的俳句翻译成中文或英文,而且必须是当代作家即兴创作的俳句,而不能是松尾芭蕉这类知名诗人的、可以检索的俳句。翻译好之后,把美国最好的俳句专家找来做图灵测试。这个标准虽然很高,但并非不可企及,而且这是正确的方向。只是,如果我们把精力和资源都放在大数据上面,我们就永远也达不到这个目标。因为大数据都是从已有的经验出发,全新的领域它是应付不来的。美国的日本文学专家怎么译俳句?当然是先揣摩文本,进入语境,让自己被日式审美所感动,然后思考,美国文化当中类似的语境是什么。这里面就牵涉到对审美情趣的整体把握。什么是审美情趣?它是和物理世界分割开来的,还是随附在物理世界上的?这里面,又是一堆问题。这些问题不弄明白,仅仅是靠大数据,是不可能成功的。

    您前面谈了这么多,我看总结起来就是一句话:当下人工智能的发展,问题比办法多得多得多。

    徐英瑾:这是没办法的,打个比方,现在的人工智能的目标,是想要造出一个《超能陆战队》(Big Hero 6)中的“大白”那样的机器人,既然当下人工智能发展给自己定下了这么一个科幻式的目标,那么,我前面所谈到的问题都是必须考虑到的。实际上,《超能查派》(Chappie)这样的电影对人工智能的表现,我觉得是比较合理的,我也很赞同。它很清楚地告诉你,机器人也有一个学习的过程,很大程度上跟培养小孩是一样的。我构想的未来的人工智能,买回来放到家里你是要教的,而不是一开始就什么都会。前面说到OMG这部电影,里面那个外星人的思维方式就像人工智能,他的推理是严谨、科学的,但因为地球上的多神系统很混乱,他经常因为推理失误触犯某些宗教的禁忌而挨揍,挨完揍之后,他就迅速得出了更接近真相的结论。这样一个建立假设、验证、挨揍,之后再建立新假设的过程,实际上是科学家的做法,以自己被揍为代价,增进了对地球的认识。但是,重要的地方在于,他的思维方式仅仅是基于小数据:被揍一次之后立刻修改自己的解释;如果是大数据,他会想,被揍一次还不行,应该多被揍几次才能得出正确结论。生物体要是按照大数据的思维方式来的话,早就在地球上灭绝了。

    在您看来,未来的人工智能,或者说真正的人工智能应该是什么样的?

    徐英瑾:现在很多人工智能研究最大的问题,是不受视角的制约,但是,真正的人工智能是受视角和立场制约的。对机器来说,就是受制于预装的系统和它后来不断学习的经验,而预装的系统,就相当于人类的文化背景。我所构想的人工智能,是需要学习和培养的。AlphaGo当然也要学习,一个晚上下一百万盘棋,但那是极为消耗能量的学习。人工智能应该是举一反三式的学习。AlphaGo虽然强大,但是只能干下棋这样一件事情,无法干别的。

    当然,我并不是说,AlphaGo的深度学习技术不能用来做下棋之外的事,这个技术本身可以用来做很多事情。我的意思是说,这个技术一旦做成某一具体的产品,这个产品的功能就固定下来了。用乐高积木来打个比方,如果你是精于此道的高手,你可以拼出一艘航母、一幢高楼,但是一旦拼出了一艘航母,除非你把它拆掉,它就一直是航母了,不再会是高楼。类似地,一旦你用深度学习技术做出了AlphaGo这个专门用来下棋的机器人,如果再想让它去干别的,很多基本训练和基础架构就必须从头做起,这就相当于把拼成航母的乐高积木一块一块地拆下来,再拼成一艘航母,可想而知工作量会有多大。那么,问题来了:你是需要一个什么都能干,虽然不一定能干到最好的机器人呢,还是需要一个只能把一件事情做到最好,其他什么都不会的机器人?这两种机器人,哪种对人类社会起到的作用更大?

    不妨拿战争举个例子。未来的战场会需要大量的战斗型机器人。一个士兵在战场上遇到的情况是千变万化的。请问,难道只有医疗兵知道怎么救援吗?别的士兵也知道,只是未必做得有那么好而已。同样,医疗兵也会使用枪械。

    再拿家政服务举个例子,给中产家庭用的机器人,和给富豪家庭用的机器人,肯定是不一样的。AlphaGo这样的机器人怎么去迅速适应呢?关于围棋的输赢是有明确规则的,可是家政问题有规则吗?如果机器人给一个大知识分子收拾书房,打扫得太干净,他反而不满意,可能要拍桌子:“乱有乱的味道!书房怎么可以弄得这么干净呢?”但是你不给他打扫,他又不开心了,“书总归要码得整齐一点,蜘蛛网总归要扫掉吧”。

    所以,行为的分寸如何把握,是需要人工智能来学习和判断的。而人工智能如何学习和判断呢?这是需要人类去调教的。

    前面您又是举例子,又是讲理论的,谈了很多。最后,能请您简短地用一句话概括您对当下人工智能的观点吗?

    徐英瑾:少一点资本泡沫,多一点理论反思。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>