王馥芳:面向机器人的大规模知识引擎

近年来,随着计算机和网络技术的快速发展,诸多大规模知识引擎的创建在很大程度上改变了人类的知识共享和表征生态。受此启发,美国康奈尔大学和斯坦福大学的一些学者通过多模态大数据挖掘,创建了一种新的、主要面向机器人的、同时能供任何要执行任务的设备自由访问的大规模知识引擎:机器人大脑(RoboBrain)

机器人大脑:面向机器人的大规模知识引擎

在面向人类的知识数据库中,信息搜索是一件简单的事情,我们只需在电脑或移动终端上输入几个字就可以得到答案,在很多情况下,模糊和缺省检索也能解决问题。但是,对于机器人来说事情就没有这么简单。即便要完成最简单的任务,机器人都需要详尽甚而完备的操作细节。基于面向人类的搜索引擎所得出的搜索结果,机器人难以读懂。比如,要使机器人读懂“如何烘焙蛋糕”的搜索结果,除了指出常规的烘焙过程和步骤之外,还需要提供各种各样详尽的相关附带信息,如鸡蛋可以打破;打破鸡蛋流出的液体必须装在器皿如杯子里;杯子只有在杯口朝上的情况下才可以盛装液体;水来自水龙头,能够在壶或者微波炉里加热,且能够和蛋液混合等等。因此,要创建一个面向机器人的大规模知识引擎不是一件简单的事情。

在人工智能产业发展前景被普遍看好的当下,康奈尔大学和斯坦福大学联合创建了一个面向机器人的大规模知识引擎——机器人大脑,并为此创建了一个网站(http://robobrain.me)。这主要是一个供机器人学习和共享知识表征并执行多种任务的大规模知识引擎。

“机器人大脑”网站的首页显示,该知识引擎主要通过搜索互联网及其他一些数据来源学习各种概念:“它能解释自然语言文本,意象和录像;能运用其传感器来观察人类;且能通过与它们互动的方式来学习事物。”创建者相信,通过学习和共享大规模知识,不同的机器人能够在各种新情境下更快速敏捷地完成各种任务。“机器人大脑”的创建改变了机器人的深度学习方式。传统上,机器人学习的重心是规则学习。随着大数据时代的到来,机器人开始从规则学习转向多模态数据学习。

机器人大脑:使机器人深度学习成为可能

“机器人大脑”本质上是一个大规模众源(crowd-sourcing)大数据库,它所存储的知识来源多样,包括机器人在完成各种任务(如感知、计划和控制等)时所关涉的物理互动、万维网知识基础以及领先的机器人研究小组所创建的各种可学习性知识表征。

“机器人大脑”的创建在很大程度上改变了大数据挖掘过度依赖单一文本数据模态来源的现状。受制于技术局限性,面向人类的大规模知识引擎的数据来源主要是万维网中“结构化”的文本模态数据,而无法有效挖掘其他一些“非结构化”的数据模态如符号、图片、视频、音频等。“结构化数据”主要指能被数据库所理解的、可以被逻辑表征的数据,而“非结构化数据”主要指无法被逻辑表征的数据,主要包括多种数据模态:文本、图片或图像、触感、XML、HTML、各类图表或报表、音频和视频信息等等。

据资料统计,在大数据变革风起云涌的今天,世界约80%的数据都是“非结构化数据”。在云计算出现之前,传统计算机无法处理这些巨量数据。借助于以云计算为基础的信息挖掘、存储、处理和展示技术,我们可以在某种程度上有效地对其进行分析和计算。如此一来,“非结构化数据”的价值得到极大凸显。由于面向机器人的知识引擎在很大程度上是由“非结构化数据”组成的,而其本质上又是众源数据,因此,如何有效编码多种不同的数据模态并构建一个能与多种数据来源兼容的知识表征构架是“机器人大脑”面临的最大挑战。为此,“机器人大脑”诉诸于图表构架以解决不同数据模态之间的冲突和不一致问题。

研究小组将“机器人大脑”知识表征构架的创建看作是网络理论问题。他们把知识表征为定向图表,其中的节点以各种各样的数据模态体现,如图像、文本、视频、触觉数据或者学术概念等。“机器人大脑”是一个“无止境学习”的知识引擎,它不间断地实时获取以边集形式呈现的新信息,这些新信息通过和节点子集链接的方式得到表征。例如,“坐着的人可以使用杯子”这一常识概念可能会链接“杯子”、“坐着的人”和“能够使用”等节点概念(即检索的中心概念,以检索与该概念直接相关的概念)。任何在“机器人大脑”中搜索节点概念的机器人,都可以通过下载相关边集和它们所代表的节点概念来进行深度学习。

“机器人大脑”的核心是,不但让机器人通过搜索大规模知识引擎自我深度学习,而且意图使其将一个情境中学到的知识应用于其他新情境。例如,将“倒水到杯子里”的能力扩展到倒水到其他容器里,如倒洗澡水到澡盆里等。“机器人大脑”团队对于未来有着宏大的计划:让该知识引擎纳入更加多样的知识来源,如在线视频,并设想让机器人通过查询在线指引视频学会如何做各种各样的家务。

此外,“机器人大脑”着力于解决不同领域的研究挑战:机器学习、大规模资料处理、语言和对话、感知、人工智能和推理系统、体验和机器人学以及自动化。该知识引擎的创建有助于三个重要研究领域的工作:基础自然语言、感知和计划。这三项工作是很多机器人完成任务的关键要素。

机器人大脑:将进一步拓展人工智能产业前景

“机器人大脑”的创立,标志着人类在人工智能产业化的道路上又迈出了实质性的一步。虽然其在目前初创阶段,还面临诸多技术难题和构架创建挑战,但是,其在诸多方面的技术潜力无疑将进一步助推人工智能产业的发展。

其一,“机器人大脑”试图对不同数据模态进行有效编码和表征,此举意在试图实现“非结构化数据”向“结构化数据”的转换,以使之能被机器人学习、理解,进而运用其完成各种任务。此举不但极大地拓展了机器人学习的内容、深度以及学习的复杂性,而且革新了机器人的学习方式。经过多模态数据学习训练的机器人有望在智能化方面更加“类人化”,从而进一步加快人工智能产业化的发展步伐。

其二,“机器人大脑”试图在一定程度上消除机器人和人类使用者在信息共享中的障碍,此举有助于进一步增强人机互动的质和量,并加快人工智能和人类智能的进一步融合。

其三,“机器人大脑”试图把各种机器人任务公式化为各种问题,从而为各种人机交互任务的完成提供一个问题驱动的知识学习和任务训练数据库。此举有助于进一步提高机器人完成任务的概率,并可能催生出新的智能化产品。

其四,由于“机器人大脑”的数据来源多样,因此,其团队致力于构建一种能和多种数据来源兼容的图表表征构架。这个目标的最终达成将在很大程度上解决因多种信息源之间的冲突或不一致而导致的“数据不可读”问题,并将极大地便利人工智能大数据的挖掘、生成、存储、管理、查询、提取、处理以及展示等,从而拓展其产业化前景。

在“人工智能”已发展成一个商业前景广阔的产业的背景下,“机器人大脑”的创建无疑为其注入了一针强心剂。

【本文来源:《中国社会科学报》第742期 作者:王馥芳 北京外国语大学外国语言研究所】

·氧分子网(http://www.yangfenzi.com)延伸阅读:

谷歌联手富士康开展产业机器人研发

你知道搜索引擎的智商有多高吗?

当谷歌用机器取代人脑 我们的大脑还有何用?

塑造的未来科技发展的四股力量:分享、互动、流动、认知

80后博士赵世奇望人工智能创收益 开发百度智能机器人

面对传统新闻出版业的敌意,想要拯救新闻的Google该怎么做?

分享给您的好友:

您可能还喜欢…