拥抱神经网络,Siri语音识别能力将获大幅提升

国外媒体近日发布文章称,神经网络算法已然成为主流技术,可显著提升语音识别准确率,让科技巨头们的产品服务变得更加智能,如谷歌Android的语音识别功能和微软SkypeTranslate。唯独苹果Siri还没有拥抱该项技术,不过该公司已经获得了Nuance语音技术使用授权,也招揽了诸多该领域的人才,预示着获神经网络助推的Siri版本即将到来。

以下是文章主要内容:

神经网络

一切始于在加拿大不列颠哥伦比亚省惠斯勒的一次小型学术聚会。

当时的话题是语音识别,以及未经检验的新型机器智能——名为深度学习————是否可以帮助计算机更加准确地识别口头语言。该小型会议由微软赞助,举行于2009年圣诞节前,其中的两位研究人员邀请了世界知名的深度学习专家、来自多伦多大学的杰夫·辛顿(Geoff Hinton)发表讲话。

辛顿的理念是,机器学习模式可很大程度上类似于人脑运作。他想要打造“神经网络”来逐渐形成对口头语言的理解,该类网络也在越来越多地出现。神经网络曾在1980年代流行一时,但直到2009年它们才发挥出它们的潜能。

据微软研究部门主管彼得·李(Peter Lee)称,在惠斯勒,与会的语音研究人员友好对待该理念,但“兴趣并不浓厚”。那些研究人员当时已经开发了自有的算法。但在微软的团队看来,深度学习值得一试,所以该公司让一些工程师与辛顿的研究团队展开合作,用真实数据运行了一些试验。

彼得·李回忆道,试验结果“让人大吃一惊”——语音识别准确率足足提升了25%以上。要知道,那是一个5%的提升就称得上变革性的领域。“我们公布了那些试验结果,世界随即发生改变。”他说道。

如今,差不多5年过去,神经网络算法成为了主流技术,它们以全新的、令人兴奋的方式使得计算机变得更加智能。谷歌利用它们来强化Android的语音识别功能。IBM也用到它们。而最受瞩目的是,微软将神经网络应用于《星际迷航》式的Skype Translate翻译功能,使得该服务能够即时将你说的话翻译成另一种语言。

辛顿指出,“人们一开始并不相信该类技术,而现在我们的技术已经成为了主流。”

Siri将获升级

然而,有一家大名鼎鼎的公司还未转向神经网络算法:苹果,它的Siri软件将迎来升级。虽然苹果一向对其内部运营三缄其口,但该公司似乎已经从Nuance(也许是最有名的语音识别技术提供商)获得了语音识别技术使用授权。人工智能研究社区认为,Siri即将发生改变。

他们指出,很明显,苹果已经成立了自家的语音识别团队,获神经网络助推的Siri版本即将到来。

彼得·李对此很清楚。苹果去年招募了他麾下的其中一名高级经理阿莱克斯·阿塞罗(Alex Acero)。阿塞罗现在担任苹果Siri部门的高级总监,他曾在微软研究了近20年的语音技术。在微软,他的下属包括邀请辛顿参加那次学术聚会的两名研究人员Li Deng和Dong Yu。

苹果还从Nuance挖来了一些语音研究人员,其中包括Siri经理贡纳·艾弗曼(Gunnar Evermann)。爱丁堡大学研究人员阿纳布·戈沙尔(Arnab Ghosha)亦在被苹果招致麾下的语音研究人员之列。

“苹果不仅仅招揽经理级别的人才,还招揽团队领导和研究级别的悍将。”被苹果追求过的多伦多大学博士后研究员阿卜杜勒-拉赫曼·穆罕默德(Abdel-rahman Mohamed)说道,“他们在打造一支非常强大的语音识别研究团队。”

雅虎研究主管、曾帮助启动Siri前身项目的罗恩·布拉赫曼(Ron Brachman)指出,苹果的iPhone数字助手将远不止是依赖语音识别技术。微软的彼得·李认为,苹果要花六个月的时间才能赶上微软和谷歌,而开始使用神经网络会给Siri带来很大的提升。

“除了苹果Siri之外,所有的大玩家都已经完全技术转换。”他说道,“我认为,Siri转向神经网络只不过是时间早晚的问题。”

http://www.wired.com/2014/06/siri_ai/

译者:乐邦

您可能还喜欢…

1 Response

  1. Hinton 四问:一个重要的关注点是让神经网络真正理解文档的内容说道:

    Hinton谈到了真正的人工智能、人工智能威胁和深度学习的下一个进展等问题。

    国外网站gigaom 最近刊登了对Hinton专访的四个问题, 谈到了目前深度学习领域的几个问题:真正的人工智能何时实现、如何看待人工智能对经济和劳动力的影响和深度学习的下一个进展。

    1. 你被称为“神经网络之父”,你相信会在有生之年看到真正的人工智能出现吗?

    这取决于你对“真正的人工智能”的定义。如果你是指在感知、自然语言、推理以及运动控制等等方面都具有人类水平的智能体,那么,我可能看不到。但是,预测超过5年后的未来是很难的,所以我也不绝对排除能看到的可能性。十年前,大多数搞 AI 的人都很有信心,就是使用神经网络做机器翻译是没有希望的,因为这需要让神经网络从原始训练数据中获取有关语言的所有知识。但这就是现在的机器翻译方法,而且是最好的方法,神经网络翻译非常显著地缩小了机器翻译和人工翻译之间的质量差距。

    2. 假如真正的人工智能出现,你担心的是什么?

    我不大担心现在一些流行的说法,就是邪恶的机器人会接管世界之类的。我更担心的是希特勒或墨索里尼之类的人可能做的事情,如果他们装备有智能机器人,后果可能不堪设想。我认为迫切需要就这项技术的军事化进行国际协议。

    3. 你如何看待人工智能对经济和劳动力的影响?是有利还是有害?

    机械挖掘机和自动柜员机已经帮助人们减少了大量繁重的工作,提高了生产率,很少有人会认为不应该引入这些机器。在公平的制度中,提高生产力的技术进步将受到每个人的欢迎,因为它们将为每个人提供帮助,让每个人的生活变得更好。技术不是问题,问题是社会制度能不能确保每个人都受益。

    4. 深度学习的下一个大的进展是什么?

    目前,我们已经在解决一些困难问题上取得了前所未有的进展,这些问题在近半个世纪以来我们的前辈们不管多么努力也解决不好。语音识别现在非常好了,而且在快速变得更好。机器识别图像中对象的能力也取得了巨大的进步,我认为计算机很快就能够理解视频中发生的故事了。最近机器翻译都开始使用神经网络的方法。几乎每周,深度神经网络都会在新的、有商业价值的重要任务上取得成功。深度学习技术开端于 20 多年前,现在已经取得了非常惊人的成果。这些成果包括更好的神经元类型,更好的架构,使学习任务在更深的网络上进行的更好方式,以及使神经网络聚焦于输入的相关部分的更好方式。深度学习现在吸引了许多非常聪明的人和大量资金,我认为这种开花结果的过程还将继续许多年。

    我认为一个重要的关注点是让神经网络真正理解文档的内容。这可能涉及开发新类型的临时存储器,这是当前的热门话题。

    我们目前仍然没有解决的一个问题是,让神经网络从少量的数据中得到良好的生成,我觉得这可能需要彻底改变我们现在使用的神经元类型。最后,我认为通过应用深度学习得到的经验教训将能够让我们更好地理解真正的神经元如何学习任务,我预计这种洞察力将对深度学习产生巨大的影响。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>