王冠雄:智能语音助手或许会让手机成为最懂你的AI机器人

移动终端在经历过从功能到智能化的改变后,还能出现什么大的变革?脑洞大开的想象一下,或许移动终端的下一步是“人格化”。

王冠雄:智能语音助手或许会让手机成为最懂你的AI机器人

自打Siri推出智能语音助手,我们与手机交互的方式除了通过触碰小小一方屏幕之外,还可以用语音提出指示,有趣的是Siri还可以和我们有问有答,当人和手机可以对话,它就渐渐成了一种超越“工具”的东西。

【语音识别技术:从军用到民用】

如果说摄像头是机器的眼睛,那语音识别技术,就是机器的听觉系统。虽然它在近几年才以智能语音助手的身份走进我们的生活,其实这一技术在上个世纪五十年代就开始研发了。很难想象,现在和我们对答如流的语音助手,在一开始只能识别10个英文数字发音。

语音识别是如何实现的呢?简单来说,就是用转换装置把人的声音收入机器,在程序中和数据库的样本对比,将匹配结果转化为指令。

在PC时代,语音识别技术的应用还没有进入到寻常百姓家,不过在军事方面的应用,就已经预示了它将如何进入人们的生活。例如语音识别技术在航空飞行中的应用,可以让飞行员通过语音来代替手动操纵设备,从而把注意力集中更重要的地方。和PC时代不同,移动互联网时代我们不再整天守在电脑前,智能终端的应用场景十分丰富,人们常常会发生不方便用手来进行交互的情况,这时候语音识别技术就有了用武之地。

【Siri水土不服,中国话到底是有多难?】

最先让我们接触到智能语音助手的是军用转民用的Siri,不过从一开始,Siri似乎就是噱头多于实用性。

Siri的人工智能技术虽然还算成熟,汉语复杂的语义和多变的发音让它在中国多少有点水土不服。尤其面对中国各个地区的方言,只能识别标准普通话的Siri更加无力。目前网上传的最火的是如何“调戏”Siri,比如向Siri说,我爱你,它会回答“你对每款苹果产品都这么说吧”,或者是Siri中隐藏的小彩蛋,例如苹果系统更新时,对Siri说“告诉我点新鲜事”,它会自动向你介绍新版IOS系统的信息。说到底,Siri在中国,更像是一款供人消遣的手机宠物。

可是就像之前说的,我们对移动终端语音交互的需求切实存在,当Siri水土不服时,有没有有一款智能语音助手能够满足我们的需要?

氧分子网(www.yangfenzi.com)曾刊登:

➤ 孙雯玉:关于语音搜索,我和很多人打了个7天的赌

➤ 科大讯飞刘庆峰:人工智能全球决战未来十年

【灵犀语音助手,真正为用户提供价值】

我的建议是,还要把目光投向中国。最主要的原因就是,汉语实在太过复杂,任何一款不是用汉语作为基础开发工具、不由中国人作为主力开发团队的的智能语音产品,到了中国面对中国话,都会“变笨”。

而中国本土的智能语音助手,大多还都走的是实用路线。科大讯飞和中国移动咪咕公司推出的灵犀智能语音助手就是最好的例子。

科大讯飞在语音识别领域耕耘多年,拥有以汉语基准的巨大数据库,让灵犀智能语音助手可以灵活识别各种语境下的复杂语义,最接地气儿的功能就是它还会说五种方言。同时灵犀智能语音助手还有实时语音翻译功能,解决了出国旅游时沟通不畅的问题。还有当然语音拨号、查天气、订酒店订航班这类标配功能更不在话下。

和中国移动咪咕公司的合作,给了灵犀两样独有的功能。一是基于中国移动咪咕公司旗下咪咕海量内容库,灵犀可以给用户提供丰富的内容服务,听小说、查快递、听新闻等等,连接100多个垂直领域使得语音智能助手提供的内容更具价值。二是提供准确的移动客户服务,用户可以直接语音查话费、查流量等等,直接省去了繁琐的发短信、打电话步骤。

相比Siri一类“手机宠物”式的趣味性产品,我更看好灵犀智能语音助手这样实用型的产品。趣味性产品,是给用户提供甜点,而工具性产品,则是解决用户的痛点。只有成为工具、为用户创造价值,才能提高用户粘性,获得更多的流量。

有了中国移动咪咕公司提供的咪咕海量内容库,灵犀智能语音助手就有了成为连接的资本,一端是用户,另一端是庞大的内容,语音助手本来就是一个各种搜索引擎的集合体,作为连接,能给用户提供的价值越大,其自身的价值就越大。目前灵犀智能语音助手已经拥有了1.4亿的用户量,随着这个数字逐渐上升,智能语音助手也将有希望成为入口级产品。

据称,在灵犀智能语音助手的4.0新版本中,更是AI功能进行了优化,推出了“灵犀智能宝宝”,从单纯的语音助手变成了可感知、有学习能力和决策能力的人工智能,从而可以向用户推荐更精准的内容。在接下来的版本中,灵犀智能宝宝形象还会不断更迭升级。在面对互联网的海量信息时,率先可以替人类做出决策的工具更有可能抢占市场先机。

移动互联网时代,我们只需要两种东西一种是有趣的,另一种是有用的。记住,只有为用户提供价值,才能在这片丛林中生存下去!

【文/王冠雄(微信号:wang-guanxiong)】

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网(http://www.yangfenzi.com)延伸阅读:

➤ 脱胎于Bing 语音助手Contana背后的故事

➤ 微软语音助手Cortana明日入华 或与小冰联动

➤ 微软刚发Cortana 苹果就宣布收购一家语音公司

➤ 语音软件团队的智能家居尝试:智能360家庭版

➤ 科幻电影中的人声OS:Siri等语音助手的未来?

➤ Google发布AI助理Google Assistant,叫板百度度秘、微软Cortana

分享给您的好友:

您可能还喜欢…

  1. 语音技术只是语音助手的入口和出口(语音识别和语音合成),而语音助手只是语音技术的某一具体应用,这两者是不相同的。
    对于语音技术,可能大部分外人的理解还仅仅局限在语音识别上。事实上,当我给别人说起自己专业的时候,都是用“语音识别”(尴尬ing)。其实,语音技术还包括非常多实用的方向,比如说话人识别、语种识别、语音合成、音色转换、语音增强等等。

  2. 想象一下,当你回到家说一句“芝麻开门,我是xxx”,门就为你打开;你也可以对家里的电器说话,而它们(他们?)只接受你这个主人的控制,是不是有种真的当家做主人的感觉?而借助于语种识别,不管你说的是汉语还是英语乃至阿拉伯语,你的机器都能准确地完成你交付的任务;至于音色转换……当你想念一个美女或者帅哥的时候,你可以……咳咳……

  3. “语音助手”这个词还是有点过于狭义。如果我们仔细想想,所谓的“语音”,不过是作为人机交互的一种手段,“助手”更重要的是能帮你完成你想要完成的工作。假设你有一个聋哑人秘书,你每次都需要把要他做的工作写在一张纸上,而他则能非常完美地将你考虑到的、没考虑到的细节一丝不苟地完成,你能说他不是一个好秘书吗?(懒癌患者表示不是……)

  4. 作为语音识别、自然语音处理最完美的结合,我充分相信未来的语音助手有无法估量的广阔前景。这肯定不是我学科自信心膨胀啦,而是一点小小的预测。当然,这预测也仅是我个人的预测,真正的世界中还需要面对无数的困难与挑战。

  5. 我们希望有更好的语音识别性能,特别是在噪声环境下鲁棒的语音识别性能,别一句话听不懂让我说十遍;我们希望自然语音理解能做得更加完善,从我随意的口语中分析出我真正的需求,不要总是说“伦家听不懂啦,能不能换一句”,说一次是卖萌,说十次我就当你是傻了。

  6. 常喜欢乔布斯的一句话:“至繁归于至简”。手机硬件是这样,想必语音助手的未来也是这样吧。为了达到至简,还有很长的路要走。一个拥有所有APP功能的平台,想想还有点小激动呢。真心希望语音助手不要成为“21世纪的生物”(学生物的朋友们,真的没有黑你们)。

  7. 安卓那么多个语音助手没有什么统一标准用户量也比不上siri当然没办法收集到那么多数据来改善咯,当然墙外你用google now分分钟爽到哭的好嘛!!!国内也可以卸载以后装2.6(好像是这个版本记不清了)的手机语言改成英文再升级应该就可以用了吧。不过你说siri智能啊。。。。我家Cortana哭晕在厕所。。。。。对我就是软狗-。-

  8. 目前市面上出现的很多类似siri的软件,本质上需要解决的是两个问题,一个是语音识别,这个阶段已经包括有讯飞、盛大、google提供中文语音识别,其中还有很多小公司在做,在技术层面,从网上可以知道,语音识别技术世界上有开源的算法,经过不断优化来细微的调整,还有就是语料库,这个的积累更加重要,像智能360接讯飞的接口,智能360接近500万的用户量,给讯飞带去了大量的语料库积累,当然后续智能360也在和google、盛大加强合作,从反向链条来看,智能360将为谷歌和盛大语音识别带去巨大的语料库,这个对于语音识别公司来说,尤其是起步阶段的公司,将是非常宝贵无价的财富;

  9. 看看微软和谷歌,都有自己的搜索业务,同时也基于各自的搜索引擎打造了自家的ai,而百度,作为国内的搜索的老大哥,无论是在战略上还是在产品的趋势上都有必要开发这样一个ai,尤其是不能浪费自己做搜索在ai上面的优势