孙雯玉:关于语音搜索,我和很多人打了个7天的赌

孙雯玉,十年老百度人,百度多模搜索部总监。她和团队的主要工作,是不断优化百度语音搜索技术的体验,以更好地解决五湖四海的网民们五花八门的问题。

现在,她保持着每天早来公司的习惯,在开始一天的忙碌之前,看语音搜索流量数据以及近期的典型的case是每天的必修课。她说:“在安静的清晨,思考如何用技术和产品更好的满足每一个用户用不同的声音传递过来需求,是一件很奇妙的事情。”

她相信,语音搜索必将是未来的大趋势。每每被人问及为什么要用语音搜索,她都爱打一个赌:敢坚持用一周试试吗?你会爱上这种体验的。

最后赢的都是她。

前不久,在公司语音搜索技术的媒体见面会上,我抛出了这样一张数据图:

很显然,很多90、00后的年轻人已经爱上了语音搜索。这些在移动互联网时代成长起来的年轻人,比起在手机上那么狭小的空间上用键盘输入,他们更习惯的是触屏、拍照、语音这些新的交互模式。他们爱尝鲜爱分享,像语音搜索这种很多人眼里的新生事物对他们来说已经习以为常,已经自然而然地变成受益者。

我和记者们分享了一个真实的小故事:为了了解在校的中学生们对语音搜索的使用情况,我们负责用户研究的同学找了一个北京中学老师,拜托她协助我们做调研,在课堂上询问同学们谁用过语音搜索,谁了解语音搜索。结果非常意外,90%的孩子都举手了,气氛一下子很火爆。出了教室的门,老师脱口而出:这个东西竟然已经那么流行了,我不用是不是就OUT了?

为什么会有人爱上语音搜索?

和那位学校的老师一样,许多人会有这样的疑惑,我为什么要用语音来代替打字输入?更别说是爱上了。 这种时候,若问我的人,是关系亲近的朋友或者同事,我会半开玩笑和他说,你敢用一周试试吗?

屡试不爽的是,一周以后他会告诉我,他已经爱上了语音搜索了,打字太麻烦了!

之所以敢跟别人打赌,信心来自于我们的产品体验和用户数据的变化。在过去的这一年,我们把所有精力都放在了语音搜索的技术和产品的打磨上,在几乎没有做大的推广和宣传的情况下,语音搜索的整体用户量竟比前一年涨了三倍多,并且有很多用户转化成黏性用户并开始主动传播。一个用户一旦用上了语音搜索,依赖性就会越来越强,他在百度做的每10次搜索,就会有6次是使用语音搜索完成的。

在我看来语音搜索有四大特点:

首先,更快更便捷,说话比打字快十倍!
我们在百度搜索的日志中做了一个简单的统计,用户文字输入的速度平均是一秒钟一个字,用语音输入的时候是100毫秒一个字,语音的交互模式比原有打字模式快10倍。


第二,更自然,更偏口语化。

我每天都习惯早点来公司,看看流量数据以及典型的case,在安静的清晨,深入了解用户的需求,思考如何更好地满足他们的需求是一件很美妙的事情。”我想帮爸爸妈妈做一些家务事,可是他们总说我做不好,不让我做,我该怎么办呢?帮我出出主意吧。” “身高165体重120斤那么如果买裤子的话穿多少码的呢?”这些都是语音搜索的真实query,完全口语化的表达,用户不再需要抽象组织关键字,需要什么就直接自然地说出来。

第三,更直接,更丰富。

我的宝宝现在两岁三个月,想看动画片的时候,她会拿着我的手机,找到那个熊掌Logo和大大的麦克风,摁住说“我想看熊大熊二”,想听歌的时候她会说“卖报歌”,想听小动物的叫声,会直接说“狗狗的叫声”。很有趣的是,因为只有天气好才会带她出去玩,她竟然也会问”今天天气好不好”。语音搜索在给出搜索结果的时候,除了文字还会有图片、音频、视频,很多query下还有直接的播报。宝宝还不识字,但是可以自己找到想听想看的东西,会特别嗨,特别有成就感。

第四,零门槛。

我爸妈原来经常在我回家之后跟我说,能不能帮我查个东西。比如我妈,她自己找基金经理给她买一些股票和基金,她想看,但她自己打字输入不方便,就会跟我说你能不能帮我搜一下,然后帮我存起来,然后下次我一点就能看了。后来我做了语音搜索,我就教她,跟微信一样,直接摁住话筒说就行了,现在我爸我妈完全不需要我了。我爸妈是山东人,虽然他们不太会说普通话,但山东的方言会更贴普通话一些,所以识别上都没什么问题。

我讲的都是自己身边的真实故事,这些人群是刚需的人群,所以才能在我们没有做任何推广的情况下,他们还可以有那么高的接受度。对于所有人来说,我觉得尝试语音搜索其实是从一个好到更好的过程。还是那句话,你敢用一周试试不?

语音搜索最大的挑战是什么?

有一位媒体记者曾在采访时问我,百度语音搜索最大的挑战是什么?我跟他说,试想你对手机说:“能不能告诉我一下,明天北京的天气是怎么样的?”如果对“能不能告诉我一下”之类的表述不做语意分析处理,直接变成关键词检索,显然是不行的。如果再追问一句,“后天呢?”,如果搜索没有关联上下文,理解你的真实意图,你会搜到完全不相干的结果。

引用王海峰(百度副总裁)老师的话来说:“语音搜索是集多项人工智能技术之大成的成果。”语音搜索不是语音识别和搜索的简单相加,而是结合搜索的应用场景用搜索来弥补语音识别的不足,同时用强大的智能搜索的技术对互联网资源做进一步加工处理,得到一个更好的搜索结果。在我们研究语音搜索的工作中,背后最重要是三大技术是,把用户的声音转换成文字的语音识别技术,深入分析理解用户需求的自然语言处理技术,以及帮用户找到所求的智能搜索技术。百度已经有了非常强的语音识别技术,成熟的自然语言处理技术和积累很多年的智能搜索技术,而语音搜索的最难之处在于怎么样更好地把这些技术融合在一起,真正满足用户表达的这些更偏口语化的需求。

我从毕业就加入百度,已经进入第十个年头,我的整个职业生涯一直都在做一个事情,那就是搜索。前面的七年,我一直在百度最核心的搜索算法团队,跟随百度搜索业务一步一步成长蜕变,确定性很强,目标明确,价值明确。而我现在所做的业务,是面向未来的创新业务,创新业务要做领跑者,不确定性强,探索尝试的挑战很大,但是我笃信语音图像搜索这种多模交互的模式,必然是未来的大趋势。我希望通过我们技术和产品的努力,让更多的人享受科技进步带来的红利,让每一个人更平等便捷地获取信息,找到所求。

·氧分子网(http://www.yangfenzi.com)延伸阅读:

分享给您的好友:

您可能还喜欢…