搜狗公司搜索事业部总经理许静芳:搜狗汪仔的“大梦想”

2017年2月,搜狗汪仔机器人亮相江苏卫视的《一站到底》节目。汪仔一登台,立刻引起了人们的关注。汪仔能比人类聪明吗?汪仔会抢答吗?汪仔会最终战胜人类吗?人们带着各种疑问,在等待着结果。看到人们抢答时,甚至还为汪仔捏一把汗。

搜狗汪仔机器人

但是,汪仔的“知识库存”无疑是巨大的。比赛的结果证明,汪仔赢了。人们更好奇了,汪仔为什么能够战胜人类?它背后又有哪些技术支撑呢?

汪仔是搜狗公司研发的一款机器人(见图1),他能听、会说、会看、善思考(问答和聊天)。汪仔之所以能够在智力问答中战胜人类,其背后集成了搜狗的语音识别、语音合成、图像识别、深度问答和人机对话等多项人工智能技术。

图1 搜狗汪仔介绍

图1 搜狗汪仔介绍

《一站到底》是国内排名第一的知识问答类节目,主要内容是选手之间的知识问答淘汰赛。搜狗汪仔因为具有较强的问答能力,所以每期节目中人类选手最后的胜者会与汪仔进行问答比赛。汪仔在节目中能够通过语音识别和图像识别两路通道接收问答题目,然后利用深度问答系统找到答案后,再通过语音合成技术播报答案。同时能够利用人机对话技术和主持人、选手进行简单的交流,活跃现场气氛。根据当前状态的感知,汪仔还有一些简单的肢体动作和表情。从目前已播出的十几期来看,汪仔以压倒性的优势战胜人类,其中有一期是节目开播5周年庆,选手都是往年的冠军选手,汪仔也能轻松地赢得胜利。

汪仔的特异功能

提到知识问答的人机大战,大多数人首先会想到IBM研发的机器人沃森(Watson),它在2011年参加了美国著名的知识问答节目《危险边缘》,并战胜了当时的人类冠军。汪仔和沃森的区别是什么?汪仔背后的原理又是什么?

1.语言不同

这一点显而易见。《危险边缘》是美国节目,使用的是英语;《一站到底》是中国节目,使用的是中文。中文的自然语言处理与英文相比,在语言的特点、词法、句法上都有显著的差异。在相同的任务上,例如词法、句法分析,中文集合上的性能通常都比英语集合上要低10%左右。即使使用深度学习端到端的处理方法,这种中英语言上性能的差异仍然存在,说明中文自然语言处理的难度。汪仔是使用中文的知识问答竞赛中首个战胜人类的机器人,仅从语言上的差异难度就比沃森要大。

2.问题的输入方式不同

沃森当时不具备语音识别、图像识别能力,参加《危险边缘》时,节目组要给沃森直接输入文本。而汪仔使用的是与人类完全一致的输入方式,即靠“听”主持人念题和“看”题板,通过语言识别和图像技术将其感知的语音和图像转换成文字后再处理。虽然汪仔“进步”了许多,但两者所处的年代不同,技术发展的水平不同。

3.赛制不同

《危险边缘》的赛制明确规定,只有主持人念完题后,选手才能抢答,抢到者优先作答。如果题目未结束就抢答,选手还会受到相应的惩罚。这也说明当题目叙述完整以后,选手去争夺回答问题的优先权。相反,在《一站到底》节目中,只要开始念题,在任意时间点选手都可以抢答;而高手之间的较量,通常都在题目未完成之前通过推理出完整的题目并作答,比拼的是推理的时机和抢答的比例。所以,沃森一定是用完整的问题作答,而汪仔则具备根据部分题目进行推理,并回答出全部题目的能力。一方面题目的推理较难,另一方面推理的错误率会和问答形成级联错误,进一步加大问答的难度。

4.问题的范畴不同

《危险边缘》有历史、科学、政治等6类问题,每个问题也有明确的所属类别。而《一站到底》不限定任何问题范围,每道题也没有明确的所属类别。因而,《危险边缘》是一种封闭域测试,《一站到底》是一种开放域测试。

5.计算方式不同

计算方式并不是关键点,但由于有不少网友从计算方式角度去比较汪仔和沃森,所以有必要说明一下。沃森当时用了90台IBM Power 750的服务器集群,并把它们搬到了节目现场,在独立的局域网环境中使用。而汪仔在语音识别、图像识别、语音合成以及部分基于知识图谱的问答都是在节目现场完成的,基于搜索的问答是联网后利用搜狗搜索的线上服务完成检索后再进行计算完成的。

超越人类的知识问答

汪仔之所以能够成功,得益于搜狗的问答系统。这套问答系统从技术实现上分为两类:一是基于知识图谱的KB-QA,一是基于搜索的Web-QA。这两种方法在汪仔问答中均有使用,用于回答不同的题目。

KB-QA是将数据挖掘得到的知识利用知识图谱(通常是三元组)表示、存储,问答时利用语义分析(semantic parsing)的技术将问题解析成结构化查询语句,查询知识库并回答问题。这种方法与人类学习知识并运用知识回答问题类似,也是理想的机器问答的方式。但受限于目前的技术水平,知识图谱在完备性、时效性、推理、语义分析的实用性上还面临较大挑战,所以目前KB-QA能够回答的问题还非常有限。更多机器人解读:www.yangfenzi.com/tag/jiqiren

Web-QA是一种基于搜索的问答,利用全网无结构化信息,搜索与问题有关的所有信息(网页、问答对、垂直知识库等),并从相关信息中抽取精确答案。为了找到准确的相关信息及准确抽取相应答案,其中运用了非常多的自然语言处理、检索、语义匹配、信息抽取、机器学习等技术。同时,由于深度学习近来在文本上取得了一些进展,所以在汪仔中深度学习的应用也非常广泛,这点也与沃森有较大差别。Web-QA如果与人相比,有点像人的“死记硬背”,只不过机器的存储和计算都比人要快很多。

从图2可以看到汪仔背后的技术方案都可以在人的思考方式中找到相同的地方,那么机器和人对战,胜算如何呢?这里分两个方面来分析。

图2 汪仔问答系统结构图

图2 汪仔问答系统结构图

第一,问答能力

在这个问题上,人的优势是理解能力强,有常识,掌握较完整的知识体系;劣势是单个人的知识面有限,且在竞赛过程中情绪易波动。相比之下,机器的优势是存储无穷,发挥稳定,劣势是语言的理解、推理能力差。

以Web-QA为例。它在搜索的基础上,又新增了问题的理解和答案提取工作。这件事对人来说很简单,但对机器难度不小。例如,“电视剧《上海滩》中冯晋骁的人物原型是哪位上海滩流氓大亨?”如果将问题作为查询词,搜索结果能够返回很多的相关网页,但如何从搜索结果摘要或网页内容中直接提取出答案“杜月笙”这件事,对人来说简单,对机器就比较难。机器很容易误回答为“黄金荣”,因为他也是上海大亨之一。

单个人掌握的知识面是有限的,如果问题属于个人的知识盲区,那么他即使完全理解这道题,也完全不会回答,所以人欠缺的还是机器的存储和检索能力。例如,“按照传统,历届美国总统就职时会用手抵哪本书进行宣誓?” 的问题,绝大部分的人都知道答案,但对于 “唐代画界有‘韩马戴牛’的说法,分别是指善于画马的韩干和哪位善于画牛的名家?”掌握这个知识点的人就很少了。但这两个问题对于机器来说,难度相当。

另一方面,人的情绪波动也很有趣。在汪仔的研发中,曾经有几次线下与人类高手的测试,其中有一位选手,是《一站到底》的历史战神,答题水平很高。他与机器挑战中,如果他的比分暂时领先,其状态就比较放松,往往也是坐着答题。如果他的比分暂时落后了,他就会很紧张,下意识地由坐着改为站着,精神高度集中,答题的能力也相应增强。而机器显然不会受到情绪波动的影响。

第二,抢答能力

《一站到底》的速度是制胜的关键点,怎样在获取相同信息情况下答题的速度要快?答题的时机要尽量提前呢?搜狗研究中心做了不少工程工作,包括提高网速,对语音识别和图像识别做流式增量识别,检索速度优化等等,基本做到接收一段新的语音音频(通常100ms左右一个语音包)后,可在200ms内完成一次问答,这个耗时,人是很难察觉出来的。然而考虑到人的正常语速,主持人大约1分钟说120字,那么说一个字耗时500ms,所以,如果能够提前对手1个字推理出问题并作答则具有绝对的优势。所有在汪仔的研发过程中利用尽可能少的信息去回答问题是一个重要挑战。

人和机器在推理上的能力也有很大的差异。人机测试中有个问题是“《鹿鼎记》中哪种毒药让瘦头陀变得身材臃肿非常矮小?”当时人类选手非常快的并正确回答出“豹胎易筋丸”,而机器却慢了一些。为什么呢?后来在与选手交流过程中得知,选手具备一个背景知识,即《鹿鼎记》中只有一种毒药,所以当题目念到“鹿鼎记中哪种毒药”时,人类选手就可以推理出答案并正确作答了。这种背景知识的获取和推理对机器来说还是非常困难的。在考诗词的上下句时,有一个有趣的现象也反映了人类思维的模式。经过多次测试,我们发现,如果给定诗词上句,考下句,通常人回答较快,基本是直觉反应;而反过来,如果给定下句考上句,人就需要相对较长的时间来反应,而机器能够稳定作答并胜出。

通过多种算法和工程的优化,在《一站到底》的赛制下,汪仔答题的精度约为90%,召回率约为90%,而历史上的人类冠军,答题精度约为90%,而召回率约70%。有趣的是,根据沃森的公开资料,它当时的精度和召回率约为90%和70%,它也战胜了当时的人类冠军。可以看出,几年过去了,人类在不同的语言环境下答题能力相当,变化不大;而机器,由于技术的不断发展,机器的能力又取得了长足的进步。

图3 汪仔抢答功能流程图

图3 汪仔抢答功能流程图

汪仔的“大梦想”

在《一站到底》这种问答节目中,汪仔已经具备了超过人类的水平。未来,汪仔还将开启一些新的能力,例如回答看图题、音频题等等,继续提高理解、推理能力。但这些还远远不够。汪仔参加《一站到底》是对搜狗的人工智能技术的一次集中展现,向观众展示了搜狗具备的能力。但回到现实中,《一站到底》并不是用户的真实需求,对人对机器,都仅仅是能力的一种展现。搜狗公司在人工智能战略中,一直在思索和追求的是,如何利用人工智能技术去做一些有用的产品,而结合搜狗的两大核心业务搜索和输入法,我们坚持不懈地利用最前沿的技术去打磨产品,从而给用户带来更好的服务。

搜索引擎已经成为人们获取信息、知识的一个最重要的工具,审视用户使用搜索引擎的过程,其中还有不少需要突破的地方,我们认为变革的核心是 “从搜索到问答”。 主要包括两方面:问题的变革。目前用户提交给搜索引擎的查询请求仍以关键字为主,这是长期以来受技术能力的限制,用户和搜索引擎之间形成的一种默契,因为在早期,关键字往往能够得到比自然语言问题更好的搜索结果。随着相关技术的突破,未来用户将更多地使用自然语言问句,人与搜索引擎的交互将逐步走向人与人之间的交流方式,特别是在移动、语音交互的场合。另一方面,答案的变革。从搜索引擎诞生的第一天起,搜索引擎返回的“答案”一直是若干条结果的链接,这就需要用户人工阅读一条或多条搜索结果(网页),并人工整理出答案。严格地说,现在的搜索引擎并没有返回答案,答案的获取是采用“人机结合”的方式得到的,即机器负责在全网信息中找到尽可能准确和多的相关信息,而由人来最终判断出准确的答案并为人所用。这种人机结合的方式,效率显然不高,特别是在移动环境下和在屏幕小或没有屏幕的情况下。汪仔已经在《一站到底》的特定环境下,实现了直接给出答案,但用户在搜索引擎中的真实需求更加口语化、更加开放、情况更加复杂,所以在真实的搜索引擎中能够针对用户的自然语言问题直接给出答案面临着巨大的挑战,这也正是搜狗搜索努力的方向。

目前较热门的个人助理方向也有相似之处。纵观目前个人助理落地较多的应用有两种:一是命令的执行,与操作系统结合能够完成一些操作,例如打电话、上闹钟等;与垂直领域相结合,能够完成一些服务,例如订机票、打车等。我把这种功能类比为“秘书”,更多的是执行用户的命令,而谈不上交流。第二种则是情感陪护的闲聊,它能够与用户进行一定程度的情感交流,但针对特定的问题几乎不能提供正确的知识与信息,例如北京市长、大学申请条件等等。我把这种以情感为主的交流类比为人类交往的“蜜月期”,大多数人群对这种交流的需求有限。那么,人与人之间更多的交流是什么呢?我们认为是人与自己的亲人、朋友、同事之间的交流,就他们所关心的事件、知识、经验所进行的探讨,它一定是有信息和知识来支撑的,其中除了情感维护,还有很多思想的碰撞与交流。用全网的信息与知识支撑的、能够与用户进行自然交互的问答,真正成为人类的“良师益友”,这正是搜狗汪仔背后的“大梦想”。

作者:许静芳,搜狗公司搜索事业部总经理,负责搜狗搜索的技术研发,在信息检索、数据挖掘、自然语言处理等方向有着丰富的研发经验。2016年带领团队开发搜狗汪仔机器人,在中文知识问答上首次战胜人类。

来源:《中国计算机学会通讯》2017年第5期《动态》

·氧分子网http://www.yangfenzi.com)综合整理

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网http://www.yangfenzi.com)延伸阅读:

➤ 从技术男神李彦宏选择《最强大脑》,看下一代搜索趋势

➤ 中国科学技术大学首届“墨子论坛”开幕 共话创新驱动、人才引领

➤ 后 ImageNet 时代:李飞飞视觉基因组重磅计划,新一轮竞赛!

➤ 首席科学家吴恩达离职或加盟Drive.ai 王海峰任百度AI技术总负责人

➤ 雷鸣对话吴恩达:超级大咖深度解析人工智能的发展现状与未来

分享给您的好友:

您可能还喜欢…

3 Responses

  1. 专访王小川:有机会愿与百度较量人工智能,上市仍在沟通说道:

    搜狗王小川就人工智能差异化和上市谈谈搜狗的现状,以及对人工智能和业务发展方向的理解。在昨天刚出的搜狐财报,在广告业务、在线游戏的一片亏损中,只有搜狗还在坚挺着相对平稳的增长趋势。2016年全年,搜狗营收44亿元人民币,同比增长19%,非美国会计准则下的净利润达6.4亿元人民币,根据最新汇率约合9300万美元,相比2015年1亿美元净利润,同比下滑7%。其中,2016年第四季度,搜狗营收11.7亿元人民币,同比增长11%。

    去年中国的搜索市场上风波不断。“魏则西事件”后,对于搜索引擎内容推广是否应定性为广告的争议引起了广泛讨论。《互联网广告管理暂行办法》的出台不仅规范了搜索广告的定义,也对搜狗的利润造成了一定的影响。这是本季度有点下滑的主要原因。但王小川对下个季度的财报保持乐观的态度,认为会有一定的增长。

    今年年初,微软“华人第一高管”陆奇空降百度,百度人工智能“小度”参加电视节目《最强大脑》也吸引了不少人的目光。与此同时,搜狗的人工智能“汪仔”也开始亮相在公众视野当中,第一站也是一个与人类争锋的电视节目——《一站到底》。

    同处于搜索行业,王小川如何看待现在的百度与搜狗的区别?百度将人工智能定为核心战略,搜狗又达到了什么样的成就?推出英文搜索后,搜狗怎么进一步寻求搜索份额的突破?这些都成为了亟待王小川解答的疑问。

    以下是搜狗CEO王小川与搜狗首席科学家许静芳在记者沟通会上的全文速记,我们疏通了一下文字,划了重点:

    王小川:挺高兴有机会和大家面对面谈,有段时间我们和媒体没有亲密的接受任何一个这样的访问。回顾从2013年到2016年,13年搜狗与搜搜合并,到现在已经三年的时间。

    我第一个感慨是,搜狗搜索活下来了,2013年合并时,360的一些言论,说中国搜索市场只能容纳两家,没有第三家的事情,表达第二家是他,现在看起来,在中国百度依然还是很大,此外搜狗是唯一一家既有PC搜索也有无线搜索,市场份额、收入利润在上升的公司。这也是我们活下来,而且不断地有更多竞争力的原因。2016年利润是6.4亿人民币,其中投入到很多领域去,在搜索行业算是活下来的。

    具体看量,我们可以号称叫全球第三大搜索引擎,虽然只做中国市场,因为Google最大,百度第二,我们第三,从搜索量排是在第四,后面才是其他家引擎,想说量上中国市场是最大的,在国内第二,在全球排第三的位置。

    2015年,我们发布了微信搜索和知乎搜索,2016年,我们发布了明医搜索和英文搜索,慢慢开始和百度走向不同的道路。大家用微信会用一些。我认为,医疗搜索和英文搜索是通向未来两个很重要,可以展开无限想象力的事情,通过微信搜索和知乎搜索基本固定了形态,在医疗往下出现自助诊断甚至分诊,能够让用户真正明明白白看医生。现在大家拿着化验单可能不知道什么意思,给你个诊断方向你不知道怎么办,或者发生头痛感冒不知道怎么办。这是借助大数据下,在AI分析里逐步走向辅助医生或者让用户和医生之间建立更多信任的工具。我们知道,国内之前有很多做医疗的创业公司,基本觉得把这个市场做坏了,把医院医生搞得很疲惫,因为大多数逻辑,是希望医生脱离医院出来在线做诊断,他要形成对用户的吸引力,也要建立后面的商业模式,这是原来的一点。

    但是我们没有这个需求,因为我们本身有用户,用户需要解决诊断的问题。我看到一些医疗机构,大部分来讲,上不接用户,下不接医院,就是医院不是他的,用户也不是他的,在中间是没有竞争力,他想把医院拉到自己这边,吸引用户,医生是没有办法独立于医院的,这是之前创业者出现的问题。但是我们有用户,我们代表用户找到医院,找到医生,这样的模式能够真正有机会成立。而且我们在医疗上也没有创业公司赚钱的压力,因为对我们而言,只要用户认可搜狗搜索,有足够大的搜索量,搜狗搜索有良好的商业模式,只要量大,给用户搜索产品就行了,而其他创业公司会面临压力,第一是没用户,第二是基于资本压力创造赚钱的模式,这也使得搜索引擎公司在医疗服务里能找到自己更好的位置。

    我会认为百度会变得更难,因为百度现在毕竟市场份额大,他会把广告模式转成免费为用户提供多种咨询的模式,收入会下滑,我们没有这方面的压力,这是关于医疗上的思考。

    另外,我们从英文搜索走向海外搜索,这周内我们会有两个升级,一是英文搜索升级成海外搜索,最后搜索的结果也是用中文呈现,以前我们大家谈到的事情是,去年有几十个院士跑去给习近平写联名信,希望能对谷歌网开一面,如果科技工作人员不能用谷歌搜索海外科技信息,中国和世界是脱节的,国内的科技发展就会受制约,我们可以不看国外的美剧、韩剧,但在国外科技、信息层面不能落后。但我认为不够,即便开放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括医疗信息、科技信息,甚至大家言论上的讨论都发生在英语世界里。

    在这种情况下,把英文变成中文以后,我相信,98%的中国人才能更好享受全球的内容,因为我们最强的是语言部分。正好这个时代到了,去年在AI爆发一年到年底时,翻译技术是突飞猛进的,比原来的翻译有快速的发展,就像语音和图像突破,翻译技术突破了。因此,我们有机会把翻译和搜索做一个联动,因此我们说搜索全世界。一个中文输进去我们现在开始搜索的是全球的英文,然后我们未来考虑把全球的日文或其他文字的信息都搜索到,这样会构成一个独有的竞争力,这是Google并不care的东西,因为英文是他们的母语。这种情况下,在翻译上更多是秀研究的肌肉,Google秀8国语言的互译,秀的是如果没有语料,没有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻译,他们是在做这样的事情,和我们的目标不一样。我们是实实在在希望通过翻译技术把搜索做得更好,海外搜索也会成为搜索竞争中的差异化。

    第一次从微信内容开始,我们开始和百度不一样,开始有了知乎、明医和海外,这周升级完之后就可以完全用中文完全浏览世界的网页,不仅是搜索的词用中文搜索,结果也用中文呈现,点出去的链接也全用中文来看,在一些场景里应用也更加方便。我们内心对这个事情有蛮高的理想,先不说赚钱的问题,因为地球上中国人是最多的,但是我们很不幸,在200年来发生的变化,英语成为世界主要沟通的语言。这么大的人群和世界主要语言有隔阂,使得用中文搜索世界,我认为,对中国整个大的复兴、成为世界主旋律的一部分是有历史意义的,我们内部叫重写《通天塔》的故事。《通天塔》就是讲语言不通,使得各个国家的人没法联合起来做事情,语言通畅了之后会带来一个新文明,就像发明火、发明电一样,所以我们2016年在搜索做了很多的工作,从AI也是武装到牙齿。

    去年有个很著名的AI媒体负责人跟我聊,中国现在有两家是在AI上最努力做报道的自媒体,其中一家问,搜狗要转型做AI了,我听了一肚子火。因为搜索其实就是AI,它就是让机器像人一样去思考,搜索引擎变得很聪明,能够帮我们选择出更好的页面来。陆奇刚刚去百度,放出一句话,说搜索是AI最好的场景,搜索和AI是天生在一块儿的。今天在做AI的很多公司,大规模做机器学习、深度学习方面,人才方面也都是找搜索公司去要人。因为有了深度学习之后,会使得搜索场景有更好的武器来满足,甚至升级这样的能力,而我们内部的员工大部分受过正统的训练,怎么用这种数据和方法,大家都知道怎么读论文去提升,我们没有Google或者DeepMind那种能力里面,属于开创出新的算法出来,但基于上面的算法去改良的能力是足够的。

    AI里,我们在翻译里面是往前在走,输入法之前也是很容易地开始做语音输入、图像输入,我们现在语音输入量是全中国最大的,而且比其他家加起来还要多的份额,1天2亿多次语音识别请求。在AI时代里,大家的理解不只是语音和图像,AI里面最难的地方是人的思想和知识的学习,不仅是图像的识别,语音的识别,人最宝贵的不是图像和声音,人的难点在于知识的理解和推理能力,而这种能力是靠语言体系来支撑的,靠语言来支撑对知识和思考的表达。搜狗在这里面天生是两个场景,一是输入场景,让大家用语言表达,二是用语言获取信息。因此,我们在AI场景里细的分类是分在自然语言里,自然语言代表了对知识和思想在这里面的人工智能,这里面是人工智能最难的一块。

    往下的思考是几个事儿,通过语言将搜索升级到对话系统、问答系统以及翻译系统,这是我们核心能力的三部分。包括《一站到底》,可以认为是搜索对未来的模式,就是提问题,不是给你10条链接,而是给你1个答案,实际上《一站到底》的场景相对比较窄,我们在问答处理能力上是比较宽泛的,不仅能找到实体,能在里面做更多的运算,《一站到底》是演示下一代技术中间的场景。对话系统也是今年的一个重心,翻译系统,我们会把这种能力不仅用到移动互联网,未来在智能硬件里也会大量地使用我们的一些能力。以自然语言为核心,我们做语音也是把它翻译成语言,语音识别是从语音到语言,合成是从语言回到语音,但处理的核心是语言,我们要把语言的能力,结合语音、图像和其他方式放到手机之外的硬件里。所以,我们AI的逻辑不仅是放在输入法和搜索里,产品形态里有几个关键词:输入法,搜索,自然语言的计算,自然的交互。他们支撑的地方是对话的问题,问答的问题以及翻译的问题。我们希望在这几个场景里,大家都能看到搜狗的声音,尤其硬件、IoT到来的时代,无处不在会有交互和机器智能,这是对未来的判断。

    以上是搜狗过去所做的事情,以及往下对人工智能和业务发展方向的理解。

    记者:川总,您刚才也提到,当百度把陆奇招过去这个事儿你怎么看?有压力吗?刚才你讲到搜狗这么多细分领域的技术,语音识别领域有科大讯飞等,感觉你进入的领域很多,竞争对手也有很多,这方面你是怎么来看的?

    王小川:一来就提两个竞争的问题,一个看百度,一个看讯飞。首先陆奇,我比较多跟他打交道,搜狗之前做海外搜索,英文海外检索部分是和bing合作,也是和陆奇谈的。陆奇有两个很大的优点,一是技术理想主义,和他聊天能看到他一谈到新的算法就两眼放光,半夜两三点去读论文,是个很好的技术人。二是也不官僚,跟他谈东西,也不会摆在全球华人最高职位上,而是非常平易和我们去谈的。这是他的两个特质,对他蛮尊重的。

    关于科大讯飞,我认为要明确,科大讯飞是to B的公司,基因是做企业的事情,我们是做toC的公司,是和消费者、网民能产生一种连接,大家基础的技术竞争力方向是不一样的。

    搜狗的技术是全能力的技术,语音识别大家听科大讯飞比较多。但目前语音识别里,用户使用量最大的,是搜狗,远远大于科大讯飞,在输入法里已经用到了。做技术现在需要两件事儿,一是有数据,二是有研发AI的能力。数据能力上,我们是有优势的,研发能力我觉得搜狗也没有弱的地方,尤其深处北京。从我们的应用场景到数据积累、技术能力,我自己评估一下我们都占优势的位置。

    去年我们已经开始领跑了,在乌镇大会上做同声传译。现在和搜索产品结合,也上线了fanyi.sogou.com或者translate,现在已经公开了。和讯飞的比较里已经不是关键问题,我们现在明确和两家公司作对比,一家百度,一家Google做对比,我们有信心比他们要好,直接线上能看的。无论是语音识别还是在线的翻译,我们都比他们好。而这几家我认为,讯飞发出来同声传译的系统来,其他家还没有。们是更早使用这个产品,发布的场面也是更加官方的(乌镇互联网大会),今年会有更多的场合会用到。马上就到十九大了,我们在更严肃场合是敢去用我们产品的,搜狗的语言和翻译已经处于领跑的位置。

    记者:刚才听了王总的介绍说,海外搜索有升级,请问这里面有什么样的技术?

    许静芳:5月份发了英文搜索,2017年1月份发的是由英文搜索升级为海外搜索,刚才川总介绍过,英文搜索的背景是,世界上有更多更好的优质信息在英文世界,中国用户因为各种各样的原因接触、触达到英文信息并没有那么便捷,所以我们和bing也有合作,在国内发了一款非常好的英文搜索。但大部分中国人在消费英文内容时比中文还是要困难一些,便捷性没那么强,速度没那么快。5月份上线时,我们就有一个功能,把中文query翻译成英文query再找英文结果。5月份魏泽西事件比较热,关于滑膜肉瘤,有很多医学的术语,你也不知道,中国的信息不一定全,不一定对,我想去看国外的。那问题来了,滑膜肉瘤怎么搜,怎么拼,很多用户是这样的反馈,一个常见的路径是先翻译后搜索。当时我们发布英文搜素时就有这样的功能,自动把query翻译成英文query。我们自己也发现,搜索中文结果非常快,扫一眼就知道哪条是你想要的,然后点开详细去阅读,当看到英文或不熟悉的领域时就会慢下来。

    我们这次升级为海外搜索的时候,就希望把这套系统做成一个闭环,引用中文query翻译成英文query,搜到英文内容之后再翻译成中文结果。这是目前唯一商业系统能够把翻译和搜索真正结合起来的系统,翻译用的是搜狗神经翻译技术,在检索部分是搜狗和bing一起合作的。这里面会出现很多新的问题,查询词是很简短的,会有歧义,英文查询词还好。会发现,搜索结果出来以后,搜索结果有标题,有摘要,里面有很多省略和专有名词、细节去处理,包括很多开放域的翻译,十条结果一起翻译出来,内容宽广性和实时性上都提出了比较大的挑战。

    王小川:我补充两个场景,用户也用在线翻译,在线翻译之前的品质是不够的,以前用起来翻译,觉得比我自己翻译的差,但现在发现机器比我翻译得好,这已经过了一个门槛,是很重要的变化,翻译的技术现在做到是能够可用了。第二,也有清晰使用的场景,我们两个场景在做,比较重点的是搜索里面去用。

    记者:搜狗面临一个问题,不知道你输入时问题会面临各种各样的可能。

    王小川:是的,第一让翻译可用,第二让翻译找到可用真正的场景,这件事情都是在全球首次做到的事情,以前在线翻译总觉得离人的使用始终是有距离的,现在我们已经做到了。所以,我还是蛮兴奋的,现在我们的翻译品质已经到达了相当的高度。中间有些技术的细节,学术界一直在讲“跨语言检索”,研究界是属于“叶公好龙”一般的,龙没找到就在那儿做研究。我们这次真把龙给捅下来了,发现里面的问题比学术界想的多得多,以前有大量研究里没有考虑的问题,龙比我们之前想的还难,我们做了很多解决的工作。

    许静芳:搜索是开放的,对翻译的要求,对适应的领域非常多,同时它非常简短,是有歧义的。曾经有一个case叫宝姿,宝姿翻译成英文是PORTS,你拿PORTS检索就发现,PORTS除了宝姿还有计算机端口,真实世界物理港口得意思,这样搜索结果就会发现多样性变化,搜索结果就不一定能直接满足用户。还有搜索结果的翻译,每条结果里都有个PORTS,哪些结果应该翻译成港口,哪些应该翻译成端口,哪些应该翻译成品牌?都是问题,所以在研发过程中有一些非常有意思的问题存在。

    王小川:现在拿到英文摘要,整句翻译成中文大家知道经常翻译的是不准的,现在大家经常拿整句和缩略的句子拿过来翻译,让我们的产品来干这种活。

    记者:之前有消息称搜狗将在今年IPO,请问现在搜狗投资方之间是否达成了一致的一件?上市计划进展到哪一步了?

    王小川:搜狗目前有两个战略投资人,一个是搜狐,一个是腾讯。战略投资人与财务投资人不同,他们并不追求上市之后收益的最大化。对于搜狗上市问题,投资方之间已经达成了初步的共识:搜狗现在上市是阶段性的成功。但是中间还有大量的权益问题的讨论,所以现在并没有一个时间表。但是现在多方在沟通当中,这是和去年最大的不同。这是变化。

    许静芳:现在产品的摘要和缩略是按字节数的,有可能单词是不完整的,只能看到一半。人结合上下文是可以理解的,如果拿之前的机器翻译系统来说一定是不认识的,我们借助最新的神经翻译技术,单词你只看到一半,它可以也具有人的特点,它能结合上下文能猜出内容,也能够翻译对。当然这个阶段以后也会带来新的问题,很有意思。

    记者:跨语言翻译,翻墙之间一字之差,我们怎么区分?我们刊是国外的刊,有大量的英文,我们组织了很多翻译者在其中,每个月都会翻译那边的英文,如果用了搜狗的产品,是不是就意味着这些翻译者不用存在了,直接到美国的网站翻译过来就可以了。

    许静芳:翻译并没有跨过那道墙,还是要符合中国政策法规。

    王小川:举两个例子,用传统的过滤方法或监管方法,没法处理的东西,没法展现一个系统,可以举几个例子。

    许静芳:墙我们是帮你翻的,如果我们做的技术还有缺陷的地方,会发现这个结果在墙外依然是打不开的,不会借助搜狗搜索就把通常不能打开的打开了。如果老有墙外的东西展现在搜索结果里,用户又打不开,这个体验非常不好。我们做的工作分两个方面,一是把墙外的结果去掉,不展现在结果了。所以,哪些结果在墙外,哪些结果在墙里,我们有很多服务器,机器可以帮你自动探测哪些页面可以打开,哪些页面不能打开,不能打开的在墙外在结果中直接给过滤掉。二是有少量能打开,但有一些敏感信息是不符合政策法规的。政府有指定的词,不一定该让中国网民搜到,但这种词符合中国规定时都基本用的英文,我们上线时做了很多细致的工作,翻译成拼音,翻译成英文。翻译成拼音时就可以有很多的技巧,比如一个人名,每一个字单独有空格,怎么写,姓和名哪个在前,有很多种写法,我们用能想到的各种情况去预防这件事情,包括搜索结果里敏感词的翻译,中文词和英文词匹配的方法,尽量把大家不应该看的东西不在搜索结果里展示。

    记者:现在搜狗有知乎、微信以及海外垂直类产品,我们往往会把它当成垂直类搜索平台,但在通用搜索这块,是不是意味着我们不太做了,发搜狗力点没有在通用搜索上?而是直接通用类型的垂直类搜索。

    王小川:可以理解为三点:第一,用户用垂直搜索时,这种垂直搜索是最明显产生区别的地方;第二,我们会把这种垂直的内容也融合到网页搜索里,让搜索用户更加方便,这像当年百度做音乐mp3搜索,得到用户的认可。我们是做文本信息的,不管是医疗信息、还是知乎信息,还是海外信息,能更容易和网页结合,能带动网页搜索本身品质的提升,网页搜索也会带来这种差异化;第三,我们专注在往问答迈进,今天搜索引擎的使用方式是关键词,给你10条结果。给关键词最早不是网民的第一选择,1999年,网民是愿意用句子的,比如“我长的好看吗?”这样去搜索东西,但以前发现不灵,机器听不懂。所以,网民被培养着怎么琢磨用关键词搜索,这是人适应机器的过程。就像用键盘和鼠标,没有自然的交互方式,人要学者用键盘,打拼音,打五笔。今天大家用搜索的方式也是关键词进去,是被迫的,往下的方向是让你用完整的句子来表达。

    接下来不管是手机场景还是更多IOT时代未来场景里,我们会恢复到更多用自然语言与机器沟通,做完整的提问,这需要我们用技术对用户做更深层分析的,这个逻辑关系是怎样的。这是四个垂直以外在研发里重点的工作,逐步还原,让用户的语言更加自然。

    Google之前提到,未来70%的query是用问答,即给answer的方式,不是给你10条链接。这样用户会变得更加方便。这是我们研发的重点,我们也投入蛮多的技术力量来做,也有很多家(公司)在做,我们应该是最认真的一家公司。今年在江苏卫视节目里有《最强大脑》和《一战到底》,《最强大脑》相对火一点,我们当时做选择。最后百度选择的是《最强大脑》,里面演示的是听觉和视觉的识别,走向识别的功能;而我们选择和《一战到底》合作,走向问答、是自然语言的处理,一年时间里有52期,一年中不断升级。我们做的是搜索里的问答系统,里面有子集,这个子集产品会放到《一战到底》里去做,会以问答形式进行。但带动我们在问答里继续往下进行,所以,垂直引擎有用,垂直引擎可以放到网页里用,同时我们自己也在升级。

    记者:百度现在也在做人工智能,但他们做的人工智能和搜狗做的不太一样。搜狗是围绕搜索去做,百度更多强调图片,让它承担更多的功能。我比较感兴趣的一点,搜狗的唯一结果什么时候能够出现?2017年,搜狗人工智能上都有哪些大的动作?

    王小川:我希望,10%的搜索结果会直接给你一个搜索结果,我会给其他条目,但你只看一条就够了,这种结果在比例上是不断提升的,这是我们内部的思考。你也看到大家人工智能选择不一样。我们不叫以搜索为核心,而是以自然语言处理和自然交互为核心,交互的目的是为了回到语言里,这是我们的选择,而不是图像和语音。战略选择确实有不同。但我认为百度是没战略的公司。

    记者:刚才您提到汪仔,汪仔用到了哪些前沿的技术,接下来和《一战到底》还要进行哪些内容合作。刚才提到海外搜索英文资料,现在国外旅游的人比较多,有没有用搜狗搜索和导航软件结合的设想和海外应用的设想。包括地图,有时候在海外我看地图也要看半天,这方面搜狗有没有考虑?

    许静芳:关于《一站到底》的问题,大家看了节目以后,汪仔是对搜狗AI技术综合的体现,大的方面和公司本身的理念是非常一致的。两方面,一是交互,也有很多资深的媒体人把汪仔,Watson当时去参加《Jeopardy!》这样的活动去做对比。一个非常大不同是在交互上,《Jeopardy!》节目里是单独给Watson一个输入,是文字输入,当时Watson和人的输入方式就不一样。

    这次我们去参加《一战到底》,机器狗汪仔靠什么?靠听靠看,和人一模一样,非常自然的交互方式,通过语音识别,图像识别,把搜到的信号转换成文字,这就是知识计算,然后做问答,交互层面上就会涉及到语言识别、图像识别,从问答变成文字以后涉及到搜索语义的理解,自然语言的理解,答案的抽取,语义的匹配,深度学习在文本上的应用,在汪仔身上都有很具体的体现。

    刚刚说大的层面是符合交互和计算方面的,如果要把《一战到底》的汪仔和Watson去做对比有几个方面:

    第一,语言。Watson当时用的是英文,我们是用中文实现。做语言的理解,不同的语言有不同的文法、语法在里面,代表着完全不同的技术。

    第二,输入方法。当时大家看到Watson的软件形象,显示板上图像,背后是单独给他特殊的文本输入,我们通过图像识别、语音识别去做的。

    第三,比赛赛制题目设置也不太一样,当时沃森对每个问题有明确的类,这个题目叫历史题、娱乐题、科技题,类似大概有6个类别。其实问题的类别在《一战到底》时也是中间非常关键的环节,但这不是《一战到底》题目中明确指定的,而是靠机器分析这个问题,文字里的语义代表的是,这个题目问的是诗人还是国家,还是某一种植物,都是靠机器自动分析出来。而Watson的设置题目本身就带着内容。

    第四,抢答的时机不一样。当时Watson有个规则,题目一定是说完了才能答,虽然机器和选手之间也有谁先抢到谁答,也等问题问完了再答,看谁快。《一战到底》里有个非常大的不同,只要主持人开始念题,在任何时间点都可以去答,自己答对了可以加分,答错了对方加分。这代表高手可以预测题,只听题干一部分或一小部分就能推理出来你在问什么然后我直接给答了。这个能力非常难。刚开始我们研发时,汪仔是不具备这个能力的,我们只能问答,我们是给一个完整题目,怎么样能够答的题目越多,每一题答的尽量打得准,这是我们刚开始研发的重心,等到后面准确率和人类顶尖选手接近甚至超过他时,整个抢答赛制里机器处于劣势,之后我们花很长时间去做抢答。抢答有两方面,一是速度上,争分夺秒,我们几毫秒地去抠,中间有语义识别,搜索、知识库和检索。

    整个过程中,刚开始上来就是100毫秒、500毫秒,尽量比人抢得更快,每个模块都从速度、效率上往极致走,每个模块上速度到最后提升了好几倍,但这不是最重要的环节。大家知道,人的语速是很快的,一秒钟人就念了好几个字,早5个字答,就能提前很多时间答题。所以,首先在速度上和人接近。另外,人的推理能力机器也需要有,机器也做到拿到不完整的,到目前为止所有的题目信息就是不完整的,机器首先要去预测,完整的题目要问什么,我们应该怎么答,这块花了非常多的时间,Watson完全不具备这样的能力,当时比赛的赛制就告诉你,让你答才能答。

    我举个例子,但是节目组拍了顶尖选手来做测试,像徐圣明到我们这里测试。机器出现一个问题,一个题目说《鹿鼎记》中哪一种毒药?提到这个问题的时候,人已经答了,还没问完题呢。后来徐圣明说鹿鼎记就哪一种药,人会推理的。大布什、小布什的教育,大家知道要考虑是不是毕业于同一所学校?人会瞬间思能考的。机器听到大布什、小布什在琢磨问学校的事儿就有一定的难度,抢答背后有对知识更复杂的理解,不像Google Instant Search说,帮你把后面的东西补完。抢答里会变得很难。另外一方面,我们为了速度快,还做了很多的工作,比如光纤,发现赛场里是没有网络的,我们拿4G网络过去不够,所以专门拉个光纤过去,就为了省时间。

    语言识别,以前语音识别,说一句话,停了0.3秒,他认为你已经说完了。现在不是,要判断什么时间他已经说完话的,把500毫秒、300毫秒变成50毫秒,这背后要做更多分析的工作。甚至当你说一半的时候要开始计算,图片、文字进行到一半就做计算,而不是像原来那样等结束说话再做。Watson对于历史题或人名,一旦限定子课题时叫封闭域,机器人会变得很多。现在是属于开放域,虽然有大的框框,问题在这个范围里随便问的,机器的知识在里面越变越大,越难确定。这是更难的事情。Waston做对比大家会更容易理解,汪仔背后是有综合的技术挑战。

    许静芳:因为我们跟顶尖选手确实切磋过好几次,拿这个测试数据来看,觉得蛮有意思的,我最近也认真地把Watson当时发表一些论文翻了一下,从测试结果来看,咱们《一站到底》的顶尖选手达到了当时Watson的水平,但是我们机器狗汪仔比Watson要更好。所以说我们会发现人过了几年的以后水平没有变化,美国的顶尖选手和中国顶尖选手具有相同的水平,不一样的地方是,机器经过几年的技术发展已经发生非常大的变化,机器在不断地提升,人相比顶尖水平就比较固定了。

    王小川:大家可能都想看百度小度跟搜狗汪仔比几场,这是不可避免的事,这个场景也是挺好的。

    记者:去年花了1.8亿投资了天工智能计算研究院,今年咱们还不会持续这么大的能力去投?

    王小川:1.8亿是一次性的投入,但实验室会有一些额外的费用产生,会小一些,不会这么显著,但足够使得我们联合研究有这样的成绩。

    记者:和智能硬件的结合能说一下吗?

    王小川:智能硬件有三种场景,一种场景是客厅场景或家庭场景,一种是车载场景,一种是移动场景,这三个场景里我们都有切入的方式,有的是自研,有的靠合作、合资,有的是提供API,让别人来调用。这三种情况都会发生。

    记者:有更详细的东西可以透露吗?比如客厅具体和什么合作?因为大家提到智能硬件就是这三大场景。

    王小川:客厅场景方面我们在投资里面已经推动了,跟国内资源互补、优势互补的公司正在往前走。自研像我们之前有糖猫,比较早,我们有供应链,有大量的销售点,内部的管理团队也建起来了,不过它不是我心目中典型的智能硬件。我对智能硬件是希望它能做判断,能够像人做自然的交互和后面的知识计算,它的连接工具和糖猫本身是给没手机的孩子用的,它相当于一个试探的过程。今年我们会投入到智能硬件的自研。刚才我们讲了三件事,问答、对话、翻译,是从这几个场景切入的。

    记者:这次咱们财报使用人民币单位,以前都是美元,什么原因?

    王小川:两个原因,一是美元升值,人民币贬值了,这时候再用美元计价大家容易产生误导,因为之前美元和人民币还是相对比较稳定的,最近这几年有大的变动,我们用人民币更能反映我们的竞争力和变化。

    记者:我对比了去年的数据,去年我们收入和盈利增长差不多50%多,是因为搜狗今年做了很大的投入吗?

    王小川:两个原因,一个是投入很大,另外,大家知道搜索从推广改成广告了,就是国家把搜索的收入性质定义改了,改了之后,这个就严格了很多,还有税收等,所以有一定的政策上的影响。

    记者:我们今年的投入、投资,包括在AI方面,包括明医方面的投入会相对减少吗?对下一个季度财报的预计会怎么样?

    王小川:我们预计比2016年多。

    记者:这个问题还是想问您一个规划,就是咱们之前的增长速度非常快,但是不可能永远都是这么一个高速,因为在AI方面的投资会越来越大,不知道你有没有什么计划和节奏?

    王小川:我们收入本身的规模可以说明问题,利润不是关键的事儿,只要能做长远投资,而不是计划出来的,这只能当成中间的一个结果。

    记者:去年和今年有一个特别大的不同,就是去年,您最开始做财报讲解时,提到了很多新的概念和思路,但是今年我感觉把那些思路逐步地变现,一步步地落地,把一些功能再升级的过程,今年有没有特别大的爆炸性的、突破性的想法?

    王小川:我们开始在努力提硬件这个词,还想多爆炸呢?

    记者:问一下AI这个事,我记得大概是您说2015年AI其实没有什么突破,到了2016年,AI是有一点遇挫,您到海外跟AlphaGo团队做交流,聊第四盘棋是怎么回事,聊深度学习,深度学习遇到什么瓶颈?您怎么看待AI这件事?其实咱们跟大的AI趋势有一些不一样,大的方向是说AI有一点遇挫,但是今年搜狗在AI方面对外宣讲、产品研发和推广都会更高调一些。

    王小川:最开始在AI方面谈AlphaGo的时候大家都是比较悲观的,不管是传统媒体人还是IT界的人都说AlphaGo不行时,我说AlphaGo能行,还写在知乎上。后来AlphaGo赢了,大家就开始过于高调了,觉得这个机器可能马上把人都干掉了,讲了深度学习要统治世界等等,当时我们内部还在不断往前走,但是对外我们会负责任地去发声,我说深度学习就有一个瓶颈的,不要把它想的什么都能干,即便做无人驾驶都没到那么靠谱的阶段,而且机器现在对语言的处理能力很弱。

    那时候行业投资很疯狂,大家会幻想,投资人会有一种情结,看不懂的东西就觉得特别美。创业者本来就很疯狂,在投资方的推动下,最后想出的事儿可能和现实就有差距。比如做图像的一些公司,很多公司都在亏损,最后都卖掉。在这里面,大家对技术的可行性和商业模式没有深度思考。深度学习有很多瓶颈,即便能做事情也要分(着看),如果只做识别、合成、生成,可能商业价值是小的。机器用来做判断,making decision这个事情才有很大的意义。在商业价值里面我们可以想,这个事(做判断)才是有意义的,确实有些“坑”大家都进去,但最后技术做不到或技术做到了但没有商业上的应用场景或商业上的收入。

    现在为止,我发现行业中一部分的东西过于低迷,觉得这个东西不行或者(泡沫破灭)。但是我们知道,当机器开始能做判断的时候,本身能够产生商业智慧,它有服务上的价值和变现能力的,而做合成、生成和识别,是能改进交互的,而改进交互最受益的公司就是搜索类公司。所以,搜索类公司在AI行业里是受益的,而且就用它提高自然交互和知识计算,那相对是稳健的。

    记者:所以你会敲敲代码来感受一下吗?

    王小川:我会试一下,至少我会知道,包括并行度上机器多了并行到底能不能实现,新的算法里面怎么用,这些都是能和团队进行讨论的。我们是真正知道,已经不恐惧,不会从恐惧转化为幻想,我们没有这种幻想。所以,我们可以平稳地往前走。我们公司基因里,是一步一步开始去做的。搜狗目前盈利了,到了一个规模盈利的状态。所以,其实我们有一种天生的东西,叫避免不靠谱的事情发生,如果技术上走错路是非常可笑的一件事。

    记者:就是技术上走通的可能性还是有的?

    王小川:你会觉得有这种可能性,但是我们会小,有的公司就会大,对战略不了解的公司。

    记者:去年,我问您对搜索整个未来的格局是怎么看的,当时您大概提了两个关键词:问答和服务。今年过去一整年了,而且今年咱们很多东西落地了,您认为对未来的格局有没有更细化或有一些差异、变化的地方。或者未来在那些关键的时间点是不是能看得更清楚一点。

    王小川:问答是一个渐变的过程,所以我们今年说10%的搜索能够走问答,它不能做到在短期里面突然就把这个事情颠覆了,我们只能说是慢慢地成长。它的好处在于,它可以使得你公司本身有一块收入或者利润支持你良性发展,让你有机会,有更多的时间向未来布局,这是我们现在一个好的状态。

    但如果假设搜索引擎做到顶了,收入往下掉,你可能着急要赶紧找个大数来填它,这种压力在战略上可能会带来很大的困难。现在搜狗在AI技术能力里面,在综合的掌握里也是最TOP的公司之一。在产品上,我们有自己产品的积累,包括硬件上,我们比其它公司更有能力去在未来布局,或者在路线里面走稳,因为AI不是一个创业公司、小公司就能玩得动的东西。需要数据和大量研发投入。搜索再往前走,但我们公司已经开始对未来进行投资。

    记者:搜索这块咱们排名很清晰的,在AI这块我们给自己怎么排名的?

    王小川:搜索排名第二,这很清楚。AI方面,如果非要让我数,我觉得我们应该在前三的位置。

    记者:您觉得现在汪仔,您所说的NLU自然语言的理解,你觉得它达到你想象的程度了吗?汪仔在整个搜索里的角色是什么?它只是展示品还是最后成为产品?就是汪仔过了《一站到底》之后,它的走向会是什么?

    许静芳:我认为,通用NLU没有达到,或者现在也没有系统能够达到。如果我们聚焦在《一站到底》这样的特定设计下,它是足够好,不管是它回答的准确度,还是它回答的问题,它回答的时间点已经足够靠前,在这样的设计下面谈已经不错了。

    《一站到底》在公司是个什么样的地位?其实我们是先做问答然后才有《一站到底》,《一站到底》其实是问答里非常特殊甚至相对偏简单的类别,它就问的是实体,所有的答案都是实体的一种。但是回到搜索每天面对的问答,有问实体的,也有问经验型的,比如“我怎么烧红烧肉”,也有原因这种“天空为什么是蓝的?”也有“范冰冰漂亮还是李冰冰漂亮”这种比较型的,或者“孕妇能不能吃螃蟹”,其实问答有很多种类别,实体是其中一种相对比较特殊的类别,在实体类别里我们把关于实体型问答应用到《一站到底》这个特殊环境里。当然,为了参加比赛取得成绩,打败人,那又对《一站到底》做了很多特殊的优化。所以,问答是我们未来发展的方向,《一站到底》是我们展示和挑战自己的一个平台。

    记者:你觉得汪仔好看吗?

    王小川:汪仔代表的是一个形象,不管是虚拟的形象,还是对问答对技术形象的展示,这就是在整个大局里面的一种位置。往下它也会更加聪明,能力也会有人用,不限于这个事情,这是好的积累,但是能不能把它变成智能硬件类的玩具是需要论证的。

    记者:今天听您提到硬件这个词频率还蛮高的。我记得三年前智能手机非常好的时候已经有人提出,智能硬件未来是取代iPhone的趋势,从最近一两年来,有越来越多唱衰它的声音,所以想问下您,为什么会在现在来提这个词。

    王小川:好像其他几年我一直唱衰硬件,那时候硬件特别火,因为确实死了一堆公司。硬件为核心的时候是资本驱动的,是用到一个概念里去,为了硬件而硬件。如果做个体重秤踩一脚就能够轻一两肉,卖8000元也有人买。回到智能硬件的意义里面去,比如做智能插座我觉得不是个关键的问题,是资本推动的。现在智能硬件核心的东西,是把自然交互和做判断的能力放进去,机器在里面能做交互和判断。微软的手表一直卖得不太好,因为它屏幕小,里面AI不够聪明没有办法取代手机。比如天气预报,手机上可以显示出今天明天后天、刮风、下雨、PM2.5指数。手表上信息量是不够的,如果它不够聪明,不知道你要什么。当然现在没法排这么多,因为不实用。如果AI足够好了,“你问他明天要不要洗车吗?”它会给你一个答复,这个时候智能硬件足够聪明,交互足够简单,就能跑起来了,智能硬件要看交互能力和判断能力是否够强,以这个少屏幕甚至没有屏幕的方式就能够做这样的承载,否则就没有这个智能硬件的意义。一个新硬件做成必须让比手机更便捷,让它在数据处理能力上更强才行。以前智能硬件数据处理能力也没更强,也没法更便携,那就是为硬件而硬件的事情。

    记者:刚才您说在智能硬件上会找合作伙伴,这个事情也在推进当中。您要找合作伙伴的话,标准是什么?

    王小川:在硬件领域里,第一,是很有灵性的市场敏感度,把智能硬件做好,我开放能力给你,开放API给你,你在里面跑硬件,以合作伙伴为主。第二,对方有平台级的能力,有大规模开模、建模、设计能力、供应链管理能力,它也有战略的意义在,我们可以用一种合资的模式去进行,当然也会对它开放能力。第三,就是偏向于我们自己的能力,比如翻译,也有可能自己就干了。

    记者:您提到国家广告法的调整,对搜狗有一定的影响。过去来看,这个影响的幅度或规模大概在什么样的区间?

    王小川:举个例子,广告法就是收入里面减3%的税,利润里就更多了,比如有的是20%,那就是减掉3/20,就可能15%的利润就没了,在利润中会放大的。还有广告知识的监管和行业的限制,有的行业就不让你投广告了,我不是指医疗,其他行业都开始限制。

    记者:您刚才说糖猫,2015年、2016年还是挺火的,后来觉得它不是你理想中的智能硬件,去年的声音很小。但我看360推它的儿童手表还是挺火的。

    王小川:糖猫从战略意义上来说对我们是入门,我们通过智能硬件建立了分销渠道和供应链管理。更多为了我们跟这些设备公司对话的时候不外行,我们达到了这样的目的,之后我们往下AI多走一走,这股力量就会跟上。糖猫我们会做好,这是我们硬件战略中间的一部分。糖猫做的好不好,和搜狗并没有直接的干系。

    记者:百度也在做自动驾驶的东西,车载毕竟是比较好的场景,您有什么样的考虑?

    王小川:无人驾驶有两个事,一个是无人驾驶里的辅助系统、导航系统,这个事情是有意义的;但开车目前还无法完全实现。

    记者:我们在车载这块合作是不是B端的合作,与汽车厂商进行合作?

    王小川:会在里面做一些东西,但不是无人驾驶这个事情,开车这事儿不是搜索公司该干的。

    记者:聚焦在语言导航是吗?

    王小川:对,自然交互和实时计算,导航在这个范围里。

    记者:搜索引擎,我看您对它核心竞争力的描述,一是自然语言的交互,二是知识计算,因为前两年我看到搜狗投资了知乎。今天听您说会在医疗和海外方面,其实这都是一个知识的体系。为什么不是信息,而是做知识方面的东西。

    王小川:语言是一种载体,像我们搜图片的时候,只关注图片周边的文字其实没有理解图片本身。这种载体要往人工智能做更深是需要对信息的内容有更多的理解,如果文字或叫Language这个词比较浅层,要挖Language背后的东西叫knowledge,背后的信息在这儿,叫知识。

    记者:今年跟知乎有没有比较大的合作?

    王小川:知乎在搜狗投资之后,搜索已经涨了6倍,流量也涨了很多,在我们看来,这个合作是在稳健的模式里,知乎成长得特别快。

    记者:今年跟他们高管团队有没有做一些比较大的沟通?

    王小川:喝酒算吗?

    记者:还是谈正经业务的事吧。

    王小川:我们增加了投资额,提升在知乎的投资额。

    记者:小度在《最强大脑》上所完成的项目汪仔也能完成吗?这两个产品在您看来,它体现的两个公司,比如在人工智能的技术和产品路线上有什么不同?现在做汪仔,是不是意味着搜狗下一步在人工智能继续在商用上做的是家用机器人或者教学类机器人?

    王小川:我没有表达要做家用机器人或者教育机器人,只是说我们要做智能硬件。从能力上讲,双方的不同点,我们强调的是语言,即便我们有图像和声音,但是更多回到语言上,而小度的研发是图像识别方面。

    记者:语音这块百度也在做。

    王小川:语音大家都做,但是语音的品质我们是最好的,语料规模我们也是最大的。

    记者:其实去年注意到咱们有很多的场景,尤其输入法,O2O也在里面,这里面会不会衍生出一些新的商业模式,您的摸索上有没有一些经验和试错?各个AI平台都在努力争取跟厂商合作,包括讯飞主要是偏B端的。你们会着力于哪些点去吸引它?现在各家都会在垂直领域突破,讯飞是教育,我们侧重于医疗,所以在这个垂直领域上,你们以什么路径实现?去年AI开始在中国大热,人才薪水也不断提高,有的人才成本占50%都有,您怎么看这个问题?搜狗在人才积累上有什么样的做法?

    王小川:第一个问题,输入法一直在试探的地方是从工具到服务,已经有一些变化在做了,像输入法有花键,点了触碰,帮你找图片,帮你做翻译,帮你做音乐的分享,从联想的分享里我们做尝试,我们大的逻辑是从工具变成帮用户做选择的事情,没有变过,产品上也在做升级,对于新产品是可以期待的。

    记者:盈利模式上会有一些推进吗?

    王小川:现在我们主要产品上能够接受,只要能够被接受,能够帮用户做选择,就能够有商业模式,用户端上用户也会感兴趣。

    关于AI厂商的优势,比如我们做导航,不仅有语音识别、语音合成,还有自然交互对话系统,背后其实有更多的知识,比如搜狗有地图,在产品里如果不把地图的能力穿透,最后你分成两个公司做的效果不好。我们有服务的能力,比如去机场,问你航班号,你知道飞机什么时候起飞,可以把这种能力带到对话或用户交互里,知乎做语音、自然语言,做不到这个事情的,这就是服务能力跟着一块就出去了。是这样的区别,搜狗2C里面积累了大量对用户服务能力。

    垂直领域里面,做医疗,我本身没有把它当成是新的业务来看,我认为,它是搜索下的一个延展,讯飞做教育是行业开拓,和我们的性质不太一样,不是想不断到不同的行业里去,我们还是想在信息获取、信息表达、自然语言交互里做,这方面我们更聚焦的。但我们可以输出能力,教育机构要用这个能力的我们会输送给别人去干,我们并不求在这里面占据多大的市场份额或规模性的收入利润。

    关于AI人才,需要我们更多的投入,搜狗今天的状态,这个公司大概也有两千多人,算上兼职学生加起来也有小三千人,当然这里面我们自己培养的人会非常多。我们去招人,招10个人进来,就是10/3000,和创业公司相比起来已经没有不是什么大的压力。

  2. 搜狗许静芳:AI时代我们这样解决搜索全、准、便捷性的问题说道:

    全、准和便捷是搜索引擎需要去满足用户的三大需求。搜索的天职和使命,是为了满足人类永不停止的求知欲。

    2017年4月28日下午,2017年GMIC大会如期而至,本期大会最核心的亮点是开设了大热的人工智能公开课,邀请了来自谷歌、IBM、亚马逊、英特尔、卡耐基梅隆大学、斯坦福大学、加州大学伯克利分校、南加州大学的全球顶尖人工智能专家零距离授课。搜狗首席搜索科学家许静芳女士应邀在活动上进行了主题为《从搜索到问答》的分享,梳理了从PC时代到移动时代、人工智能时代搜索引擎的变迁,指出搜索的未来的方向是精准问答,并且,各大搜索引擎公司都在朝此方向努力。

    PC时代,搜索引擎是绝对的互联网入口

    1995年到2010年左右,大家都在用个人电脑使用互联网、使用搜索引擎,在那段期间,几乎所有信息都存在于网页上,搜索引擎面对的信息的载体是相互关联的网页,人为了找到答案,被训练成使用关键词进行搜索。

    对于全的定义,是索引量,所有的搜索引擎都呈指数级增长它的索引量,到1997年、1998年Google入局以后,非常快速地引领了整个发展;对于准的追求,各家搜索引擎需要计算出网页的权威性、重要度,最终返回给匹配用户的查询词;便捷性在这个时代,是用多模态的方式解决的,到后来发展成为开放平台,即第三方垂直服务商把内容提供给搜索引擎,搜索引擎用搜索结果呈现,并把流量导给处置提供商,所以在PC时代搜索引擎是绝对的互联网入口。

    移动时代,从搜索信息到搜索和连接万物

    2016年的时候,国内的移动搜索用户规模已经达到1亿,并且用手机来搜索的用户还在持续性的增长。从搜索收入来看,移动搜索收入统计明显大于PC搜索,有数据预测,到了2021年,移动搜索的收入应该达到PC收入的9倍以上。在移动时代,搜索的设备、输入方式和信息载体都发生了显而易见的变化。

    移动时代,为了解决全的问题,搜索引擎需要打通网页与App之间的壁垒,比如搜狗搜索可以对微信和知乎进行独家搜索,这就使得信息来源更加全面;为了使得结果更准确,工程师通过分析click model去评估网页与产品Ian的关系,对查询词进行更加深入的需求分析,更进一步的,把机器学习的框架引用到搜索排序中,解决在给定固定的用户查询下,去学习不同文档之间的篇序关系以此改善搜索结果。便捷性方面,输入方式更加多元,用户可以输入语音和图像,搜索引擎应用语音识别和图像识别,转化成文字或物体再去做搜索;利用语音合成技术,还可以把搜索的结果念给用户听。与此同时, 移动时代诞生了很多服务的APP,搜索和服务打通以后,可以在搜索内部完成服务的闭环,便捷用户使用体验。

    在移动互联网时代,搜索上发生比较大的变化,已经从之前的搜索信息到搜索和连接万物——这是它的使命,也是我们努力的方向。

    人工智能时代,从搜索到问答

    人工智能时代 ,搜索将过渡到任何一个可以联网的智能化设备,包括智能车载、智能家居或者服务机器人等。在输入方法上,用户从关键词的输入,逐渐转向了语音、图像等模态,搜索的使用,逐渐从人去适应机器变成了机器来适应人。人可以用自然语言与机器交流,可以用问句的方式向搜索引擎提问,搜索引擎不再是返回10条结果,而是像人一样给出答案和建议。人工智能时代搜索将转变为问答,去满足大家求知欲。

    在这种背景下,搜索引擎将扮演三种角色,其一是命令与执行,通过问答完成定机票、餐饮等需求;第二类是情感陪护,通过问答完成情感层面的陪伴;第三类是寻求建议,人和机器就像朋友,有问题会去询问,机器听到问题后,经过思考,在他的知识体系下给出答案、建议或评论。这就要求机器要够一定的能力,在此基础上建立完整的知识体系,把这些内容结合直接给出答案——搜狗的人工智能答题机器人就是第三类角色一个很好的尝试,他已经能够和人类同台竞技强大题目,并表现出压倒性的优势。

    人工智能时代,搜索背后的技术也发生了一些变化,搜索结果不再是匹配,而是走到了理解的角度。搜狗的理解是从符号主义过渡到连接主义——以前把词和词之间定义为高维空间向量的相互独立的向量,通过这种分布式的表达,需要把它放到一个相对低维的、但是连续的向量中。在词理解的基础上,利用CNN、RNN这种目前比较流行的网络结构,对句子、篇章的结构进行建模,对整个比较大的单元理解。有了前面这些理解,在搜索场景下,搜狗可以把用户的查询、用户的问题,把网页文档的信息都用DNN、CNN、RNN这种网络结构去表征,最终通过用户已经在搜索引擎上发生的行为,在大量的海量的监督数据里面,进行批量的监督学习。

    在演讲的最后,许静芳这样总结到:“搜索引擎天生就是用来满足人的好奇心和求知欲的,在今天人工智能的时代里,我们希望在之前的基础之上,做到语义的理解与知识体系的构建,最终达到让搜索引擎成为人类的朋友——有问题,就直接用自然语言跟它交流,它能直接给你回答。”

  3. 【氪星晚报】乐视影业今年四部电影总票房不足10亿;陆奇:百度以AI思维指导创新;阿里巴巴也要瞄准智能音箱说道:

    处于迷途的乐视。

    关键词

    关键词1:百度

    陆奇:百度不再是互联网公司,一切以AI思维来指导创新

    在今日举办的爱奇艺世界大会上,陆奇表示,百度不再是一家互联网公司,而是一家人工智能公司。“李彦宏极有远见地前瞻布局,AI思维,AI为先,AI为核心能力,提升现有业务,创建新型业务,以AI为核心平台,赋能各行各业。”另外,陆奇提到,人类发展到现在已经有四次工业革命,第四次工业革命是智能革命。

    百度展示智能视频播放系统,可用语音控制播放

    在2017爱奇艺世界大会上,百度集团总裁兼COO陆奇向现场观众展示了一种“随心所欲”的刷剧方式——通过不断的语音互动,智能视频播放系统不断对用户的需求做出回应。比如“请播放《欢乐颂2》第14集,请快进,请声音大些,这个演员是谁?”陆奇表示,人工智能技术将给包括娱乐在内的服务体验带来革命性提升,也将创造全新的商业价值。百度今后将加速向娱乐产业赋能,为用户带来更有趣的精神文化生活。

    关键词2:乐视

    乐视影业今年四部电影总票房不足10亿,估值缩水

    据时光网数据显示,截至目前,乐视影业已有《熊出没·奇幻空间》、《记忆大师》、《猪猪侠之英雄猪少年》、《“吃吃”的爱》四部影片上映,但累计票房却不足10亿元,最新上映的新片《“吃吃”的爱》票房更是不足3000万元。

    乐视达美中心拖欠租金已解决:员工可进入大楼

    两天前乐视达美中心因拖欠租金、物业管理费而将被停止物业服务及阻止员工进入大楼办公一事今日已得到解决,乐视员工可继续在此办公。

    乐视手机业务处境尴尬,至少裁员50%

    腾讯科技今日又从知情人士处获悉,目前,乐视手机业务几乎全面停滞,裁员正在进行。该说法也得到了乐视手机内部员工的确认。乐视官方对此表示,业务还在进行,产品也销售中。从其官方信息来看,一些旧品正在参与618的促销活动。至于何时推出新品乐视没有透露。

    关键词3:阿里巴巴

    阿里CEO张勇:2020年阿里GMV将达一万亿美元

    阿里巴巴集团CEO张勇表示,从制造连接到重新定义零售,天猫四个方面实现了重构,包括品牌营销以及用户连接的重构、通路的重构、供应链的重构、线上线下商业业态的打通和重构。阿里巴巴的中期目标是到2020年GMV达到1万亿美元(6万亿人民币)。远景目标是到2036年服务的全球消费者达到20亿。

    阿里巴巴刘松:智能硬件会非常热

    阿里巴巴集团副总裁刘松8日称,今年有三个主题会特别关注,首先是智能硬件主题会非常热,其中,全球智能音箱带动了智能家居。据透露,阿里与喜马拉雅FM最近合作做的硬件就是一个有AI能力的智能音箱。另外,他表示,人工智能和文化创业,也是今年阿里创新合作关注的重点领域。

    大公司

    《财富》美国500强排行榜:科技行业最赚钱,金融、能源和零售企业入榜数量最多

    《财富》杂志发布了最新的美国500强排行榜。这500家企业,占据美国GDP总值的三分之二,营收达12万亿美元,利润为8900亿美元,市值高达19万亿美元,全球雇员人数达2820万人。沃尔玛连续第五年位列第一,沃伦·巴菲特的伯克希尔-哈撒韦公司紧随其后。苹果公司虽然位列第三,不过其市值位列全球第一,同时在利润表中蝉联榜首,是美国最赚钱的公司。

    谷歌母公司CEO:当年重组谷歌是效法巴菲特

    据国外媒体报道,谷歌母公司Alphabet董事长埃里克·施密特透露,谷歌在2015年进行重组,其实是受巴菲特质朴办公司的启发。目前Alphabet的结构,同巴菲特的伯克希尔·哈撒韦公司有相似之处,增加了CEO的独立性,也在增强母公司的品牌形象。重组之后的Alphabet,包括施密特在内的行政办公楼,则只占据了半个楼层,比伯克希尔·哈撒韦公司的行政办公楼占据一个楼层还要精简。

    谷歌至少投了25家独角兽,占全球12.5%,微软投了5家,比苹果、亚马逊、脸书多

    根据CB Insights数据,Facebook、Amazon、Microsoft、Google和Apple五家投资总和超3万亿美元。谷歌是投资独角兽公司最多的巨头,主要通过Capital G及Google Ventures两支基金投资(两者主要是投资重点及钱的来源不同,前者更多目标初创公司,由谷歌提供支持)。CB Insights数据显示,谷歌总共公开投资至少25家私人控股的独角兽,占全球总额的12.5%。

    全球最具价值独角兽榜单:共享单车行业,ofo独登榜稳居第一

    近日,全球知名风投调研机构CBInsights发布了全球最具价值的197家私营科技创业公司榜单,且这些科技创业公司均为估值超10亿美元的“独角兽”公司。在CB Insights全球最具价值独角兽榜单中,ofo小黄车成为了全球共享单车行业唯一上榜公司,稳居行业第一位置。

    京东大数据:国产品牌增速高于进口品牌

    京东发布的大数据表明,中国品牌正在高速成长,与去年同期相比,下单金额同比增长超100%,其中,百大中国品牌6月6日全天累计下单金额同比增长超过200%。其次,与进口品牌相比,国产品牌的增速也要高于进口品牌。从品类来看,国产品牌崛起,大家电数当属第一。其中,空调的国产品牌下单金额同比增长超过400%;平板电视下单金额同比增长超185%;女装销量同比增长超过200%。

    今日头条旗下“头条视频”更名为西瓜视频,作为独立品牌运营

    6月8日,今日头条旗下独立短视频 App “头条视频”全新升级为“西瓜视频”。这是今日头条短视频业务的又一次升级,也意味着其正式拥有自己的独立品牌。西瓜视频将主要从扶持原创作者计划、全新升级原创作者平台等方面发力短视频业务。

    点评:头条在短视频领域的布局已经足够清晰。新更名的西瓜视频发力 PGC,火山小视频立足直播和 UGC,抖音则聚焦新型式的音乐短视频社交,再加上在海外收购的 Flipagram 等知名短视频社区,头条算是在短视频上下了重注了。

    小米韩语版官网上线:直面对抗三星LG

    据韩联社报道,小米韩语版官网已经正式上线。小米韩语版官网显示,小米上架的产品包括空气净化器、移动电源、小米手环、小米体重秤等产品,目前并未看到小米手机上线。韩国是三星、LG等电子巨头的老家,之前小米曾在韩国以合约机的形式出售过千元手机红米Note 3,不过小米手机并未在韩国市场全面铺开。

    富士康与夏普拟斥资73亿美元在美建立面板厂

    据国外媒体报道,知情人士透露,夏普和台湾鸿海精密工业(富士康)正在考虑在美国建立两座新工厂,一座针对手机屏幕,另外一座用于电视机大屏幕。富士康和夏普将斥资8000多亿日元(73亿美元)建设液晶面板工厂,使用10.5代生产技术制作65英寸或以上电视屏幕。预计该设施将最终推出Sharp计划在2018年亮相的超高清“8K”电视机面板。

    Facebook发布了便于救援的“灾难地图”, 这是一项让灾民安心的创新

    Facebook近日推出了一款“灾难地图”,为各地的救援组织提供受影响地区用户的位置数据。人们可以在Facebook上标记出自己所在的方位或者正在逃离的地方,随后Facebook通过对相关数据的整合帮助救援组织,能够更清楚地了解受影响人群的所在位置、亟需的物资,以帮助人们摆脱伤害。

    普华永道:未来五年,掏钱看视频成为常态,超过一半中国人都玩游戏

    根据普华永道《2017-2021 年全球娱乐及媒体行业展望》预测,未来五年中国娱乐及媒体行业的年均复合增长率将达到8.3%。未来五年,中国娱乐以及媒体行业将会被科技重塑,内容、传播途径纷纷让位用户体验。中国市场将见证从免费到付费点播服务的一个重要转变。对于中国市场来说,音乐和电影娱乐两部分具有长足潜力,电子竞技已经开始赢得关注。

    集邦咨询:手术机器人市场未来五年将高速增长

    全球市场研究机构集邦咨询8日发布的生物科技报告《全球手术机器人市场发展趋势》指出,2016年全球遥控型手术机器人市场规模约38亿美元,2021年可增长至93亿美元,2016年至2021年的复合增长率(CAGR)预计高达19.3%,增长表现在众多医疗器材类别市场中相当突出。其中,美国为最大市场,也是使用手术机器人执行手术比例最高的地方,其次为欧洲、亚洲以及其他地区。

    全球手游市场2023年有望增至587亿美元

    市场研究机构BIS Research发布《2017-2023年全球手机游戏市场分析与预测》报告,预计到2023年全球手机游戏市场规模将达到587.1亿美元,平均每年增长9.4%。亚太手游市场在预测期内预计将经历最迅速的增长。网络连接的改善和低端智能手机的普及将成为这一地区主要的增长驱动器。例如 ,未来5年印度手游市场预计将以平均每年28%的速度增长。中产阶层收入水平的提高和年轻人口对另类娱乐方式的追求将推动中国和印度手游市场加速增长。

    宜家计划2018年试水通过第三方网站销售家具

    宜家首席执行官托尔比约恩·卢夫当地时间周三表示,该公司计划试水通过第三方网站销售其产品,在电商领域进行进一步探索。卢夫没有披露具体是哪些第三方网站,表示尚未签订相关合约。

    Airbnb正推动入住登记流程的标准化

    据外媒报道,与标准酒店相比,Airbnb的入住登记流程可能会不太一样。 而现在Airbnb正在大力推动其入住登记流程的标准化,让消费者觉得不那么令人费解。Airbnb正在将其新流程构建到其应用程序中,作为一个逐项解释的指南,房主可以使用照片和文本指令创建。

    雅虎AOL并购完成后将裁员1000人,接近员工总数20%

    消息人士透露,AOL和雅虎即将进行的裁员预计将达到1000人,这一比例接近合并后公司员工总数的20%。Verizon收购了AOL和雅虎,为了加强自身移动服务的技术和内容。两家公司的合并预计将于下周完成。批准这笔交易的股东大会将于明天举行。

    投融资

    拥有Jack & Jones、Vero Moda品牌的时尚巨头,2.25亿美元入股瑞典支付独角兽Klarna

    据外媒报道,由时尚大亨Anders Holch Povlsen执掌的Brightfolk公司打算买入瑞典支付公司Klarna至少10%的股权。2015年8月,Klarna的估值已经达到22.5亿美元。以此计算,购买Klarna 10%的股权大概要花费掉Brightfolk 2.25亿美元甚至更多的资金。

    估值8亿美元,在线教育平台Coursera获6400万美元D轮融资

    据Techcrunch报道,在线教育平台Coursera宣布完成6400万美元D轮融资,由GSV Asset Management领投,恩颐投资(NEA)、凯鹏华盈(KPCB)、Learn Capital以及Lampert Foundation跟投。其上一轮融资在2015年8月,融资金额为6000万美元。本次融资后,公司融资总额将超过2.1亿美元。

    推出新品CloudCare,云计算服务商驻云科技完成近亿元C轮融资

    36氪今日获悉,云计算服务公司驻云科技完成了近亿元C轮融资,复星领投,红杉资本中国基金跟投。此前,驻云科技已在2014年获得红杉资本中国基金和戈壁创投1000万人民币的A轮融资,2016年获阿里巴巴超5000万元B轮融资。

    2B营销公司 Pressboard 完成200万美元融资,将用大数据智能预测内容的传播效果

    2B营销公司 Pressboard 完成200万美元融资,此次融资后,Pressboard计划扩展其市场团队并吸引更多优秀的内容提供商入驻平台。值得一体的是,其服务 Pressbot也将被投入更多的资源。Pressbot将利用 Pressboard平台上的内容,尤其是头条新闻,故事主题,可读性等数十个特征与要素进行数据分析,并与阅读量,读者行为数据进行交叉匹配,最终能够有效预测内容在发布后的表现。

    闪殿获近千万元天使轮融资,专注快闪店空间运营和一站式服务

    36氪获悉,快闪店空间运营商和服务提供商“闪殿PopupUnion”已于上个月完成近千万元天使轮融资,资方为真格基金。闪殿已经合作过的商业地产超过 300 个,合作过的品牌有 50 多个,完成了 30 多期快闪店,已经确定合作的品牌有 700 个。除了成长性品牌,未来闪殿也会尝试和大品牌合作。

    新产品

    海尔土豪金配色共享单车亮相街头,支持无线充电

    据微博网友爆料,海尔土豪金配色共享单车亮相街头,是由海尔和“骑乐无比”共同推出的,支持无线充电。由于配色过于亮眼,被网友戏称“24K金”。

    估分查分选志愿一键搞定,支付宝上线高考后综合服务平台

    支付宝今天正式上线集估分、查分、选志愿等众多服务于一体的高考后综合服务平台,陪伴高考学生的青春大考。考生在估分、查分后,还可以看到系统智能推荐供参考的合适志愿。这项由好未来教育集团旗下高考服务机构高考派提供的增值服务,基于模型算法,也是首次在支付宝上全面免费。

    潮科技

    156颗卫星!中国要全球无死角开放Wi-Fi

    据央视报道,在今天开幕的2017年全球航天探索大会上,中国官方公布了未来低轨道宽带移动通信卫星系统建设的全新构想。中国航天科工集团(CASIC)主导的这一项目将使用156颗低轨道卫星,为全球开启Wi-Fi无线热点,支持高清视频通话、远程视频会议、高清电视直播、飞机通话与上网等功能。无论是茫茫大漠还是汹涌大海,无论是深山老林还是万米高空,这套系统都能覆盖到,提供全球无死角服务。

    声音合成器可模拟动物发声器官,让机器人宠物更逼真

    英国谢菲尔德大学的罗杰·摩尔开发了一种声音合成器,可以为任何尺寸的陆地哺乳动物生成适合该生物尺寸的声音。英国布里斯托尔机器人实验室的Nathan Lepora对该技术留下了深刻的印象,并表示这对于为老年人制作逼真的机器人伴侣可能是有用的。机器人伴侣已经投入试用,作为改善患有痴呆症状况的人的生活的一种方式。

    MIT打造汽油无人机:可持续飞行5天

    来自麻省理工学院(MIT)的工程师们开发了一种低成本的汽油无人机,它可以在低海拔的高空持续飞行5天时间。这种无人机将被利用到自然灾害地区的通信支持工作中,其搭载了一台5马力的汽油发动机、重量不超过150磅(68千克)、采用了类似于滑翔翼一样的翼展设计–长度为24英尺(7.3米)。无人机最多可携带重量为20磅(9公斤)的通信支持设备,另外它还能为一般的环境监测提供低成本的平台。

    其他重要新闻

    第三方支付整合继续,一个月内8张牌照被注销

    央行从2011年开始发放第三方支付牌照,前后已发布270张。截至目前,已有12家支付机构牌照被注销,现仅剩下258张了。其中,自5月15日至6月6日的不到一个月时间内,有8家因被央行要求合并被注销。 有业内人士表示,经过多年的观察,监管层开始加大监管力度,但主要是对第三方支付机构的业务范围等作出调整。规模较大且合规性较强的支付机构未受太大的影响。不过,随着监管趋严,支付机构的违规问题将陆续出现。

    上海鼓励民营企业发起设立民营银行

    6月8日,上海市政府官网发布了《关于创新驱动发展巩固提升实体经济能级的若干意见》。《意见》提出,上海将支持有条件的大型企业设立财务公司,推动金融机构和制造业企业发起设立金融租赁公司,鼓励符合条件的民营企业发起设立民营银行。根据《意见》,未来五年,上海战略性新兴产业增加值占上海全市生产总值比重将达到20%以上,战略性新兴产业制造业产值占上海全市工业总产值比重达到35%左右,生产性服务业增加值占服务业增加值比重将达到三分之二左右。

    中石化、中石油部分加油站降价超2元,发改委:降价促销或持续至三季度

    5月初以来,中石化、中石油部分加油站大幅降价促销,优惠幅度在每升1元至1.5元,少数加油站降价超过2元,带动民营和外资等社会加油站随之降价。部分地区的汽柴油零售优惠幅度普遍在1元/升以上,其中山东、江苏、浙江、广东等地区的降价力度较大。对此,国家发改委表示:5月以来的两桶油掀起的价格战,是由原油进口增加,国内需求疲软,成品油出口下降,以及零售终端利润率较高,存在降价空间等原因所致。

    商务部:供应增加导致肉蛋菜价格下滑,预计未来几月价格下行概率偏大

    近期,以肉蛋菜为代表的全国食用农产品价格出现同比较大幅度下降。对此,商务部发言人孙继文8日指出,这一轮肉蛋菜价格下降的主要原因是供应增加。对未来几个月肉蛋菜价格进行预测时,孙继文称,接下来预计猪肉供给将稳步增长,因此,价格整体将呈下行态势。鸡蛋近期供应充分,价格会企稳。同时,未来几个月,蔬菜价格预计总体延续回落态势。

    今日言论

    龚宇:头部马太效应和长尾效应是视频行业两大趋势

    在2017爱奇艺爱奇艺世界上,爱奇艺创始人、CEO龚宇表示,内容和渠道这两个关键词适用于许多商业模式,也同样适用于泛娱乐行业。娱乐世界需要有两大核心能力让生态持续发展,第一个是内容分发能力,第二个是货币化能力。视频行业有两大趋势,一是头部内容的马太效应;二是长尾效应,龚宇认为,互联网的存储、传播甚至制作的综合成本会更低,小众内容找到自己精准的用户群的综合成本更低。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>