2016年3月22日,百度举行了首期语音搜索开放日活动,向媒体展示自己正在蓄力的最新技术应用——语音搜索。百度公司技术副总裁王海峰现场介绍了百度语音搜索的最新进展,另有两位搜索技术负责人对语音搜索的实际使用问题进行了演示说明。在活动中,百度方面接受新浪科技采访时表示:坚信语音交互将是人机交互的趋势所在,这个趋势将取代键盘输入。此外百度方面还向新浪科技透露:今年将有重磅产品推出,会让去年百度世界大会推出的度秘更加厉害。
百度语音搜索开放日:百度搜索产品架构师景鲲(左)、百度技术副总裁王海峰(中),百度多模搜索部总监孙雯玉(右)
语音搜索≠听+说
百度技术副总裁王海峰百度技术副总裁王海峰
“语音搜索最常见的误区是简单以为只是听和说的简单串联,其实并非如此。”王海峰开门见山说道。
这位百度技术副总裁紧接着对百度语音搜索的最新进展进行了介绍,表示目前的技术已经实现了语音技术、自然语言处理、智能搜索三方面的融合,以更自然的交互方式,对用户所说更准确地识别,对需求理解更精准,进而能提供更满意的结果。
王海峰现场进行了演示,“请问三亚明天的天气怎么样?”他按住语音助手说,搜索框随机“打出”了王海峰的问题,并跳转到天气页面,还自动朗读起来:明天三亚天气多云,23℃到31℃……
不过王海峰认为询问天气只是最基本的语音搜索,他紧接着演示了三个问题:“谢霆峰的儿子是谁”、“谢霆峰是谁的儿子”,“吴奇隆比刘诗诗大多少岁”……
王海峰表示,前两个问题从传统搜索认知来看,文字是完全一样的,但问题缺截然不同,这其中涉及到了对于语言的理解和语义分析。最后一个问题则涉及两个结果综合之后的计算。
“百度语音搜索目前已通过人工智能做到了’听’和’说’,而且还尝试完成人类复杂的行为——沟通。集成了语音识别、语义理解、深度问答、知识推理、多轮对话、智能摘要、情感分析、语言生成、语音合成等能力,百度语音搜索已经能够满足用户的多种复杂需求。”王海峰总结说。
此外,这位百度技术副总裁也谈到了语音搜索和当下火热的人工智能的关系。他表示人工智能实际上是希望让机器可以拥有若干能力,可以让机器学会人的听、说、看、行,进而开始有思考——即机器学习,但就人的思考而言,和语言密切相关,后者是思考必需的知识和思维的载体。
王海峰强调说,语音搜索可以降低用户搜索门槛,而且在大数据的基础上可以转换为更多的互联网产品应用,实现人与信息及服务的更广泛连接。
键盘要被消灭
百度多模搜索部总监孙雯玉百度多模搜索部总监孙雯玉
关于搜索门槛被降低的问题,百度多模搜索部总监孙雯玉进行了进一步演示介绍。
她表示语音搜索的好处是比键盘输入“更直接、更快捷”。作为年轻妈妈,孙雯玉海举例说,女儿现在找动画片会直接通过语音搜索,“小孩基本不用教,甚至看你做一遍她就会了,她知道按住说话,就能找到自己想要的。”
语音搜索的直接和快捷同样体现在老人群体身上,孙雯玉介绍说父母有山东口音,但是搜索在语音识别上没有问题,“以前搜索需要组织语言思路,明确自己的问题,但是现在像我爸妈一样在文字输入上不习惯的群体,可以直接说,所说即所得。”
不过,这位多模搜索部总监也表示,针对中国方言众多的情况,目前的主要版本还只是针对以普通话为主的北方方言和相近方言,粤语版、上海话版和西南官话等版本已经在开发中。
孙雯玉认为语音搜索的最大意义在于:通过技术让人获得信息和服务的门槛更低,随着智能语音搜索进一步向前,可能会出现重大却润物无声地变革——键盘交互将成为历史,“我们的调研显示,90后、00后有50%的群体的主要搜索方式已经变成了语音,而我女儿为代表的10后一代,基本从小的习惯就是语音搜索,她们这一代未来会觉得语音搜索是一件自然而然且天生如此的事情。”
物联网大趋势
语音搜索比键盘输入搜索更便捷并不令人否认,但现场有记者认为语音搜索存在“场景”问题。
有媒体提问称,不怀疑语音搜索的效率和便捷程度,但目前来讲,拿着手机不断说话搜索需要场景,特别涉及多轮交互,可能会变得调戏Siri一样——只是个消遣游戏。
百度大搜索总产品架构师景鲲重点解答了场景问题。他觉得之所以目前还存在“场景”上的尴尬,主要有两方面的原因。
首先是当前的用户习惯了键盘输入,对于语音搜索的转换还需要一段时间,但不可否认的是随着年轻群体进一步壮大,语音搜索会成为潮流,“这个群体已经被微信完成了市场教育,现在在地铁上对着手机说话’看起来傻’的问题,估计以后大家都在做并且习惯了,就成为潮流了。”
其次是物联网的进一步发展。景鲲表示,目前人机交互的最主要终端是手机,不过一旦物联网进一步发展,人机交互突破了手机终端,需要在更多更广泛的领域进行应用的时候,键盘输入可能会变得很不方便,相反,语音输入的优势会不言自明。
景鲲认为,大的潮流和趋势目前是可以预见的,语音搜索的普及只是时间问题而已。现在手机屏幕承载的东西特别多,有屏幕的东西大家都愿意看,没有屏幕的东西就只能搜了。从潮流来看,语音交互绝对是主流。
新浪科技也就此向百度方面提问:“在物联网大趋势下,在硬件方面如何考虑,是否会涉足硬件领域?”
百度方面给出的回答是:不会涉足硬件。
“我们给语音搜索提供一个全方面的方案,跟各种各样的厂商一起来合作,我们提供的是能力、信息和资源。我们去年推出了小机器人度秘,通过它来告诉外界我们有什么样的能力,毕竟口说无凭,百度得把这个能力包装成这样一个产品,这些能力也可以放到厂商的设备上,我们做百度最擅长的,其他厂商做他们擅长的方面。”景鲲回答说,这个回答也得到了百度技术副总裁王海峰的赞同。
“但度秘在推出后似乎声势不大?”新浪科技进一步问道。
孙雯玉回答了该问题,这位百度多模搜索部总监解释称,度秘在去年推出是一个能力的展示,但度秘的普及应用过程中,可能涉及最多的问题是多轮交互,这对目前的产品形态和技术应用来说,一旦有不足,就很容易造成糟糕的用户体验,所以百度方面并没有选择大力推广,目的是让最大程度保证用户体验。
“但今年会有重磅得多的产品发布,会让去年百度世界大会上推出的度秘更厉害。”百度大搜索总产品架构师景鲲补充道。