百度景鲲:未来是语音交互的时代

2017-08-31 16:02:00 声学在线 分享
参与

  移动互联网时代即将落幕,崭新的AI时代即将开启。面对这样一个变革大时代,BAT三巨头之一的百度将如何实现战略转型,并构建出全新的AI开放平台与生态系统?作为百度AI驱动型新业务,DuerOS将在百度战略转型中扮演怎样的角色?声学在线有幸采访到百度度秘事业部总经理、DuerOS负责人景鲲,对以上问题进行了深度解读。

  8月31日,在柏林IFA(柏林国际电子消费品展览会)期间举行的搭载DuerOS的TCL智能电视新品发布上,景鲲表示,DuerOS将发掘长期市场机遇,为生态合作伙伴增添更广阔的空间。景鲲相信,DuerOS承载了百度从“连接信息”到“唤醒万物”的新使命,是基于AI技术打造的下一代人工智能平台级产品。

  谈生态:百度DuerOS从底层服务入手打造AI时代的生态系统

  (1) 变革期需要大气度,开放终究会打败封闭

  声学在线:7月5日,百度AI开发者大会上,DuerOS开放平台面向全球所有开发者亮相,作为AI时代的Android系统, DuerOS是AI时代开放赋能的生态系统。而当天阿里AILab实验室也召开了一个小型发布会,推出的是一款智能音箱产品。作为国内两个翘楚的科技巨头,两家作了截然不同的选择,为什么百度会选择打造DuerOS一个大的生态系统,而不是从ToC消费电子产品入手?

  景鲲: 在时代变革期需要有更大的气度、更大的心态。开放是一种心态和气度,就像百度AI开发者大会中,Robin在最后提到“开放终究会打败封闭”!

  社会的发展趋势是变的彼此跟彼此有关系的,变成一个更加connected的社会。我们不应该形成一个封闭的系统,把一些东西封闭在自己的体系里面。

  在这种大的变革期,是需要有人来做基层的、底层的服务,才能够支撑更多“有梦想的玩家”。从这个角度来讲,我们觉得做生态是更有意思、更具有社会责任感、更加能够推动整个时代的变革。

  而且,从效果上来看,也有很好的成效。现在跟我们合作的伙伴非常多,无论是大的企业,还是优秀的中小创业者,甚至个人开发者。真正的开放赋能,是能够让大家基于我们的人工智能的开放平台作出更好的产品——我觉得这正是百度的机会,也是百度的责任。

  (2)做生态最关键是找好自己的位置

  声学在线:DuerOS要做AI时代的安卓系统,其本质是要共建新生态,而所有的操作系统在初期构建生态都是最艰难、最痛苦的。站在生态系统层面,DuerOS构建生态初期过程中遇到的最大的困难是什么?又是如何迎接这些挑战的?

  景鲲: 构建生态的过程的初期是比较困难,但是不痛苦,因为你在实现自己的理想和梦想的过程中。两三年前,做这个事情的时候,理解的人很少。到今天大家都在讨论这件事情,其实我是有很大的成就感的。这个过程其实迈过了很多槛儿,越来越多的受众、媒体都关注人工智能、都来谈语音交互,这是很让人兴奋的一件事。

  的确,打造生态过程初期的确是困难的,初期主要的困难是如何协调几方的合作。我们有用户、有设备方、有方案商、有芯片企业、有内容方、有开发者……怎么样把大家放到一起冷启动是一件比较困难的事情。

  对于“冷启动”做生态最关键的是如何找好自己的位置,以及你对外释放的心态。找到了合适的位置之后,冷启动会比较顺利,否则处境很尴尬。在语音交互方面,国内像百度一样有储备的公司很多,但是,生态并不是很有活力。所以在这个位置上,你是不是有足够开放的心态,是不是有足够开放的能力,同时找到一个好的位置,这是攻克这个生态很重要的一环。

  (3)扶持为主,谨慎补贴;开放赋能,体验第一

  声学在线:提起构建生态,一定离不开促进生态进化的策略。目前,一些公司会推出一些促进普及的政策,比如成立基金补贴给下游参与平台建设的优秀开发者,百度DuerOS会采用什么策略促进生态发展,也会推出相应的补贴政策吗?

  景鲲: 我们主要以扶持为主。DuerOS的平台很大,平台合作企业也很多。从平台角度我们可以了解到谁有技术能力和有意愿做这件事,且需要扶持。像这种公司我们会去倾斜资源扶持。

  对于补贴,要看市场发展阶段来决定。生态是以体验为第一位的。如果体验不太好的话,不能盲目的去做补贴。我们希望用一种更合适的方式推进产业的发展,不要让它过热,过热大家反而会忽视用户体验,会伤害一些用户。我们希望理性和感性相结合,共同推进这个产业往前走。

  百度生态是开放赋能的一个生态。我们有肥沃的土壤,各种养分齐备。这块土壤上的植物,该长成大树的会慢慢长成大树。如果你拼命的施肥催熟,对树木本身也不好,我们希望以更健康的方式发展。

  (4)选择合作伙伴标准——品类标杆、行业示范、引领风向

  声学在线:DuerOS是整个行业参与完成的开放生态,需要众多的合作伙伴和开发者共同参与。百度作为大公司,在选择合作伙伴会有什么样的策略或者偏好?会倾向选择自带用户流量的伙伴,还是偏好有技术内核的伙伴呢?

  景鲲: 我们会比较偏向于打引号的标杆客户。这个时代是需要一些标杆、领头羊冲到前面带领着选择生态,让所有用户看到技术和场景结合之后,能爆发出什么样的火花。

  这个时候标杆客户包含了很多,比如和TCL、联想、国安广视、极米等的合作,他们是电视领域的标杆、领头羊,会带给整个行业示范作用;个人开发者也是标杆的一种,并不是因为他们的流量多大、用户有多少,而他们是代表了一批很有梦想,想把语音交互融入到自己生活里的一类人,这个示范作用也很大。

  所以,更多的是看这个标杆客户是不是有很强的代表性,有很强的辐射能力,能够引领风向,能够吸引更多的合作伙伴跟我们一起来做这件事情。

  谈语音:从“连接信息”到“唤醒万物”,语音交互将无处不在

  (1)语音是大势所趋,未来是语音交互的时代

  声学在线:从PC互联网时代到移动互联网时代,搜索方式一直在不断进化。而AI也是百度基于搜索引擎的核心技术自然进化的结果。您加入百度后,开创的引入了语音搜索、图像搜索、对话式搜索等创新搜索交互方式,从以往的关键词到现在的语音Freestyle,语音搜索会成为未来搜索的主流方式吗?

  景鲲: 科技发展的基本趋势是不变的。首先,对于交互而言,无论下一代搜索是什么,它都是以更简单、更自然的搜索方式,人和设备之间的交互变得越来越简单,没有门槛。无论视觉、语音,或者其他的搜索方式,肯定是这样一种大趋势。

  第二,未来的搜索和人机交互,肯定是双向的,而不会是单向的。人跟机器表达,最高效的方式是用语音;而机器与人表达,最高效的方式是使用屏幕——图像。所以,语音是一个趋势。人跟设备之间的语音对话会变得越来越自然,所以未来应该是语音交互的时代。

  现在,有的人还半信半疑,有的人可能还不确定,但是时代可能就是往往掌握在那些有理想、有愿景、想把事情做成的人身上。

  (2)不要着急抢风口,用户体验才是王道

  声学在线:在中国,智能音箱被小米、京东、阿里巴巴等巨头押宝,俨然形成了抢占人工智能入口的大战。也有人质疑智能音箱,认为其不会是一个现象级的产品。您如何看待入口这件事情?DuerOS在这个过程中会扮演什么角色?

  景鲲: 我觉得最重要的是产品体验,是用户体验,而不是抢风口。如果用户体验好,你去抢风口,就会站到一个合适的位置,拿到机会。而如果单纯为了风口而去抢入口端,因为抢时间的原因,肯定没有很深的打磨产品,反而会对品牌有一定的影响。

  所以我们跟我们的合作伙伴说,如果我们推出一款基于DuerOS的设备产品,我们希望体验是最好的,不要为了争抢这几个月的时间,盲目的透支自己的品牌。用户体验绝对是第一优先级,无论是不是风口,如果体验做好了,绝对就是风口,如果体验不好,风口也不是你的。

  DuerOS现在之所以赋能这么多合作企业,就是希望每一个设备都是可以交互的,语音交互无处不在,唤醒万物,万物都能够对话,这是我们的愿景。如果万物都可以对话,这样所有设备都是入口,大家都有机会。

  产业是需要分工的,DuerOS的分工就是要把底层听清,听懂和满足的能力做到绝对最好,配合产业链上下游发展。DuerOS是一个很开放的平台,很多第三方都在上面build skill。生态的发展是比较开放的好,从这个角度,我们把底层搭建好,上端开放给用户,合作伙伴和开发者基于此做产品功能的深度定制,做他们擅长的技术攻关。这样的话,我们有我们的竞争力,同时我们也跟整个产业上下游有一个清晰的分工,大家会有不同的收益。

  (3)最看好软硬结合的创新,DuerOS服务于生态系统所有玩家 

  声学在线:DuerOS是赋能AI时代的底层操作系统,要把底层听懂的能力做到绝对最好。那么,您认为现阶段对于DuerOS来说,挑战是什么?DuerOS将在哪些应用领域突破创新?

  景鲲: 现在,很多合作企业已经跟我们走到一起了。对于DuerOS来讲,我们现在最大的挑战其实不再是接触新客户,更多的挑战是:面对生态系统里这么多玩家,怎么把自己的工作做好,来满足这些合作企业的需求。当星火燎原之势展开之后,怎么让火势更猛烈一些。

  目前,对于DuerOS所在的领域,我们第一个看好的是软硬结合的创新。其实,智能设备的发展是有起伏的。早期,设备能连接上手机就自称为智能设备。其实它的交互是很复杂的。首先,在家里找到手机就是很费劲的一件事,找到之后还要解密码、打开App、选择设备等等,还不如走到设备面前按一下更简单。这是那个时代智能设备发展的挑战。

  现在使用语音,比你走到设备前更方便。比如说你躺在床上不想走,跟灯说让它关灯,这个灯就关好了——这就是一个很自然的使用场景,我希望这种软硬结合的创新更多一些。在家里、在车里,双手被束缚、或者不希望用双手去处理一些工作的时候,语音就可以发挥它的作用。

  我们希望DuerOS作为底层的开放平台支持各种各样的具体设备,无论是音箱,还是电视。这些设备,在我眼中它都是麦克风,我希望大家能养成一种习惯,看到这个设备就跟它说话。

  (4)分而治之,DuerOS要做支持所有应用的开放平台

  声学在线:您是NLP(自然语言处理)领域的专家,从微软开始就推动NLP研究和应用的进展。您如何看待NLP领域的两个子集——开放域聊天和任务型对话的?DuerOS又是如何处理这两方面应用的技术挑战?未来,DuerOS在NLP领域中又将承载哪些期望与使命?

  景鲲: 首先,做一个大而全的开放人机交互系统有很多挑战,最大的挑战在于对话控制。即使是单轮对话也会有挑战,而在多轮对话的时候,需要结合上下文,理解整个情境。而用户跟机器表达的时候,思维是跳跃性的,机器理解就会更有挑战。

  如何解决呢?我是学计算机出身的,策略就是分治原则,分而治之,把大问题变成小问题。我们把通用的人机交互进行切分,有的切分成开放域聊天,有的切分成任务型对话,有的切分成其他的。

  开放域聊天要跟用户产生真实的连接黏性,这方面技术挑战是非常大的。现在也有一些公司把开放域聊天放到更多的垂直领域上去,比如说,做某一个垂直品类的聊天、甚至是某一个群体聊天,例如儿童。这也是分治原则,由一个大问题切分成小的问题。

  任务型对话,其实有的时候是从声控指令过渡来的,往往边界比较清楚,解决起来更容易。所以,基本上是从最初的控制指令,慢慢变成让用户Freestyle的表达,这是一个逐步的由简变难的过程。

  从百度来讲,DuerOS是一个大的开放式平台,对于任务型对话,就是指令型、控制型的这种表达是支持的。我们希望它能够在很多实际场景中落地,解决用户的痛点。而对于开放域聊天,对于某些特定的用户,比如日本的宅男文化,比如小朋友跟机器人对话就喜欢跟汤姆猫聊天的模式,我们也希望有一些技术平台支持开放域聊天,我们对他们都会进行支持。

  为什么百度会去支持?第一,解决这些问题还是要数据足够多,百度的数据足够多。第二,百度永远是站在技术的最前端。所以,对于现在来讲有挑战,但是未来潜力巨大的技术,我们也会有一些投入。短期和长期的都会有相应的技术储备,只不过产品化的时间点不太一样。

  (5)标准与标配,未来语音交互无处不在

  声学在线:自从百度开发者大会之后,我们明显感受到语音交互的重要性被再次划线。 DuerOS战略地位的上升,这是的战略决策的结果,还是人工智能发展的必然趋势?百度会同国外巨头微软、亚马逊等一样,推出NLP领域的相关评测标准吗?如果畅想5年后DuerOS的发展,您的期望是什么?

  景鲲:百度战略一直都是持之以恒的进行的。对于语音对话自然交互的投入的时间和资源都非常大,这是百度主航道的业务的延伸,其实就是我们前面提到的搜索的进一步——下一代搜索。标准方面我们还在内部的探讨期,希望推出一个让大家都比较认可的标准。标准之所以能成为标准,就是其他人要遵守、愿意参与到其中。这涉及到一些具体执行规则的制定,现在我们还在讨论过程中。我们希望将来形成一种行业背书,让用户看到DuerOS的标识,就知道这个是经过测试,体验稳定的设备。具体怎么更进一步的开放标准,我们内部也还在讨论过程当中。但是,百度已经在布局这件事了。如果畅想5年后,我希

  望比较形象化一点,那个时候,我儿子估计8岁了,希望他能够看到一个设备就想跟它去对话,我希望5年后达到那种程度。怎么能够让用户、让普通老百姓认知到语音交互应该是标配,是应该具备的能力,这需要整个业内一起做这件事情的时候会更好。

  希望未来每一个设备都是可以交互的,语音交互无处不在,唤醒万物,万物都能够对话,这是我们的愿景!

责编:张之颖