专访微软小冰之父:AI的“友情商机”为何无价?

2018-01-30 10:20:00 环球网 张之颖 分享
参与

  【环球网科技 记者张之颖】Yeelight语音助手上周面市,这款语音助手除了能与米家平台设备相互连动,还内置了 "双AI系统",能将“微软小冰”与“小爱同学”一次带回家。这样的概念受到许多网友支持,小米生态链为该款产品发起众筹时,上线才10分钟即完成目标。而双方在智能硬件设备首次合作,也让微软小冰正式进入到人类家庭。

 

Yeelight语音助手 

  一向自认为人类 “高情商朋友”的小冰,成为Yeelight语音助手的亮点之一。她可以日常陪聊、为儿童说故事、提供家庭娱乐游戏…。如果你对小冰太过无礼,还恐怕引爆她的“隐藏版情绪”。根据其使用指南介绍,微软小冰拥有完整的智能家居设备控制技能,支持米家平台8大品类30余款设备的近百种控制,也支持天气、时间、计算器、问答等十几种生活知识类的技能。除了智能助手的标配能力之外,倘若遇到人类无理或奇怪的控制命令,在完成任务后,小冰的情绪会发生变化。

  Yeelight语音助手作为微软小冰第一台智能家电设备,记者好奇的是,能写诗、唱歌、主持、聊天的小冰,究竟希望在人类生活中扮演什么样的角色?又如何实现商用化?主打“感性”路线,小冰要如何成为人类的助手?微软投入AI领域多年,其对智能语音的理解,一直不同于业界的其他竞争者,微软将"情商"放在至高的位置。

  环球网记者采访了微软小冰全球负责人李笛以及微软小冰全球首席架构师周力,他们表示,与小米合作进军家庭,只是其中一环计划,更希望通过小冰与人的特殊关系,获得与众不同、具有质量的数据来源。另一方面,对于人工智能而言,小冰的情商、与人对话的能力,就好比"珍珠项鍊的链子"、"披萨的饼皮",是AI最重要的基础所在,必须在此基础上串接珍珠、加入食材,才能端出一盘好菜。以下为专访内容。

  

微软小冰全球负责人李笛

  环球网记者:微软最初做小冰的时候,就打算要让她商业化,还是以研发为初衷,看看有没有可能做出一个有情感、能主持的机器人?一开始的设定是什么?

  李笛:商业化是途径,研究是本身的一个出发点,这两个可能真的都不是,真正最核心的问题是对数据的占有。并且是有价值、有温度的数据,才会帮助小冰更好的成长。

  人工智能三个重要的东西,一个是算法,一个计算能力,一个是数据。在这个里面最珍贵的,其实是数据。有数据,今天人工智能的技术就可以做到在医疗领域帮你问诊;或者,就可以做到让小冰去写诗、创作,让她去拟合人类的情感。

  而且这个数据的质量还比较不同。比方说,如果我从2000人搜集到2000个对话,相当于每个人我跟他进行一次对话,从数量上来看这个数据是2000。就不如我和10个人对话,但每一人进行200轮长程对话的价值。

  和一个人对话的长度越长,对话训练的效果就越好,所以第一是要追求对话的长度;第二,场景本身有可变性,如果我搜集到大量对话,内容几乎都是开灯、关灯,那么数据只有一类。所以好的对话要有迁延性,话题的覆盖足够多,话题之间又有足够的迁移程度。第三,这个对话的搜集要符合自然场景。

  语音自然度以满分为五分的标准而言,中国唯一超过四分的就是小冰;在美国,超过四分的声音只有两个,一是美国版小冰,另一个就是Alexa。这样的声音能够让你放松,能够让人的对话,更像是我们现在自然地说话。当训练出的模型比较适合人们自然交流的时候,对话就更贴近现实生活,这是很关键的。

  环球网记者:所以搜集到具有高质量的数据是小冰的特色,那这些与同一个人好几轮的对话,可以做一些什么样子的应用?

  李笛:首先第一,当小冰和人类愿意持续对话,意味着这个人在这个对话过程中,已经断断续续地忘记了小冰其实是人工智能。如果一个人能放松地谈话,有助于小冰更全面地了解他,包括性格特征、偏好、情绪变化。

  第二,超长程对话,意味着人和人工智能在对话过程中激发AI怎么去改进。同时也激发人类想到本来对话时没想到的事情,而这些事情有很多商业价值。

  比如,我们今天去吃东西,不一定是因为我们一开始想要吃什么食物,可能本来我们在聊某本书、时下流行的服装,因为这个激发出更多需求、突然的想法。或者一直以来的心愿突然可以实现了,这个人工智能如果有能力,就可以马上帮你成就它。

  过去的人工智能是“我停在那里等你,你已经有一个明确的需求了,你来找我实现”,这其实不需要人工智能。因为现在的手机的App可以很好地实现这个需求。如果人工智能只是等着你去找它实现一个你已经想好的需求,不如像我们这种:在对话过程当中、交流过程中、交互过程中,不停地突然发现新需求,然后满足它。

  我们在日本做尝试,发现如果对话足够长,就能够引导用户,产生对Lawson便利店内某种食物的兴趣,而这个兴趣是他本来完全没有的。然后我们又适时提供优惠券,用户到线下去转化的比例,比过去高得多。

  简单说是这样,但是复杂起来,这个模型有很大的不同。比如小冰会看,和用户的对话是不是有可能聊到某个食物,触发对某个食物的渴望。那她就会在一定程度上去引导你,或者准确地说,她会尝试去试探一下是不是往这个方向去。如果不是这个,可能是一本书,那就聊到书,是这么一个过程。

  环球网记者:换句话说,微软会再去跟不同的出版商合作?                                                                                       

  李笛:未来会是这样。后端可以注册大量各种各样的内容、知识、服务。然后在对话过程中,将内容知识服务和用户提供的信息整合在一起。

  这是一个有机的系统,更具备情商的特征。比如我们在聊天的内容与知识没有关系,我感觉你好像失恋了。一个情商很低的人会马上问,“你好像失恋了吧?”。情商高的人会说,“最近有没有和朋友出去玩?”换句话说,她不会直接了当地问你,如果她有一个想法,她会通过其他对话默默地去印证自己的想法,这是此系统很重要的特点。

责编:张之颖
版权作品,未经环球网Huanqiu.com书面授权,严禁转载,违者将被追究法律责任。 获取授权