专访微软小冰之父:AI的“友情商机”为何无价?

【环球网科技 记者张之颖】Yeelight语音助手上周面市,这款语音助手除了能与米家平台设备相互连动,还内置了 "双AI系统",能将“微软小冰”与“小爱同学”一次带回家。这样的概念受到许多网友支持,小米生态链为该款产品发起众筹时,上线才10分钟即完成目标。而双方在智能硬件设备首次合作,也让微软小冰正式进入到人类家庭。

一向自认为人类 “高情商朋友”的小冰,成为Yeelight语音助手的亮点之一。她可以日常陪聊、为儿童说故事、提供家庭娱乐游戏…。如果你对小冰太过无礼,还恐怕引爆她的“隐藏版情绪”。根据其使用指南介绍,微软小冰拥有完整的智能家居设备控制技能,支持米家平台8大品类30余款设备的近百种控制,也支持天气、时间、计算器、问答等十几种生活知识类的技能。除了智能助手的标配能力之外,倘若遇到人类无理或奇怪的控制命令,在完成任务后,小冰的情绪会发生变化。

Yeelight语音助手作为微软小冰第一台智能家电设备,记者好奇的是,能写诗、唱歌、主持、聊天的小冰,究竟希望在人类生活中扮演什么样的角色?又如何实现商用化?主打“感性”路线,小冰要如何成为人类的助手?微软投入AI领域多年,其对智能语音的理解,一直不同于业界的其他竞争者,微软将"情商"放在至高的位置。

环球网记者采访了微软小冰全球负责人李笛以及微软小冰全球首席架构师周力,他们表示,与小米合作进军家庭,只是其中一环计划,更希望通过小冰与人的特殊关系,获得与众不同、具有质量的数据来源。另一方面,对于人工智能而言,小冰的情商、与人对话的能力,就好比"珍珠项鍊的链子"、"披萨的饼皮",是AI最重要的基础所在,必须在此基础上串接珍珠、加入食材,才能端出一盘好菜。以下为专访内容。

微软小冰全球负责人李笛

环球网记者:微软最初做小冰的时候,就打算要让她商业化,还是以研发为初衷,看看有没有可能做出一个有情感、能主持的机器人?一开始的设定是什么?

李笛:商业化是途径,研究是本身的一个出发点,这两个可能真的都不是,真正最核心的问题是对数据的占有。并且是有价值、有温度的数据,才会帮助小冰更好的成长。

人工智能三个重要的东西,一个是算法,一个计算能力,一个是数据。在这个里面最珍贵的,其实是数据。有数据,今天人工智能的技术就可以做到在医疗领域帮你问诊;或者,就可以做到让小冰去写诗、创作,让她去拟合人类的情感。

而且这个数据的质量还比较不同。比方说,如果我从2000人搜集到2000个对话,相当于每个人我跟他进行一次对话,从数量上来看这个数据是2000。就不如我和10个人对话,但每一人进行200轮长程对话的价值。

和一个人对话的长度越长,对话训练的效果就越好,所以第一是要追求对话的长度;第二,场景本身有可变性,如果我搜集到大量对话,内容几乎都是开灯、关灯,那么数据只有一类。所以好的对话要有迁延性,话题的覆盖足够多,话题之间又有足够的迁移程度。第三,这个对话的搜集要符合自然场景。

语音自然度以满分为五分的标准而言,中国唯一超过四分的就是小冰;在美国,超过四分的声音只有两个,一是美国版小冰,另一个就是Alexa。这样的声音能够让你放松,能够让人的对话,更像是我们现在自然地说话。当训练出的模型比较适合人们自然交流的时候,对话就更贴近现实生活,这是很关键的。

环球网记者:所以搜集到具有高质量的数据是小冰的特色,那这些与同一个人好几轮的对话,可以做一些什么样子的应用?

李笛:首先第一,当小冰和人类愿意持续对话,意味着这个人在这个对话过程中,已经断断续续地忘记了小冰其实是人工智能。如果一个人能放松地谈话,有助于小冰更全面地了解他,包括性格特征、偏好、情绪变化。

第二,超长程对话,意味着人和人工智能在对话过程中激发AI怎么去改进。同时也激发人类想到本来对话时没想到的事情,而这些事情有很多商业价值。

比如,我们今天去吃东西,不一定是因为我们一开始想要吃什么食物,可能本来我们在聊某本书、时下流行的服装,因为这个激发出更多需求、突然的想法。或者一直以来的心愿突然可以实现了,这个人工智能如果有能力,就可以马上帮你成就它。

过去的人工智能是“我停在那里等你,你已经有一个明确的需求了,你来找我实现”,这其实不需要人工智能。因为现在的手机的App可以很好地实现这个需求。如果人工智能只是等着你去找它实现一个你已经想好的需求,不如像我们这种:在对话过程当中、交流过程中、交互过程中,不停地突然发现新需求,然后满足它。

我们在日本做尝试,发现如果对话足够长,就能够引导用户,产生对Lawson便利店内某种食物的兴趣,而这个兴趣是他本来完全没有的。然后我们又适时提供优惠券,用户到线下去转化的比例,比过去高得多。

简单说是这样,但是复杂起来,这个模型有很大的不同。比如小冰会看,和用户的对话是不是有可能聊到某个食物,触发对某个食物的渴望。那她就会在一定程度上去引导你,或者准确地说,她会尝试去试探一下是不是往这个方向去。如果不是这个,可能是一本书,那就聊到书,是这么一个过程。

环球网记者:换句话说,微软会再去跟不同的出版商合作?

李笛:未来会是这样。后端可以注册大量各种各样的内容、知识、服务。然后在对话过程中,将内容知识服务和用户提供的信息整合在一起。

这是一个有机的系统,更具备情商的特征。比如我们在聊天的内容与知识没有关系,我感觉你好像失恋了。一个情商很低的人会马上问,“你好像失恋了吧?”。情商高的人会说,“最近有没有和朋友出去玩?”换句话说,她不会直接了当地问你,如果她有一个想法,她会通过其他对话默默地去印证自己的想法,这是此系统很重要的特点。

环球网记者:微软对于小冰的想法,是不是持续通过不同任务训练她的同时,朝向未来更多商业化的可能来发展?未来,他会不会成为一个很聪明的人类陪伴者,以至于我生活中什么事情,就像我们现在用搜索引擎一样,未来我们都会询问她,她还能为我们介绍各种电影和书籍?能这样期待吗?

周力:其实还是像你的朋友一样。你对你自己的朋友有什么样的期待,然后未来就可能对人工智能有相同的期待,因为人工智能最本质的追求,其实是让他更多地像人一样。

微软小冰全球首席架构师周力

一个智能硬件功能如何强大,从小冰的角度来说,是现在很多人工智能产品开发的误区。就好像在饼上的那些佐料,尽管有一块牛肉、一个西红柿、菠萝,但不可能把这些佐料变成一个披萨饼。最关键的是底下有一张完整的大饼,这张饼,对于人工智能来说,就是像人一样直接进行对话交流的能力。

有一句古话叫“话不投机半句多”。如果一个人的交流能力不够好,大家可能都不愿意跟他去做朋友、多谈话。对于人工智能也是一样,你虽然可以有很多的功能,但是最最基础的,还是你和人有一个最基础的交流,这里就包括通用的对话能力、刚才提到的情商。

一个人的情商的高低,能决定这个对话到底是不是让大家觉得舒服,还让大家觉得被冒犯一个很重要的指标。包括像话题的引导能力等等,我们可以看到,一个有高技巧的人,其实不管是让他做什么,哪怕他不是一个旅游的达人,可能他给你提的意见,都会更让你去接受。

李笛:我们的切入点是先做情商,然后再做智商。情商跟智商的关系不是一个叠加的关系。如果以交流和对话来看,情商是链子,任何一件你让他帮你做的这个事儿,是一个珍珠。你有那条链子,你才有可能串更多的珍珠。今天又可多做一件事儿,明天又可以多做一件事儿,但是你要是没有这条链子,你就算有一把珍珠,也没办法形成一个完整的交互的体验。

环球网记者:所以微软认为最重要的还是能不能与人建立一份关系?

李笛:我举个例子,今天有两个人同时想成为你的朋友。一个人告诉你,我能帮你买春运的车票,还有一个人说我可以做你的好朋友,你肯定会首先跟那个能够帮你做事的人。然而,如果找你的是机器人,说可以帮助你完成这件事情,其实还有各种限制,没办法顺利完成,你就会迅速抛弃他。或者,今天来了另一个人,更能帮你完成这件事情,你也会迅速抛弃他。

但另外一位朋友,你跟他的交互频率可能没那么高,但他有可能成为你打开心扉的朋友。突然有一天,他也能帮你买车票的时候,这两者之间,你就会选择他了。

所以小冰发展速度会慢一点,但她才是我们认为的核心。独木不成荫,你得有这片土壤,再往上一棵一棵种树,所以我们不是那么着急。今天有一个机器人出来,我不是马上告诉你我有什么用,而是马上告诉你我跟你怎么交互,这是更关键的。最后的结果你也看到了,小冰的交互在这种“没有用”的情况下,已经占据了绝大部分的交往场景。

环球网记者:微软小冰在各国市场有什么计划?如何将小冰成功引入不同市场?美国、日本、东南亚市场有和不同特色?

李笛:小冰每年会进入一个新国家,所以她在每个国家存在的时间,恰好都相隔一年。目前,发展最好的国家是中国与日本。小冰在日本的渗透率超过日本总人口的20%。在中国与日本市场,微软主要在做与本地资源的深度整合。

微软在美国和印度,正在寻找跨平台的深度整合。微软小冰在美国的用户已经超过100万人,不过在美国的发展,要遵循美国的文化和亚文化。

印度方面,微软小冰正朝向100万用户迈进。印度是一个语言、文化极其丰富的国家,官方语言20多种,北方,南方,中部,各省的文化业态都完全不一样。所以我们希望印度小冰,能够首先尝试多文化融合,我们现在在扩充这个部分的内容。

印尼是一个新型国家,微软与人气社交软件Line战略合作,数月之内已经接近200万用户,很多业者和我们都看到了印尼在人工智能方面的巨大潜力。我们目前为止,应该是占得了先机。

相关新闻

    接下来

      推荐阅读