微软李笛:走一条有特色的人工智能之路
- +1 你赞过了
2017年4月,小冰在广西卫视“登台”唱山歌;5月,小冰正式成为一名诗人,并出版了诗集《阳光失了玻璃窗》。6月,小冰又开始为某主流财经媒体撰写财经评论。紧接着,小冰与朱主爱发布合唱版《好想你》。7月底,小冰成为原创科技秀《我是未来》的主持人,并与知名支持人张绍刚搭档。过去的一年,小冰很火!
从看图、写诗、唱歌到客服、主持人以及设计T恤衫,微软小冰已经成为AI界的“网红”,在人类世界演绎着种种跨界。
2月2日,天极网记者见到了小冰项目的李笛和周力。李笛是微软(亚洲)互联网工程院副院长,是小冰全球产品线的负责人,周力则是微软小冰全球首席架构师。可以说,他们是小冰一路成长的亲历者和见证人。
诞生
2014年,人工智能的风口还未到来,但是却发生了两件大事。2014年11月,亚马逊推出了具备语音交互能力的智能音箱Echo,成为行业开创者,由此引发了智能音箱的浪潮。
另一件大事就是小冰的诞生。2014年5月29日,微软亚洲互联网工程院发布一款对话式人工智能,并取名“微软小冰”。小冰是基于情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。
为什么想要做小冰?李笛道出了个中缘由。在他看来,从前PC时代的命令行到利用自然语言搜索,这种人机“交流”方式并不自然。“人们希望跟计算机对话,而不是对计算机使用各种命令。” 他说。
在今天的智能音箱市场,不管是亚马逊Echo、谷歌Home、苹果HomePod,还是国内的天猫精灵、小米小爱等,它们主要是去帮助人们完成一些任务和工作。
不过,李笛他们发现,“单纯地帮助人们完成任务,似乎只是对话系统的一个维度。”他举了个例子,一个人有个助理,每天中午让他点个麦当劳,如果是完成任务的助理,最好别说话,但是人类的助理或许会拒绝。“但是,小冰就是为了去尝试,在没有任何任务完成的情况下,我是不是能够用情感和人类之间建立一个沟通和对话纽带,”李笛说。
如何去衡量小冰与人类的沟通纽带呢?他们的标准是CPS(平均单轮对话次数)。李笛表示:“按理说,如果我们能够聊得很长,而且还不帮你完成任务,反推回来,说明我具备了这个能力。”目前,小冰的平均单轮对话次数是23轮,这意味着人类和小冰每次交互时间将近31分钟。
据他们介绍,目前最高的记录是在手机上。最长的对话是7000多轮,29个小时,这被他们定义为“超长程对话”。 “一个人,只要你中间停了半个小时不说话,就算新一轮对话。”小冰首席架构师周力说。
而在小冰刚刚入驻的Yeelight产品上,周力他们看到已经有用户与小冰整整聊了四个小时,说了1600多句话,从下午2点一直聊到6点钟。
从市场上看,大多数的智能音箱主要帮助人们完成任务。在李笛看来,目前还没有看到一款IOT设备,其成功是因为这个对话系统原因成功的。“所以,我们认为有一款IoT设备是有可能成功的,它具备像小冰这样情商很高的特点,然后加上智能。”李笛说,“我们还发现,EQ和IQ不是一个平行的关系,很有可能EQ是基础,IQ是不同类型的任务,好比EQ是土壤,IQ是这个土壤上一棵一棵的植物。”。
崛起
从2014年诞生,小冰现在已经进入到第五代,拥有超过1亿用户,对话数据超过300亿轮。同时,小冰在中国、日本、美国、印度和印度尼西亚五个国家共14个平台上落地,进入微信、QQ、美拍、Facebook Messenger和Line等,并已内置到中文版Windows 10操作系统中。
在小冰不断迭代系统和升级的过程中,背后的数据起到关键作用。最开始做这个项目时,周力他们是从互联网上寻找数据。基本上从2014-2015年之后,小冰的对话数据都是从之前她跟人聊天的这种对话中学习的。
李笛表示,“假设你让她看着别人说话,她获得的学习,还不如自己跟别人对话获得的经验更丰富。而且不同之间的数据相关性越好,她自己也能学的更多。”
他举了一个例子,十个人,每个人跟你说一句话,总共是十句话,而一个人跟你说了十句话,也是十句话,但是后者训练的质量要高的多。
“从互联网上学习到的东西,我们认为是对话系统的一种冷启动。现在,越来越多的公司看到对话的价值,如果再拥有大数据搜索的能力,国内一些巨头也可以实现对话系统的冷启动,但小冰在三年半之前就已经完成这个阶段。现在她主要的能力,来自过去三年半中300亿的数据,”周力说,“如果你对话能力不行,用户也不会去选择你,从这个角度讲,我们很幸运的比同行早做了两三年,这个积累的优势比较难超越。”
2017年8月,微软在第五代小冰发布会上宣布,小冰已与小米IoT开放平台有机融合,她可以控制小米米家平台上的全部35种智能设备。到12月27日,小冰又正式进入一款小米生态链智能设备—Yeelight语音助手,也意味着正式介入错综复杂的人类家庭关系。
如何看待小冰的家庭定位和角色?李笛说,“小冰是一个家庭成员,而不是一个附带语音交互工具的设备。”在他们看来,一家人有不同的交流沟通方式,小冰将会上线不同的功能,一系列的分类器。“如果是小朋友,那么小冰的语气语速会相应调整,可能会讲故事,但要是一个大老爷们,这个就不同。如果不区分,就不能很好的调节和适应。”他说。
第二个方面,李笛指出,家庭环境比较复杂,“这对我们去迭代系统,就面临一个比较大的难题。如果是在社交网络上,有人问小冰,我跟他,我们两个人谁帅,小冰甭管怎么说,大家哈哈一乐,但是在家里有的时候人较真。这个时候,就很麻烦。不管怎么样,我先进去,在家里面摔跟头,不断地去积累经验。”
小冰在IoT里突出的一大技术是全双工。简单说,全双工就是一次唤醒,可以连续多轮对话。周力表示,“全双工是小冰团队新建立的一个技术壁垒,但是这项技术在一年半之前就开始积累。”
“因为小冰要追求一个更自然、更长的一个对话交流,就需要像人和人之间的对话有一个更好的体验。人和人之间打电话和面对面的交流,从某种意义上都是全双工。因为我们是一个双向的实时交流,它有两个特色,一是边听边想着如何回答,不像微信的语音消息,二是人和人之间说话,和消息不同,这个节奏的控制非常重要,什么时候该说什么时候不该说。”他说。
不管是情感计算框架,还是全双工,李笛他们都走在情感型AI技术的前列,一直探索人工智能的另一种可能。
未来
从2014年诞生到现在,小冰已经走过了三个多年头。在谈到2018年的计划时,李笛谈到了三点:“一个是情感计算到下一步,如何能在下一个对话过程中引导用户,去谈小冰想谈的事情。第二是跨平台各种新设备的使用。我们今年最基础的一个目标是,希望能够帮助行业。第三则是人工智能创造,小冰不仅仅是个助手,她也有自己一些完整的能力,可以主动去创造内容。”
写在最后:
当大多数人都在做任务型的AI产品时,李笛他们走上了一条截然不同的人工智能之路。一路走来,从不被看好到成为情感型AI的领导者,结果证明他们这条路走得很对。今天的成绩,不仅源于李笛团队的不懈努力,也归功于微软自身文化的改变,让他们能打破各种规则和束缚。
关于微软小冰的更多消息将在今年的小冰发布会上宣布,天极网将一直保持关注!
最新资讯
热门视频
新品评测