天极传媒:
天极网
比特网
IT专家网
52PK游戏网
极客修
全国分站

北京上海广州深港南京福建沈阳成都杭州西安长春重庆大庆合肥惠州青岛郑州泰州厦门淄博天津无锡哈尔滨

产品
  • 网页
  • 产品
  • 图片
  • 报价
  • 下载
全高清投影机 净化器 4K电视曲面电视小家电滚筒洗衣机
您现在的位置: 天极网 > 云计算>新闻>对话阿里达摩院语音交互科学家鄢志杰

对话阿里达摩院语音交互首席科学家鄢志杰:语音交互将无处不在

天极网云计算频道 2018. 07. 13 作者:骨傲天 责编:万佳
我要吐槽

责任编辑

  在电商、金融、物流、云计算之后,阿里巴巴将会做什么?

  “继电商、金融后的另外一条主赛道,阿里巴巴拥抱IoT时代,要做IoT基础设施搭建者。而且有宏伟的目标,5年内连接100亿的设备。”阿里巴巴达摩院-机器智能技术实验室语音交互首席科学家鄢志杰先生说。

  在7月5日深圳价值工厂召开的首届零一科技节上,鄢志杰发表了“语音交互如何重塑人与IoT的关系”的主题演讲,并在演讲结束后接受了天极网记者的采访。

  人与机器交互的变迁

  从互联网的变迁来看,我们从PC互联网到移动互联网,最直观的感受是上网速度越来越快。上网不再局限于获取信息,还能购物、点外卖、打车、看视频等。

  伴随着这些变迁,人们跟机器和互联网“打交道”的用户界面也发生了很大变化。

对话阿里达摩院语音交互首席科学家鄢志杰:语音交互将无处不在

  鄢志杰表示,从打孔卡片、命令提示符到图形用户界面,人类与机器的交互变得越来越简单、越来越好用。他说,“随着这些界面的变迁,大家会发现,每一次用户界面的升级,都来自技术的进步。人机交互界面的进步又推动硬件的改变,从最开始笨重的机器到现在可随意放进口袋的小型计算设备。”

  与此同时,这些界面和硬件的变迁也反映着世界新老科技巨头的更替和兴衰。在软盘交互时代,IBM是那个时代的“霸主”;后来,微软推出操作系统,让交互变得更简单,这让它成为软件行业巨头,在PC市场获得领导地位。而在移动时代,苹果iPhone用触屏体验开启了移动互联时代。

  自然交互将重塑人与IoT的连接

  在鄢志杰看来,互联网的内容未来会发生改变,商品和服务将变得个性化。同时,互联网的入口可能会更加多元化,覆盖各种各样的IoT设备,比如电视、汽车、音响可穿戴设备和机器人等。并且,人机交互界面也会从触屏向自然用户界面发展。

  在万物互联时代,交互成为非常重要的关键。他说,“多模态的语音交互和自然交互,将重塑人跟这些设备之间的连接,以及人与IoT的连接。”

对话阿里达摩院语音交互首席科学家鄢志杰:语音交互将无处不在

  目前来看,智能音箱成为语音交互的“试验田”。亚马逊Alexa的成功,不仅让人们见识到智能音箱的应用场景,而且也明白语音交互未来广阔的应用前景。作为一个系统,语音交互几乎可以进入任何硬件设备,依靠大量的数据训练,它可以实现快速迭代。

  因此,我们看到一夜之间,中国市场出现“百箱大战”,比如天猫精灵、小米小爱、小雅AI音箱等。

  从用户的反馈看,部分智能音箱的体验效果并不好,甚至被网友戏称为“人工智障”。在鄢志杰看来,虽然当下智能音箱的智能程度离用户的期待也许还有一定距离,但这是一个很好的开始。“今天,语音交互设备能够大规模触达用户,以前更多是在电影里看到,现在这种大规模的触达用户,我觉得对技术的进步很重要。”他说。

  从技术到产品再到商业,这是一个商业化的过程。他认为,通过商业化,让产品大规模触达用户,是一个很好的开始。收集用户的反馈意见,来倒推产品的提升,进而推动技术的进步。这正好是当今互联网行业的产品思维,小步快跑,快速迭代,实现产品升级。

  从室内到公共空间 阿里巴巴的探索和尝试

  在这条路上,他介绍了阿里巴巴自己的经历和探索。虽然他在阿里巴巴达摩院,但是他们并不是一个单纯的研究院,里面有各种各样的人,包括技术、研发、设计、产品、工程和商业等。

  这种尝试首先是室内,比如你的屋子和办公室可以放智能音箱,通过语音交互控制电视。然后是汽车,阿里巴巴和上汽集团合作成立了斑马网络,在智联网汽车里实现全语音交互。“做完屋子、汽车之后,我们思考下一个应用场所是什么?显然是公共空间。” 鄢志杰说。

对话阿里达摩院语音交互首席科学家鄢志杰:语音交互将无处不在

  但是,与其他场所相比,公共空间要实现语音交互存在两大问题:一是噪声,二是干扰。如何解决这些问题?他们把计算机视觉和语音交互等多种技术结合形成了一套“多模态语音交互”系统。通过摄像头,可以定位你的身高、角度、位置等,然后把麦克风阵列朝向目标对象,让他的语音实现最大程度增强,把旁边的噪声进行抑制。比如,阿里巴巴在上海地铁提供的语音售票机。

  从屋子、汽车到公共空间,在鄢志杰看来,“所有的尝试都是希望这样的接触点越来越多,最终实现人机的自然交互。”

  他说,“在IoT时代,语音交互会变得无处不在,即随时随地地连接人与互联网。我们走过了从屋子到车子再到公共空间的过程,现在更多做技术的研究和商业化的落地。”

  写在最后:

  在笔者看来,语音交互具有颠覆性,或许成为继触屏体验的下一次革命。在这种变革中,不仅需要像鄢志杰这样的技术研发者,而且也需要成功的产品,实现真正落地。

作者:骨傲天责任编辑:万佳)
请关注天极网天极新媒体 最酷科技资讯
扫码赢大奖
评论
* 网友发言均非本站立场,本站不在评论栏推荐任何网店、经销商,谨防上当受骗!
办公软件IT新闻整机