AI不靠地图认路,强化学习看街景就可以导航
- +1 你赞过了
近日,DeepMind在官方博客上公布了一项最新研究,这项研究是:通过强化学习,让AI在没有准确的地图作为训练资料的情况下,只通过谷歌街景图就学会导航,类似人在学习认路的过程一样。
DeepMind表示,导航是人类和动物一项很重要的认知能力,可在复杂遥远的距离范围内穿梭,而这项能力主要通过自我定位和对目的地的认知来完成的,也就是“我在哪里”和“我要去哪里”这两项认知。
在这项实验中,DeepMind提出了一个用谷歌街景图当作第一视角的互动式导航的环境,作为训练导航AI的资料,通过奖励的游戏方式,训练导航AI。
首先,DeepMind通过神经网路建立相应的AI模型,辨识多个城市街景图中的像素,AI程序如果成功到达了目的地,就得到奖励,DeepMind表示,就像是负责送货但没有地图的快递员一样,经过反覆学习,程序就可以穿梭于整个城市,在不同的城市都运用相同的方式来学习导航。
与过去的导航相比,DeepMind的方法是模拟了人类导航的方法,不使用既有的地图信息、GPS或其他的定位工具,只通过训练视觉感知来观察环境,从而创建出对环境的认知,并通过强化学习加强点到点的训练,目前,导航AI模型已在伦敦、巴黎和纽约完成训练,能实现穿梭于复杂的交叉路口、人行道和隧道等环境。
此外,DeepMind将训练完成的导航AI架构模块化,用于转移到其他新的城市中省去不必要的学习过程,DeepMind将神经网络分成三个部分:
首先,处理街景图像并抽取图像特征的卷积网络;
其次,通过特定的神经网络,让它记住当前位置和目标位置;
最后,产生导航的规则和导航策略。
DeepMind通过建立MultiCity架构,在多个城市中训练模型,之后将策略网络和视觉卷积网络、特定路径记录下来,方便于加快之后在不同城市的训练过程。目前该项研究只限于知识上的导航,并没有实际用于任何交通工具上,比如自动驾驶。
最新资讯
热门视频
新品评测