如果机器人知道A点是客厅沙发,B点是冰箱,即使它不在一个陌生的地方,从A点到B点的机器人也会更有效率。这就是卡内基·梅隆大学和Facebook AI Research(FAIR)开发的“语义”导航系统背后的常识性想法。
这种名为SemExp的导航系统上个月在虚拟计算机视觉和模式识别会议上赢得了人居ObjectNav挑战赛,该会议由来自三星研究中国的团队组成。这是CMU团队在年度挑战赛中连续第二次获得第一名。
SemExp或面向目标的语义探索,使用机器学习来训练机器人识别物体(例如,知道厨房桌子和茶几之间的区别),并了解这些物体在家庭中的什么位置找到了。博士学位的Devendra S. Chaplot说,这使系统能够从战略上考虑如何搜索事物。CMU机器学习系的学生。
Chaplot说:“常识说,如果您要买冰箱,最好去厨房。”相比之下,经典的机器人导航系统通过构建显示障碍物的地图来探索空间。机器人最终到达了需要去的地方,但是路线可能是circuit回的。
以前使用机器学习来训练语义导航系统的尝试已受到阻碍,因为它们倾向于记住对象及其在特定环境中的位置。这些环境不仅复杂,而且系统通常难以将其学到的知识推广到不同的环境。
Chaplot与FAIR的Dhiraj Gandhi以及机器人学院副教授Abhinav Gupta和机器学习系教授Ruslan Salakhutdinov一起工作,通过使SemExp成为模块化系统,避免了这个问题。
Chaplot说,该系统利用其语义洞察力来确定寻找特定物体的最佳位置。“一旦决定要去哪里,就可以使用经典计划来达到目标。”
事实证明,这种模块化方法在几种方面都是有效的。学习过程可以专注于对象与房间布局之间的关系,而不是学习路线规划。语义推理决定了最有效的搜索策略。最后,经典的导航计划使机器人需要尽快到达目的地。
最终,语义导航将使人们与机器人进行交互变得更加容易,使他们能够简单地告诉机器人在特定位置取回一件物品,或者给出诸如“转到左侧第二扇门”的方向。