@ 2015.07.30 , 13:17

麻省理工发明能识别物体并即时生成地图的成像系统

[-]

上面的 Gif 看起来是不是有种迷之既视感?答案就在下方:

[-]

没错,这简直就是《终结者2》里 T-800 的视角嘛!

和 T-800 相似,麻省理工学院计算机科学与人工智能实验室开发出了一套可以识别物体的系统,该系统使用一个普通的 RGB 摄像机(终结者式的血红色暴力滤镜自然就免了...),能够精确地识别出物体。在未来,它或许能帮助机器人更好地与所处环境进行交互,也能更有效率地为人类导航。研究的首席作者 Sudeep Pillai 说:“理想的情况是,在未来某一天机器人能为我们洗盘子。我们需要通过这个系统让机器人看到应该看见的东西,并且与其产生互动”。

这套系统整合了之前就存在的经典的识别系统以及“即时定位于地图构建”(SLAM)系统,后者能让诸如无人驾驶汽车一类的电子设备拥有一个即时的三维视角。MIT 团队开发的 SLAM-aware 系统能从多个视角识别物体收集信息,并同时为眼前的环境绘制出地图。系统从各不同的角度观察物体的每个部分,随后将收集到的信息与含有对物体描述的数据库数据进行对比。举个例子,SLAM-aware 看见一个椅子,它会从各个角度将椅子分解为座垫,四条腿和靠背,最后与数据库进行匹配得出结论。

既然 SLAM-aware 系统能够对即时生成环境三维地图,那么理所当然它也能更好地完成移动或取出物品的任务,该系统能大大减少机器人的出错率。

[-]

传统的图像识别系统,被研究团队称之为“SLAM-obvious”,它们并不会生成三维地图,也只能靠逐帧生成静态图像来识别物体。对比来看,SLAM-aware 系统在杂乱拥挤的环境中同时识别出多种物体的能力要强得多。

在一项测试中,SLAM-aware 识别物体的准确率达到了86.1%,这个数字已经可以与使用红外线进行物体识别的系统进行同等级的比较。虽然后者精度高达92.8%,但时间成本较高。某些红外识别系统需要运行4秒才能得出结论,而SLAM-aware 运行时间只有1.6秒。同时,红外线系统在户外工作时,由于光照环境不同,难度会很大。

在未来,团队将会继续改进此系统,同时将努力解决一个叫“环路闭合”的经典机器人难题。当机器人无法辨别出自己之前曾经来过的地理位置,并无法进行导航和与环境交互时,环路闭合就会发生。

研究论文猛击我

[keep_beating via popsci]

赞一个 (25)