(相关资料图)
SLAM 全称是 Simultaneous Localization and Mapping(同时定位与地图构建),是机器人和计算机视觉领域的关键技术,可以在未知环境中确定自身方位并同时构建环境三维地图,有着非常广泛的应用场景,比如说增强现实、虚拟现实等。
经过几十年的发展,视觉 SLAM 在理论上已经比较成熟,但是在实际产品应用中,往往会面临两方面的挑战。
一是关于精度和稳定性。实际场景中,难免会存在动态变化,而且很多区域没有足够的纹理,或有相似的重复纹理。这些都会导致匹配比较困难,从而导致优化计算不稳定。
二是实时性,在一些非常大尺度的场景下,甚至是城市级的场景下,SLAM的计算复杂度会非常高。要在一个低功耗的移动设备上做到实时计算,这个难度非常大的。
提升稳定性的主要思路是如何让目标函数优化变得稳定。SLAM 计算其实就是一个目标函数的优化问题,因此优化方程的正确性和充分性就显得非常重要。
传统的定位导航方案是GPS,而且只适合于室外,精度通常只有10米级别。
室内一般较常采用的方案有WiFi、蓝牙,通常定位精度也基本上只能到米级, 而且要预先去布置设备,工程量比较大、成本比较高。
相比而言,基于视觉的方案定位,精度可以达到分米甚至厘米级别,而且不需要额外布置设备,成本相对比较低。
基于视觉的定位与AR导航,主要分为三大模块,分别是稀疏地图重建、稠密地图重建和视觉定位与跟踪。
关键词: