KITTI-360数据集:全景感知的新维度

2024-01-09 09:53:21·  来源:汽车测试网  
 

随着自动驾驶技术的飞速发展,大规模且丰富的数据集成为推动算法进步的关键因素之一。在这一背景下,KITTI-360数据集应运而生,为研究者提供了一个包含丰富感官信息和完整注释的大规模数据集。


一. 数据集概述


数据采集方式


KITTI-360数据集记录了德国卡尔斯鲁厄的几个郊区,通过旅行车的装置采集数据。这一装置包括两侧各配备一个180°的鱼眼相机、前面一个90°的透视立体相机(基线60厘米)、车顶上安装的Velodyne HDL-64E和SICK LMS 200激光扫描装置。这个配置使得KITTI-360获得了完整的360°视野,相较于KITTI数据集,提供了更为全面的感知信息。


数据集内容


KITTI-360数据集在73.7公里的驾驶距离内,共采集了超过32万张图像和10万个激光扫描。对静态和动态的三维场景元素进行了粗糙的边界基元注释,并将这些信息转移到图像领域,为三维点云和二维图像提供了密集的语义和实例注释。这使得数据集成为一个理想的训练和评估基准。


二. 采集装置详解


鱼眼相机和透视立体相机


KITTI-360数据集采集装置的独特之处在于两侧各配备的180°鱼眼相机和前置的90°透视立体相机。鱼眼相机提供了全景视角,覆盖了车辆周围的所有方向。这使得感知系统能够捕捉到更广泛的感知范围,从而更全面地理解车辆周围环境。而透视立体相机通过其基线为60厘米的设置,提供了更为立体的深度信息。这样的配置在距离感知上具有显著的优势,有助于算法更准确地理解远近物体之间的距离关系。


Velodyne HDL-64E和SICK LMS 200激光扫描装置


在车顶上安装的Velodyne HDL-64E和SICK LMS 200激光扫描装置是KITTI-360数据集的核心组成部分。这两个激光扫描装置以推杆式配置,使得360°的激光扫描成为可能。通过这样的设置,KITTI-360能够以高精度获取三维点云信息,为感知系统提供丰富的立体结构和深度信息。这对于目标检测、轨迹跟踪等任务具有重要意义。


IMU/GPS定位系统


KITTI-360的系统还配备了一个IMU/GPS定位系统,为数据集提供了准确的位置信息。通过结合惯性测量单元(IMU)和全球定位系统(GPS),可以实现对车辆位置和方向的高度精确的定位。这对于研究者分析车辆在不同场景下的感知行为,以及算法在真实道路条件下的性能表现提供了重要的上下文信息。


三. 数据集在自动驾驶和三维感知中的应用


自动驾驶算法训练


KITTI-360数据集的全景感知信息为自动驾驶算法训练提供了更为丰富的数据源。全景鱼眼相机和360°激光扫描使得算法能够更好地感知车辆周围的环境,包括盲区和复杂交叉路口。这对于提高自动驾驶系统对于静态和动态场景的理解能力至关重要,为算法在各种复杂场景下的鲁棒性提供了强有力的支持。


三维感知研究


KITTI-360数据集在三维感知研究领域中具有巨大的价值。密集的语义和实例注释使得研究者能够深入分析静态和动态场景元素。三维点云和图像的结合为感知算法提供了更为细致和全面的输入,推动了对于感知系统更高层次理解的研究。这对于三维点云处理、物体识别、和环境建模等方向都有着积极的推动作用。


通过对KITTI-360数据集采集装置和在自动驾驶及三维感知中的应用进行详细展开,我们更全面地了解了该数据集的独特之处以及对于相关领域的积极影响。这为未来感知算法的研究和开发提供了宝贵的经验和资源。

分享到:
 
反对 0 举报 0 收藏 0 打赏 0
沪ICP备11026917号-25