转载自:双目测距系列(四)初识KITTI数据集
作者:ltshan139
前言
monodepth模型是基于KITTI数据集来训练的。为了能复现这个训练过程,从而为以后训练自己数据集奠定较好的基础,还是需要把这个数据集下载到本地,并成功训练。
你能使用下面这条命令来下载raw KITTI数据集,但这个数据集很大,大约150多GB,而且里面提供的是外网链接,很难下载下来。建议看看国内有没有人把该数据集放到百度网盘上。
wget -i splits/kitti_archives_to_download.txt -P kitti_data/
我手头只有很少一部分该数据集(同事找的),让我们先一起认识下它大概的内容。
数据集
如上图所示,2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是两段独立的数据集,里面结构完全一样。下面仅以2011_10_03_drive_0027_sync为例来讲解其内容。
KITTI数据集是一台载有4个摄像头,一台Velodyne 3D激光雷达以及一台GPS/IMU(导航设备,其品牌为OXTS)的车子行驶在道路所采集得到的数据集。
理解了这个,再回头看上面的图,就可以知道上面每个目录对应一个传感器所采集的数据。
1)4个sensor数据集
子目录image_00/01/02/03里面都是对应4个sensor所拍的png照片。00和01对应的是左、右两个灰度摄像头,02和03对应另外两个左、右彩色摄像头。需要注意的是,左右两个摄像头的照片已经严格对齐了的。如下图所示:
2)velodyne_points
这个是雷达所采集数据集,都是bin文件,方便软件工具读取。有多少张照片,对应就有多少个bin文件。bin里面都是每个像素的实际坐标值(x,y,z,r)。由于雷达坐标系的x轴是向前的,所以其x值反映了深度。
3)oxts
它是导航设备获取的数据集,里面都为txt文件。每个照片对应有一个txt文件。里面的格式要看dataformat.txt。
标定参数值
说完了数据集,再来看看另外一部分(标定参数)。
1)calib_cam_to_cam.txt
它分别描述了4个摄像头的内参以及0和1,2和3之间的外参。如下所示,如果做过标定的话,应该不难理解。
2)calib_imu_to_velo.txt
这个描述了导航坐标系到雷达坐标系的旋转和平移矩阵。
3)calib_velo_to_cam.txt
描述了雷达坐标系转换到摄像头坐标系。其实也只有R和T有用,delta_f和delta_c很少用。
推荐阅读
- 双目测距系列(三)monodepth2模型的测试
- 双目测距系列(二)鱼眼镜头双目标定及测距
- 双目测距系列(一)标定工具的开发
- 《SSD和MobilenetSSD模型的训练,量化以及在海思芯片上的部署》视频课程的介绍
更多海思AI芯片方案学习笔记欢迎关注海思AI芯片方案学习。