双目测距系列（四）初识KITTI数据集 - 极术社区

转载自：双目测距系列（四）初识KITTI数据集
作者：ltshan139

前言

monodepth模型是基于KITTI数据集来训练的。为了能复现这个训练过程，从而为以后训练自己数据集奠定较好的基础，还是需要把这个数据集下载到本地，并成功训练。

你能使用下面这条命令来下载raw KITTI数据集，但这个数据集很大，大约150多GB，而且里面提供的是外网链接，很难下载下来。建议看看国内有没有人把该数据集放到百度网盘上。

wget -i splits/kitti_archives_to_download.txt -P kitti_data/
我手头只有很少一部分该数据集（同事找的），让我们先一起认识下它大概的内容。

如上图所示，2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是两段独立的数据集，里面结构完全一样。下面仅以2011_10_03_drive_0027_sync为例来讲解其内容。

KITTI数据集是一台载有4个摄像头，一台Velodyne 3D激光雷达以及一台GPS/IMU(导航设备，其品牌为OXTS)的车子行驶在道路所采集得到的数据集。

理解了这个，再回头看上面的图，就可以知道上面每个目录对应一个传感器所采集的数据。

1）4个sensor数据集

子目录image_00/01/02/03里面都是对应4个sensor所拍的png照片。00和01对应的是左、右两个灰度摄像头，02和03对应另外两个左、右彩色摄像头。需要注意的是，左右两个摄像头的照片已经严格对齐了的。如下图所示：

2）velodyne_points

这个是雷达所采集数据集，都是bin文件，方便软件工具读取。有多少张照片，对应就有多少个bin文件。bin里面都是每个像素的实际坐标值(x,y,z,r)。由于雷达坐标系的x轴是向前的，所以其x值反映了深度。

3）oxts

它是导航设备获取的数据集，里面都为txt文件。每个照片对应有一个txt文件。里面的格式要看dataformat.txt。

说完了数据集，再来看看另外一部分（标定参数）。

1）calib_cam_to_cam.txt

它分别描述了4个摄像头的内参以及0和1，2和3之间的外参。如下所示，如果做过标定的话，应该不难理解。

2）calib_imu_to_velo.txt

这个描述了导航坐标系到雷达坐标系的旋转和平移矩阵。

3）calib_velo_to_cam.txt

描述了雷达坐标系转换到摄像头坐标系。其实也只有R和T有用，delta_f和delta_c很少用。

推荐阅读

更多海思AI芯片方案学习笔记欢迎关注海思AI芯片方案学习。