AI老铁 · 2020年12月11日

双目测距系列(四)初识KITTI数据集

转载自:双目测距系列(四)初识KITTI数据集
作者:ltshan139

前言

monodepth模型是基于KITTI数据集来训练的。为了能复现这个训练过程,从而为以后训练自己数据集奠定较好的基础,还是需要把这个数据集下载到本地,并成功训练。

你能使用下面这条命令来下载raw KITTI数据集,但这个数据集很大,大约150多GB,而且里面提供的是外网链接,很难下载下来。建议看看国内有没有人把该数据集放到百度网盘上。

wget -i splits/kitti_archives_to_download.txt -P kitti_data/
我手头只有很少一部分该数据集(同事找的),让我们先一起认识下它大概的内容。
image.png

数据集

如上图所示,2011_10_03_drive_0027_sync和2011_10_03_drive_0034_sync是两段独立的数据集,里面结构完全一样。下面仅以2011_10_03_drive_0027_sync为例来讲解其内容。
image.png

KITTI数据集是一台载有4个摄像头,一台Velodyne 3D激光雷达以及一台GPS/IMU(导航设备,其品牌为OXTS)的车子行驶在道路所采集得到的数据集。

理解了这个,再回头看上面的图,就可以知道上面每个目录对应一个传感器所采集的数据。

1)4个sensor数据集

子目录image_00/01/02/03里面都是对应4个sensor所拍的png照片。00和01对应的是左、右两个灰度摄像头,02和03对应另外两个左、右彩色摄像头。需要注意的是,左右两个摄像头的照片已经严格对齐了的。如下图所示:
image.png

2)velodyne_points

这个是雷达所采集数据集,都是bin文件,方便软件工具读取。有多少张照片,对应就有多少个bin文件。bin里面都是每个像素的实际坐标值(x,y,z,r)。由于雷达坐标系的x轴是向前的,所以其x值反映了深度。

3)oxts

它是导航设备获取的数据集,里面都为txt文件。每个照片对应有一个txt文件。里面的格式要看dataformat.txt。

标定参数值

说完了数据集,再来看看另外一部分(标定参数)。

1)calib_cam_to_cam.txt

它分别描述了4个摄像头的内参以及0和1,2和3之间的外参。如下所示,如果做过标定的话,应该不难理解。

image.png

2)calib_imu_to_velo.txt

这个描述了导航坐标系到雷达坐标系的旋转和平移矩阵。

image.png

3)calib_velo_to_cam.txt

描述了雷达坐标系转换到摄像头坐标系。其实也只有R和T有用,delta_f和delta_c很少用。



推荐阅读



更多海思AI芯片方案学习笔记欢迎关注海思AI芯片方案学习

推荐阅读
关注数
16760
内容数
1233
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息