近日,堪称计算机视觉领域「奥斯卡」的国际顶会 CVPR 2020 首次以线上形式拉开帷幕。在本届大会与智能交通关系最紧密的 AI CITY Challenge 和 MOTS Challenge 两大挑战赛中,百度一举击败阿里、滴滴、卡内基梅隆大学等参赛者,斩获4项世界冠军及1个榜单冠军,并成功卫冕1项冠军,再度彰显了百度在「新基建」的大潮下,在智能交通和智慧城市领域领先的技术实力。此外,百度本次夺冠也与飞桨的强力支撑密不可分。
AI CITY 智慧城市挑战赛由英伟达、亚马逊、马里兰大学等主办,主要集中在交通相关的车辆跟踪、再识别、异常事件分析等应用场景。MOTS (Multi-Object Tracking and Segmentation) 多目标跟踪与实例分割挑战赛由德国慕尼黑大学、德国亚琛工业大学、ETH 联合举办,是多目标跟踪方向的权威竞赛。
两项挑战赛均是计算机视觉顶会 CVPR 的议程之一,每年吸引众多企业与高校参赛者。同时,其所有数据均从实际场景采集获得,存在剧烈的镜头抖动、图像模糊等工业环境中存在的问题。完成与实际业务落地场景“零差距”的严苛考验,可以直观反映参赛者真实的应用能力。
夺勇智慧城市挑战赛3项冠军
自研智能交通系统原力爆发
AI CITY 智慧城市挑战赛的4项比赛中,全球共有315支队伍参加,其中不乏阿里、滴滴、松下、卡内基梅隆大学等一流科技巨头和高校。百度共参战3项竞赛,最终技压群雄,全部取得了冠军成绩:
车流统计(Track 1:Multi-Class Multi-Movement Vehicle Counting);
车辆再识别(Track 2:City-Scale Multi-Camera Vehicle Re-Identification);
异常事件检测(Track 4:Traffic Anomaly Detection)。
百度勇夺 AI CITY 挑战赛三项冠军
其中,车辆重识别赛道今年更是成功卫冕,异常事件检测最终得分超第二名近50%。冠军的瞩目成绩源于背后技术的厚积薄发,也是百度技术创新性的证明:
在车流统计任务中,提出平滑马氏距离、漏检框召回优化等多目标跟踪改进算法,结合基于轨迹形状相似度的车道分类方法,整体方案综合指标达到91.8%;
在车辆再识别任务中,通过采用 3D 渲染数据编辑、复杂负样本增强、多信息融合等技术,最终 mAP 指标大幅领先第二名6%以上;
在异常事件检测任务中,提出双向多粒度融合异常检测算法,使得异常事件准确率高达98%以上。
上述的百度夺冠技术均已应用于百度自研的智能交通系统,该系统整合了检测、跟踪、3D 定位、分割、身份重识别、事件分析在内的一揽子视觉技术,成为保障业务落地的坚实基础。
其中,可分析车流数据发现交通拥堵的车流统计技术,智能交通系统中确认车辆身份的车辆再识别技术,以及可准确发现潜在交通风险的异常事件检测技术,均是目前智能交通领域的典型服务。
多目标跟踪与分割难度大
百度斩获2项第一
多目标追踪(MOT)是视频理解和分析领域的核心技术之一,广泛应用于智慧城市、智能交通等实际场景。MOTS 挑战赛在上年基础上,进一步结合实例分割与多目标追踪两大挑战性任务,要求参赛者在追踪场景中人与车的同时进行像素级解析,竞赛难度极大提升。
KITTI-MOTS 是自动驾驶权威数据集 KITTI 中多目标跟踪任务的扩展,包括21段训练视频以及29段测试视频,每一段视频均提供了所有物体(人和车)的实例分割标注,成为首个同时提供实例分割以及多目标跟踪标注的公开数据集。
百度同时参战了 MOTS 和 MOT 竞赛任务,最终凭借原创自研的领先技术,在 KITTI-MOTS 赛道以及 MOT20 榜单中均斩获第一。
百度拿下 KITTI-MOTS 竞赛冠军和 MOT20 榜单冠军
具体而言,在 KITTI-MOTS 竞赛中,百度提出新型方法 PointTrack++,在行人和车辆两个类别中均取得冠军。PointTrack++包括视频实例分割、掩膜特征提取以及多目标关联跟踪等技术,突破性地把 3D 点云分析融入 2D MOTS 任务之中,首次实现实时在线的 MOTS 算法,并在车辆场景测评指标上领先第二名3个百分点以上,实现 SOTA 结果。
继去年 MOT16 夺冠之后,百度继续在2020年最新的多目标追踪榜单 MOT20 上进行了测试。相比往年,MOT20 使用一批全新的训练/测试数据集,场景行人高度密集,具有富有挑战性。在行人更高度密集的复杂场景下,百度取得了 MOT20 榜单第一的优异成绩。
KITTI-MOTS 竞赛中算法可视化展示
左图为 MOT16 算法可视化展示,右图为 MOT20 算法可视化展示
飞桨为百度夺冠提供强大技术支撑
百度 AI 夺冠的背后,离不开深度学习平台飞桨(PaddlePaddle)的强大支撑,它为百度的参赛起到了保驾护航的作用,上述的百度冠军方案均基于飞桨而构建,主要体现为以下3点:
挑战赛使用的检测模型均基于 PaddleDetection 而打造;
飞桨丰富且领先的预训练主干网络模型和完备的操作池,大幅缩短开发高精度模型的周期;
PaddleClas SOTA 模型丰富,为快速构建再识别任务提供了保障。
源于产业实践的深度学习平台——百度飞桨
值得一提的是,挑战赛冠军模型也已面向公众开放,这进一步提升了飞桨的技术能力和易用性,助力百度以便捷的方式,领先的深度学习技术能力赋能产业。
比如,上述夺冠技术已成功应用于国内第一个民用无人车产品长沙 Robotaxi 的车路协同系统之中,借助 PaddleLite 定制化提升模型性能,即使算力有限,仍可保障系统鲁棒运行。
Apollo 技术持续突破
助推智能交通新基建迅猛落地
通过不断参与国际顶尖挑战赛,技术正在不断刷新能力的边界。正是这些持续突破的核心技术能力,有力地支撑着百度在新基建大潮下,在智能交通、智慧城市领域的高效落地。
在发改委明确的「新基建」范围中,智能交通领域正是国家点名的重要融合基础设施。百度 Apollo 智能交通,已经在长沙和沧州率先落地,同时还有若干城市的合作正在推进中。
百度 ACE 交通引擎
「ACE 交通引擎」Apollo 智能交通方案通过统一的底座支持多种应用,是全球第一个具有路侧全息感知能力的自动驾驶车路协同系统,并服务于 Robotaxi 车队的日常开放道路测试运营。
基于上述同一套软硬件系统的智能路口输出更精准的交通流指标感知结果,支持实现更智能的信号灯优化控制,显著缓解高峰期干线拥堵,实现「灯看车、灯看人」的智能信号灯感应式控制,并通过百度地图手机 APP 服务于广大出行用户。
百度智能城市也已经逐渐落地北京、重庆等地,成为新一代城市智能基础设施,让城市更安全、更从容、更通畅、更宜居。凭借完备的技术布局和深厚的技术底蕴,百度正在新基建的浪潮中发挥重要作用,顶级 AI 技术正深入各行各业,撬动着未来可期的智能时代。