在近期结束的IEEE BigData2020 Global Road Damage Detection Challenge 2020道路损坏检测竞赛中,滴滴AI视觉团队提出的CFM(Consistency Filtering Mechanism with Self-Supervised Methods)算法,在两个不同评测集中,以Test1得分0.6657,在全球80个参赛队伍中排名第二;Test2得分0.6219,在全球19个参赛队伍中排名第三,最终获得了总分世界第三的优异成绩,充分彰显了滴滴在交通路况检测的创新能力。

IEEE BigData2020道路损坏检测竞赛

Global Road Damage Detection Challenge 2020道路损坏检测竞赛由IEEE BigData2020举办,主要针对日本、智利、印度等全球不同地区的交通道路损坏程度进行检测和分类的赛事,包括4种常见损坏类别:横向裂纹D00、纵向裂纹D10、龟裂纹D20、坑洼D40。由于数据来自于全球不同地区,包括发达国家和发展中国家,因此路面硬化的质量各不相同,且每种损坏类型的损坏程度、面积、长宽比等差异巨大,这些都给检测和分类工作带来了巨大的挑战。

竞赛数据集中日本和印度道路的损坏

滴滴视觉AI技术部图像技术团队沈海峰、张修宝、裴子祥提出的CFM算法,采用了局部区域注意力学习机制,通过利用现有道路分割算法,获取城市道路图像的分割图像作为模板,动态叠加至训练数据集与测试数据集上,使得模型训练基于更丰富的语义信息,具有更好的鲁棒性并提升目标检测的准确率。另外该算法还创新性的提出了一种置信度强化训练机制,采用一致性差异迭代训练的方法,即充分利用无标签数据中携带的一致性信息,进行自监督学习和训练。无标签图像通过一系列数据增强方法,例如Flip等,每张图像能够产生图像对,再分别通过预训练模型获得伪标签。利用伪标签的一致性分数筛选出部分可信的伪标签图像加入有标签数据进行迭代训练。

CFM算法的整体框架图

实际上,滴滴已经多次在图像视频领域相关竞赛或评测中得到佳绩。在2019年世界最权威的人脸检测公开评测集WIDER FACE中,滴滴在Easy、Medium和Hard三个评测子集的六项评测结果中,超过了国内外众多科技公司和高校院所,取得了五项世界第一、一项世界第二的好成绩;还在2019年微软COCO人体关键点检测榜单获得了世界第二。另外,在今年ACM ICMI2020组织的Emotion Recognition in the Wild 2020(EmotiW2020)竞赛中,在Driver Gaze Prediction(司机视线预测)赛道上获得世界第一;在Group Emotion Recognition(视频多人表情识别)赛道上获得世界第三,此外,在ICME2020组织的Embedded Deep Learning Object Detection Model Compression Competition for Traffic in Asian Countries比赛上也斩获世界第三。

此次道路损坏程度检测技术斩获世界第三,也充分体现了滴滴在计算机视觉领域的强大技术实力。滴滴将持续进行更多探索,不断优化出行交通感知理解、智能交互等技术,用先进的AI技术提升用户体验、助力行业转型升级,让出行更美好。