在近期结束的 IEEE BigData2020 Global Road Damage Detection Challenge 2020 道路损坏检测竞赛中,滴滴 AI 视觉团队提出的 CFM(Consistency Filtering Mechanism with Self-Supervised Methods) 算法,在两个不同评测集中,以 Test1 得分 0.6657,在全球 80 个参赛队伍中排名第二;Test2 得分 0.6219,在全球 19 个参赛队伍中排名第三,最终获得了总分世界第三的优异成绩,充分彰显了滴滴在交通路况检测的创新能力。

IEEE BigData2020 道路损坏检测竞赛

Global Road Damage Detection Challenge 2020 道路损坏检测竞赛由 IEEE BigData2020 举办,主要针对日本、智利、印度等全球不同地区的交通道路损坏程度进行检测和分类的赛事,包括 4 种常见损坏类别: 横向裂纹 D00、纵向裂纹 D10、龟裂纹 D20、坑洼 D40。由于数据来自于全球不同地区,包括发达国家和发展中国家,因此路面硬化的质量各不相同,且每种损坏类型的损坏程度、面积、长宽比等差异巨大,这些都给检测和分类工作带来了巨大的挑战。

竞赛数据集中日本和印度道路的损坏

滴滴视觉 AI 技术部图像技术团队沈海峰、张修宝、裴子祥提出的 CFM 算法,采用了局部区域注意力学习机制,通过利用现有道路分割算法,获取城市道路图像的分割图像作为模板,动态叠加至训练数据集与测试数据集上,使得模型训练基于更丰富的语义信息,具有更好的鲁棒性并提升目标检测的准确率。另外该算法还创新性的提出了一种置信度强化训练机制,采用一致性差异迭代训练的方法,即充分利用无标签数据中携带的一致性信息,进行自监督学习和训练。无标签图像通过一系列数据增强方法,例如 Flip 等,每张图像能够产生图像对,再分别通过预训练模型获得伪标签。利用伪标签的一致性分数筛选出部分可信的伪标签图像加入有标签数据进行迭代训练。

CFM 算法的整体框架图

实际上,滴滴已经多次在图像视频领域相关竞赛或评测中得到佳绩。在 2019 年世界最权威的人脸检测公开评测集 WIDER FACE 中,滴滴在 Easy、Medium 和 Hard 三个评测子集的六项评测结果中,超过了国内外众多科技公司和高校院所,取得了五项世界第一、一项世界第二的好成绩;还在 2019 年微软 COCO 人体关键点检测榜单获得了世界第二。另外,在今年 ACM ICMI2020 组织的 Emotion Recognition in the Wild 2020(EmotiW2020) 竞赛中,在 Driver Gaze Prediction(司机视线预测)赛道上获得世界第一;在 Group Emotion Recognition(视频多人表情识别)赛道上获得世界第三,此外,在 ICME2020 组织的 Embedded Deep Learning Object Detection Model Compression Competition for Traffic in Asian Countries 比赛上也斩获世界第三。

此次道路损坏程度检测技术斩获世界第三,也充分体现了滴滴在计算机视觉领域的强大技术实力。滴滴将持续进行更多探索,不断优化出行交通感知理解、智能交互等技术,用先进的 AI 技术提升用户体验、助力行业转型升级,让出行更美好。