4 月 25 日消息,滴滴日前携手加州大学伯克利分校 DeepDrive 深度学习自动驾驶产业联盟(BDD)在京举办 CVPR 2019 自动驾驶预研讨会,会上滴滴正式宣布与 BDD 达成战略合作,双方将围绕智能驾驶大主题,在前沿研究及应用落地、顶尖人才培养、学术交流等方向展开全方位的积极探索。

这是双方的进一步合作,此前 3 月,滴滴联合 BDD 启动 CVPR 2019 WAD 自动驾驶识别挑战赛。滴滴共参与提出目标检测迁移学习、目标跟踪迁移学习、大规模检测插值三项任务,并提供一个大规模、高质量的真实驾驶场景视频数据集 D²-City,涵盖 12 类行车和道路相关的目标标注,旨在鼓励相关领域前沿算法的发明与实现,有效推进自动驾驶相关视觉算法在不同环境和条件下的实用落地。

滴滴出行信息安全战略副总裁、美国研究院院长弓峰敏现场表示作为出行服务的提供者,滴滴一直非常愿意和学界、车厂、工业界及相关各方共同合作,推动全球智能驾驶技术发展和应用。Berkeley 拥有全球领先的研究团队,BDD 的研究重心和滴滴也高度契合,双方将继续加强在自动驾驶领域的合作交流,携手加速前沿研究的应用落地,共同培养更多具有创新意识的人工智能领域顶级人才,推动 AI 赋能自动驾驶及大交通领域。

BDD 主任 Trevor Darrell 教授称,D²-City 数据集的开放对于研究者的意义是非凡的,让我看到了一个行业领先者应有的担当。我们也很兴奋能和滴滴进行多元化合作,持续推进技术前沿。在今年 CVPR 2019 上,BDD 也将联合滴滴举办自动驾驶研讨会(WAD),基于伯克利 BDD100K、滴滴 D²-City 两个大规模、高质量真实驾驶场景视频数据集,组织目标检测、目标跟踪迁移学习挑战赛,共同加速自动驾驶领域技术创新。

(滴滴出行信息安全战略副总裁、美国研究院院长弓峰敏博士与 BDD 主任、伯克利人工智能研究院(BAIR)联合主任 Trevor Darrell 教授作为双方代表签署战略合作协议)

Trevor Darrell 现场分享了 “带有好奇心与自适应性的深度学习在感知、行动、解释的应用”。Darrell 介绍到,最近几年,“分层的”、“深度的” 表征学习极大地推动了计算机视觉的进步,但传统上仅仅限于拥有大量的训练数据且完全监督的设定,模型也缺乏可解释性。来自于对抗自适应表征学习的新结果表明了这些方法进行跨模态和领域学习时的提升,并且这些方法可以进一步被训练或约束以便为他们的用户提供自然语言解释以及多模态可视化结果。Trevor 分享了通过学习特定实例的网络结构来解决个别任务的组合网络模型,以及利用好奇心定义的内在奖励的自监督的策略学习模型。

滴滴 AI Labs 资深研究员车正平博士、李广宇(Max Li)博士则在报告中分享了 AI Labs 在计算机视觉、智能驾驶等方向上的最新探索和进展,并详细介绍了 AI 如何通过学习分析车载大数据,让司机的驾驶行为更安全。作为全球出行行业引领者,滴滴每天会处理大量交通及驾驶数据,基于海量大数据和技术优势,滴滴也构建了驾驶场景理解平台,能基于驾驶场景理解、大数据分析与风险预测等能力,持续提升出行安全与体验。同时 AI Labs 也在应用海量真实驾驶数据,构建智能驾驶模拟测试环境,加速滴滴智能驾驶系统优化迭代。

加州大学伯克利分校 BDD 联合主任 Ching-Yao Chan 博士的报告题目为 “当人工智能遇到自动驾驶”,介绍了他对机器学习的最新进展及其在自动驾驶中的应用的看法,包括 BDD 研究活动概述,机器学习在自动驾驶中用例的讨论,及人工智能和自动驾驶的挑战和前景。

加州大学伯克利分校博士后研究员 Fisher Yu 博士则和大家探讨了如何通过结合上下文的、动态的、有预测性的图像表征方法实现人类认知水平。现有的最先进的计算机视觉模型通常专注于单个领域或单个任务,而人类水平的识别可以针对不同尺度与任务。Fisher 分享了在学习不同尺度及任务的环境相关的图像表征、构建可解释卷积网络行为并产出适用于广泛任务的模型框架方面的工作。这些正在进行的系统及算法研究将表征学习与现实世界的交互结合在一起来构建可以不断向世界学习并与之交互的智能体。