10 月 12 日,旷视 MegTech Lite 漫谈 AI 技术分享会在北京举行。旷视研究院研究员范浩强以《手机上为什么要有那么多摄像头?》为主题,深入浅出地分析了 AI 多摄技术的 “来龙去脉”,并分享了旷视在 AI 多摄领域的技术创新和实践成果。

随着科技的进步,手机已经成为身边最为便捷的影像设备,随时随地捕捉和记录着美好生活。调研机构艾瑞咨询发布的《2020 中国人工智能手机白皮书——AI 重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。随着 AI 技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的 AI 计算摄影技术受到了越来越多的关注。

图:旷视研究院研究员范浩强在旷视 AI 多摄技术分享会上的演讲

用户需求升级,加速 AI 多摄入局

从 2000 年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求 “所见即所得” 的真实性与媲美相机的质感之间的兼顾,开始利用手机进行专业级别的影像创作。

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。通过多个摄像头的协调配合,AI 技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI 算法已成为多摄像头联动不可或缺的纽带。旷视自 2016 年起开始研发多摄技术,经过 5 年多的技术迭代和优化,如今已研发出业界领先的 AI 多摄算法,并在多款畅销手机机型中实现技术应用落地。

变焦、虚化、融合,多摄助力手机影像突破

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。然而,后置摄像头不是越多越好,也不是越大越好。 旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。旷视率先提出 “AI 重新定义光感知系统” 的理念,将光感知系统 “硬件升级——算法辅助——优化后期处理” 相对流程化和独立化的传统运作方式,转变为光感知系统软硬件 “一体化协同升级”。这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

面向未来,AI 驱动的图像获取

AI 多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等 AI 企业对于底层技术的创新和赋能。以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

随着以多摄为代表的 AI 计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用 AI 技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从 “所见即所得” 到 “所想即所得”。对于影像世界的美好想象,AI 计算摄影,正在帮助我们一步步完成。