微软正式宣布,在基于微软智能云 Azure 的深度神经网络 TTS(Text-to-Speech)支持下,智能电动汽车公司小鹏汽车已经顺利完成其车规级语音助手的升级,进一步提升智能汽车语音助手的技术水准。目前,购买小鹏汽车 P7 车型的中国用户,可以通过 OTA(Over-The-Air)升级这款可媲美人声的全新智能语音助手 “小 P”,小鹏汽车也计划通过 OTA 将这一技术升级引入其他几款车型当中。

据介绍,在为期数月的合作中,微软与小鹏汽车携手攻克了语音合成技术应用面临的三个技术挑战:首先,为了解决汽车场景下的网络抖动问题,高质量保障语音功能的持续运行,小鹏汽车搭建了多级缓存架构,可以提前预置和缓存高质量语音文件,最大程度上降低了该功能对网络的依赖;其次,为了在不占用过多资源的前提下,依然能提供媲美人类的真实声音体验,小鹏汽车借助了微软智能云 Azure 的缓存和压缩功能,可以将语音文件压缩到 24KHz 的采样率和 16 位的量化水平,大大减少了数据网络和整车算力的资源压力;最后,双方还在减少合成语音歧义和多音字优化准确性方面做出了诸多改进。

小鹏汽车 AI 产品高级专家郝超表示:“从确定合作意向到产品上线,我们与微软耗时数月,携手完成了一次对汽车语音交互技术的前沿探索,将车载语音的自然语音水平提升到了一个全新的水准。随着对城市出行的理解愈发深入,和更多使用场景的发掘,这些技术成果将获得更为广泛的应用,实现高水平的人机共驾体验。”

微软汽车、出行和运输行业总经理 Sanjay Ravi 表示:“随着研究和技术的进步,Azure 认知服务(如视觉和语音)将在定义独特的车载体验方面发挥关键作用。智能语音正在成为主要的车载交互工具,而微软预置的深度神经语音和个性化深度神经语音定制服务,将助力汽车制造商强化自身品牌,打造更接近自然人声的、差异化且真实的用户体验。”