微软日前宣布,其会话语音识别系统的错误率已经降至 5.1%,达到了迄今为止的最高水准。这一数字优于去年微软人工智能研究中心(Microsoft AI and Research)的测试结果,当时的错误率为 5.9%

这项新研究由微软人工智能研究中心的一组研究人员完成,目的是让 AI 达到与人类听写人员相同的识别准确度。

总体而言,此次研究中的识别错误率,相比去年微软基于神经网络的会话语音识别系统的 12% 的错误率下降了不少,从而达成了一项里程碑。另外,微软还将其识别系统运用在完整的对话环境中,使其能够调整上下文,并预测下一步可能会出现的单词或句子。

微软的会话识别系统目前被运用在例如语音助理 Cortana、微软认知服务(Microsoft Cognitive Services)和翻译工具 Presentation Translator 之上。