人工智能也无法解决关于“yanny”和“laurel”的争论

本文为动点科技/TechCrunch 中国独家稿件。未经允许,禁止转载。

如果你最近几天没有参与关于 yanny/laurel 的争论,那么请允许我真诚地祝贺你。不过,你现在肯定躲不开。这段病毒式传播的语音合成片段正在和人工智能发生碰撞。而与这个平凡世界中的所有一切一样,结果令人失望。

基于人工智能的语音识别软件开发者 Sonix, 将这段模糊的声音灌进谷歌、亚马逊、IBM 沃森和自己的平台进行识别。

谷歌和 Sonix 在第一次尝试中就获得了成功,识别出这个合成语音是“laurel”。

不过使用亚马逊工具的尝试则没有成功,系统将机器语音反复识别成“year old”。IBM 沃森的识别结果则在“year role”和“laurel”之间来回跳跃。

Sonix 首席执行官杰米·萨瑟兰(Jamie Sutherland)在电子邮件中告诉我,在没有获得这些模型之前,他无法对其他模型的结果发表评论。

他写道:“你可以想象,人类语音是复杂的。音量、节奏、口音和频率变化非常之多。现实情况是,不同公司可能会针对不同使用场景来优化,所以结果会有所不同。对于一个语音识别模型来说,适应所有这些情况将会是挑战。”

作为不太了解情况的旁观者,我的猜测是,这可能与模型训练中的优先级有关。听起来足够合理。