人工智能也无法解决关于“yanny”和“laurel”的争论

本文为动点科技/TechCrunch 中国独家稿件。未经允许，禁止转载。

如果你最近几天没有参与关于 yanny/laurel 的争论，那么请允许我真诚地祝贺你。不过，你现在肯定躲不开。这段病毒式传播的语音合成片段正在和人工智能发生碰撞。而与这个平凡世界中的所有一切一样，结果令人失望。

基于人工智能的语音识别软件开发者 Sonix，将这段模糊的声音灌进谷歌、亚马逊、IBM 沃森和自己的平台进行识别。

谷歌和 Sonix 在第一次尝试中就获得了成功，识别出这个合成语音是“laurel”。

不过使用亚马逊工具的尝试则没有成功，系统将机器语音反复识别成“year old”。IBM 沃森的识别结果则在“year role”和“laurel”之间来回跳跃。

Sonix 首席执行官杰米·萨瑟兰（Jamie Sutherland）在电子邮件中告诉我，在没有获得这些模型之前，他无法对其他模型的结果发表评论。

他写道：“你可以想象，人类语音是复杂的。音量、节奏、口音和频率变化非常之多。现实情况是，不同公司可能会针对不同使用场景来优化，所以结果会有所不同。对于一个语音识别模型来说，适应所有这些情况将会是挑战。”

作为不太了解情况的旁观者，我的猜测是，这可能与模型训练中的优先级有关。听起来足够合理。