编者按:本文来自于微信公众号 “量子位”(微信公众号:QbitAI), 动点科技经授权发布。

同传 AI,刚刚在国内掀起过暴风骤雨

但现在,百度于硅谷宣布了最新重大突破——一个名为 STACL 的同传 AI,论文结果优异,Demo 效果惊人。

MIT 科技评论、IEEE Spectrum 等一众外媒,还纷纷给出好评,这是 2016 年百度 Deep Speech 2 发布以来,又一项让技术外媒们如此激动的新进展。

百度自己披露:与现在大多数 AI“实时” 翻译系统不同,STACL 的特点是能预测和延时可控,能够在演讲者讲话后几秒钟开始翻译,并在句子结束后几秒钟内完成。

STACL 不走 “整句说完再翻译” 的路线,甚至还会预测发言者未来几秒的内容,于是延时更短,更接近人类同传。

究竟能达到什么程度?IEEE Spectrum 采访后给出类比:跟联合国会议里的人类同传相媲美。

实际效果果真如此?那突破显然重大。

Demo 展示:翻译 AI 会预测

看上去几乎同时了

Demo 可以看出,百度 STACL 的翻译工作延时非常短,与原句只差几个字。

虽说这个 AI 目前只是同步翻译成文字,还没有合成译文的语音,但这不是重点。关键是,不知道你有没有注意到,这种 “只差几个字” 有多难得。

还没等 “美国总统布什在莫斯科与俄罗斯总统普京在莫斯科会晤。” 这句汉语说到莫斯科,自动翻译的英语已经出现了 “meet”,也就是汉语句末的 “会晤”。

这个 “meet”,是 AI 从前半句话里脑补出来的,依据的是美国总统最可能与其他人发生怎样的活动。

因此,百度这个同传 AI,不用等一句话说完,就能开始翻译了。

对于翻译 AI 来说,预测是一项很罕见的技能。不同语言的语序总有差异,所以,那些没有预测能力的翻译 AI,通常需要等到人类讲完一句话,再开始翻译。

再举一个栗子 (下图) ,从 “百度在 18 年前” 这半句里,AI 预测出了百度创立的内容 “started a business”。

那么,科学地讲,百度 AI 的预测效果到底怎么样?

衡量翻译质量,要看 BLEU 分。

在中译英延后 5 个字的情况下,比起传统的整句翻译 AI,百度的 BLEU 分要低了 3.4 分。

毕竟是预测,发生错误是自然的。而这个差距在百度看来是可以接受的。

比如,百度 AI 可能从前半句话里预测出会面顺利进行,而事实可能是会面并不顺利。翻译就容易出现失误。

面对这样的情况,AI 目前并没有纠错的能力。

不过,用小小的延时,就可以换取更高的准确度:如从延 3 个词到延 5 个词。用户可以根据需求随意调整。

中英语序相似

而当两种语言语序相差不多的时候,例如描述戴安娜王妃车祸事件的新闻,STACL 和传统整句翻译的成绩相比,就没有明显差异了。

这种预测能力,是哪来的?

答案是一个名叫 wait-k 的模型,它把预测和翻译无缝整合到了一起,百度把它和两个翻译模型结合起来做了实验,一个是比较早期的 RNN 翻译模型,另一个是 Google 在 2017 年推出即大热的 Transformer。

不过,wait-k 不仅仅适用于这两个模型,而是可以用在任何序列映射(sequence-to-sequence)模型上。也就是说,只要有个模型能搞定两种语言之间的翻译,加上这个 wait-k 做一点小改造,就能实现同传了。

一个机器翻译系统,离不开分析输入语言的编码器和输出目标语言的解码器,而 wait-k 对机器翻译模型所做的小改动,就在解码器上。它让解码器在输出内容的同时,能预测编码器还没有输入的东西。

百度用这样一个公式描述了这种解码策略:

其中,x 代表输入的内容,y 代表输出,t 代表时间步,而 k 表示的是解码器比编码器抢跑的词数。

技术细节在论文 STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency 中有详细的介绍。

地址:https://arxiv.org/abs/1810.08398

团队介绍

By the way,按署名次序,介绍一下 9 位论文作者。

Mingbo Ma,百度硅谷 AI 实验室科学家,拥有三个学校的计算机博士学位,今年 8 月刚从俄勒冈州立大学博士毕业,另外两个学位在美国东北大学和纽约城市大学,本科毕业于吉林大学,此前曾在苹果和 IBM 实习。

黄亮,俄勒冈州立大学助理教授,百度美研首席科学家,此前曾就职于 IBM 和谷歌,并在纽约城市大学、南加州大学担任过助理教授,博士毕业于宾夕法尼亚大学。

Hao Xiong,爱丁堡大学计算机硕士,本科毕业于河海大学,2015 年加入百度任软件工程师,负责大容量数据处理系统和资源调度系统。

Kaibo Liu,俄勒冈州立大学助理研究员,今年 6 月刚到百度实习,本科毕业于北大。

Chuanqiang Zhang,低调的百度技术员工,目前无更多资料。

何中军,百度主任架构师,从事机器翻译研究与开发十余年,多篇论文发表在本领域权威国际会议 ACL、EMNLP、COLING、AAAI 等,参与项目曾获 2015 年度国家科学技术进步奖二等奖。

Hairong Liu,百度硅谷 AI 实验室科学家,曾就职于三星和普渡大学,华中科大电子电气博士。

Xing Li,中科院自然语言处理和机器学习硕士,百度硅谷人工智能实验室的高级经理,曾任英特尔技术 leader,在百度担任过技术工程经理,领导百度贴吧研发团队。

王海峰,百度高级副总裁,e-Staff,百度 AIG 负责人、百度研究院院长,哈工大计算机博士。

王海峰

第一波评价

百度这次技术突破宣布后,首先在外媒引发报道。

有好评。其中评价最高的是 IEEE Spectrum,认为百度开发的这个新系统,揭示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一步。

有对比。比如将百度的这次突破与谷歌联系起来。南华早报评论:随着百度新的翻译系统亮相,百度向谷歌发起了挑战。

还有将百度和谷歌放一起当 “耦合” 的。Engadget 观点:

虽然这个系统仍旧有局限性,而且无法在必要的时候取代人类翻译。但是它在谷歌缺席中国的情况下,给出了一种新的选择。

SiliconANGLE 则援引分析师评论称:“亚洲的语言翻译方面仍然存在一定的局限性,看到本地的玩家加入到这个游戏中来,的确是一件好事。”

但目前最多的态度是观望。

在技术宅密度比较高的 Hacker News 和 Reddit 上,百度的这条消息,并没有引发太多的讨论。

截至早上 7 点 40 分,Reddit 只有一条评论,Hacker News 上有两条评论——虽然这个消息发布已有 5 个多小时。

Reddit 上面的一条评论有点 “水”,只是说这个 Demo 很好。

Hacker News 的两条评论中,一条比较有技术含量,提出了如何翻译德语的问题,并给出了一些示例,另一条是说,这个 Demo 很好。

比较有趣的是,两个说这个 Demo 很好的网友,昵称基本上是一样的。

不过这个技术到底好不好,更多中外关注者马上都能给出判断。

因为百度最快会在下周的年度技术大会上,进行公开展示。

究竟是重大突破,抑或还只是完美 Demo,到时一看便知。

当然,有科研实力有技术复现的同学,现在就能去试试了。

欢迎反馈你的测后评价~