只要一分钟，机器翻译了解一下

2018/09/13 14:15

编者按：本文来自于微信公众号 “KnowingAI知智”（微信公众号：Knowing_AI），动点科技经授权发布。

作为比「人工智能」这个词诞生得还早的 NLP 任务，

机器翻译经历了怎样的发展？

点击下方视频，你对人工智能的了解就能轻松超过全世界 99% 的人类！

图文版本送给不方便打开的朋友 (●°u°●)」

机器翻译（Machine Translation），又叫自动翻译，是指利用计算机将一种自然语言转换为另一种自然语言的过程。

作为比人工智能这个词诞生的还早的自然语言处理任务（1954），机器翻译经历了漫长的发展过程，大致可以分为三个阶段。

第一个阶段是基于规则的翻译方法（RMT）。与人类类似，这种方法会先分析句子中单词的词性，将每个词翻译成目标语言，再根据语法规则等进行调整，输出结果。

可想而知，这种翻译方法效果并不好，因为语言表达的方法非常灵活，有限的语法和规则无法覆盖所有的语言现象。

第二个阶段是基于统计的翻译方法（SMT）。即根据词或短语找到所有可能的结果，再在庞大的语料库中进行搜索，统计每种结果出现的概率，将概率最高的结果进行输出。

这种方法较规则方法效果有很大提升，不过对语料库的依赖较大。

第三个阶段是基于神经网络的翻译方法（NMT），通过学习大量成对的语料（平行语料库）让神经网络自己学习语言的特征，找到输入和输出的关系，端到端的输出翻译结果，取得了不错的效果。

不过这些方法并不是非此即彼的。比如在成对语料较少的语言之间，用统计方法效果比较好；或者干脆没多少语料，就要靠中间语言进行转换；有些约定俗成的成语短语，用基于实例的翻译方法能更好的解决。

现在的机器翻译系统，基本上会将几种方法的优点进行融合，不过距离翻译的标准「信、达、雅」，还有很远距离。