相信很多人都使用过网络上的中英文翻译工具,然而,由于技术不完善,大多数情况下,这种机器翻译只能获得一连串单词的堆砌,“意思基本靠猜”。远远不能达到取代人工翻译的地步。
为了解决这个问题,谷歌在今年9月发布了神经网络机器翻译(GNMT),用深度学习的方法让翻译成功率接近真人译员。而现在,国内搜狗也来凑热闹了,就在今天,他们召开媒体沟通会,并对外发布了搜狗语言实时翻译技术,将之起名为SNMT(S即Sogou)。
基于大数据和深度学习,搜狗语音实时翻译技术涵盖了语音识别、机器翻译两项重要技术,其中,搜狗语音识别的准确率高达97%,支持最快400字每秒的高速听写,语音输入日频次高达1.9亿次,较一年前增长一倍以上;搜狗机器翻译则融合了端到端神经机器翻译技术以及基于实例的翻译技术,使用的端到端神经网络翻译模型通过编码端获取源端句子的分布式表示,利用注意力模型聚焦源端,使用循环神经网络生成翻译结果,翻译的结果比传统机器翻译更加流畅,效果更好。另外,机器还能随着语句的逐渐完整,根据语义自动修改调整之前识别的内容,并做到智能断句。近期人工评测中,搜狗机器翻译在演讲、旅游、闲聊、日常口语等领域,采用五分制人工评分能达到4.4分。
当然,这已经不是搜狗语言实时翻译技术的首次亮相了,就在前两天的乌镇互联网大会上,搜狗CEO王小川的中文讲话内容就通过该技术实时翻译并显示在了大屏幕上。例如,当王小川说到“搜索的未来就是人工智能时代的皇冠”时,屏幕上实时显示出了“In the future, search will be the Crown of the AI Era”。
从SNMT的名字就可以看出搜狗这次的对标对象就是谷歌,而且两者的基本构架也是类似的,但他们之间还是有着相当大的差异。据了解,谷歌神经网络机器翻译的深度可达8层之多,而搜狗目前最多只有5层,这就意味着搜狗在反应速度上将更具有优势,据介绍其延迟只有2秒。而在准确性上,搜狗由于已经通过搜狗语音积累了大量中国人的口语语音数据,也可以一定程度上弥补由层数所造成的劣势。
而在应用上,搜狗透露会很快将其集成在搜狗输入法中。届时,输入法可以直接将汉语翻译成英文,或将英语翻译成中文,从而使得中国人与外国人之间的沟通变得更为顺畅。
话说,这是不是抢了翻译官的饭碗?
题图来自123rf