谷歌神经翻译再次“翻身” 对于单一的语音模板无需训练

分享到:

    大家都知道,欧盟拥有24种官方语言,理想情况下,欧盟的翻译官们应该能够随时从一种语言直译到另一种语言,但这种翻译组合实在是太多了,高达576种,所以他们选择英语当做中间语言来解决这一问题。  

    同样地,我们的谷歌工程师们也面临着同样的问题,但谷歌面临的麻烦要更大一点,因为他们需要翻译的语言种类要比欧盟的官方语言多,达到100多种,(例如:英语翻法语是一种组合,而法语翻英语又是另一种组合),而这些翻译组合会高达上万种。

20161116_150256_954

    如果为每一种组合训练一种神经翻译模型的话,那么就需要训练上万个。真的是好多啊!但是现在不要了,我们只需要一个模型就可以解决这些问题。近日,来自谷歌的工程师门发表了一篇论文,上面提到如何只用一个模型实现多语言之间的翻译。这个模型被称为NMT模型。 NMT模型的训练不需要任何语言学知识,且具有模型简单、翻译质量高等优点。它基于原有的单一语言翻译模型,但不需要对原有翻译模型进行任何修改,便可实现多语言之间的翻译。

论文显示这种新方法有三个优点:
一、简单,即减少需要训练的模型数;
二、改善翻译质量。尤其是那些训练语料不足的语言;
三、具有‘zero shot’翻译能力,即如果我们训练一个模型可以将葡萄牙语翻译成英语,然后在训练一下让其可以实现英语到西班牙语之间的翻译,此时神奇的一幕出现了,我们虽然并没有进行葡萄牙语到西班牙语之间的翻译,但是此时模型仍然可以实现葡萄牙语到西班牙语之间的正确翻译。

    谷歌宣称这是世界首次研发出zero-shot翻译。很明显,zero-shot 还具有明显的速度优势,它可以使解码时间减半。 其另一个优势就是可以实现句间转换。如果一个句子中包含不止一种语言,它照样可以翻译。这样如果一个大的数据集中如果包含多种语言,那么它照样可以实现翻译。论文的最后,谷歌翻译人员用BLEU方法对翻译结果进行评判,发现结果改善不少。
    实际上,神经机器翻译还有很长的路要走。谷歌貌似已经将NMT 推广到了其它语言翻译上,例如英语到德语的翻译。在我们对谷歌翻译进行的随机测试中,我们发现其翻译流畅度有所提升,但仍有一些漏翻或误翻。

    论文简介:《Google's Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation》

我们用一个简单而优雅的多语言神经机器翻译模型解决了多种语言之间的翻译问题,这个模型与原有模型对比并没有任何改变,只是在输入句子时引入了一个变量,以标明需要翻译的目标语言是什么。后面的编码、解码、注意力模型在所有语言中都一样,词表也共享,参数无需要增加。

    与我们起初的设计相比,实现了极大的简化。在保持参数值不变的情况下,翻译质量居然还有所提升。在WMT'14 测试中,我们的模型在英法翻译中不比任何模型差,在英德翻译中比任何模型好,在多语言测试中,我们的模型在 14 年法英、15 年德英翻译中效果最优。我们的模型不仅可以对 12 种语言对(例如英法、法英,这是两个语言对)进行翻译,而且其翻译效果也比大多数单语言对的翻译模型还要好。除此之外、对于没有训练过的语言对,我们的模型仍然可以学习,这就表明神经网络是可以实现迁移学习与‘zero-shot’翻译的。

继续阅读
TensorFlow三岁了!

TensorFlow今天3岁了。2015年的11月9日,谷歌开源TensorFlow,迅速成为最受欢迎的机器学习开源框架,构建起庞大的开发者生态。一路走来,TensorFlow收获众多辉煌,也有批评,遭遇强手劲敌,目前仍旧稳居处于开源框架王者之位。TensorFlow 2.0也已在研发中。谨以本文祝TensorFlow生日快乐,为TensorFlow发展做出贡献的开发者也辛苦了!

谷歌员工反对性骚扰,纷纷罢工

周四谷歌首席执行官桑德尔·皮猜(Sundar Pichai)在出席《纽约时报》举办的DealBook活动上回应了此前公司遭遇的性骚扰风波。也正是在这一天,谷歌在世界各地的员工纷纷罢工抗议公司对待工作环境中的性骚扰行为的态度。 “公司内有愤怒和沮丧的情绪,”皮猜在活动上说,“我们都能感受到,我也不例外。”

AI芯片的前生和今世都在这里

如果你觉得Alpha Go和人相似,只不过是把人脑换成了芯片,那么你就大错特错了。击败李世石的Alpha Go装有48个谷歌的AI芯片,而这48个芯片不是安装在Alpha Go身体里,而是在云端。所以,真正驱动Alpha Go的装置,看上去是这样的...

英国拟定引入“数字税”,谷歌和脸书又将受到冲击?

英国政府说,将拟定引入“数字税”方案,征收对象为大型技术类企业在英国数字业务产生的收入。

谷歌首次承认将重返中国!会遵守我国法律

《连线》(Wired)杂志在最近迎来了它的第 25 周年纪念日,作为全球最具影响力的媒体之一,《连线》在周年庆典(Wired 25 Summit)上邀请到了社会各界的大佬前来参与,这其中就有不少科技圈的巨头,谷歌 CEO 桑德尔·皮查伊(Sundar Pichai)就是其中之一。