分享

头条文章

 高贵的潜伏 2016-12-02

网络让世界变得更小,连接你我他。所面临的问题是,人们讲不同的语言!当然,有些人讲多门语言,担据我们所知,多数人,包括读者的族群,实际只讲一种语言。

值得庆幸的是,谷歌翻译,消除了这一语言障碍,让人们更容易沟通。今天,谷歌翻译宣布神经机器翻译已成功面市自此谷歌翻译将有质的飞跃。

什么是神经机器翻译,呢?巴拉克Turovsky,翻译产品,谷歌解释如下。

在高级功能上,神经系统翻译是整个句子,而不是逐词翻译的。它使用这个大背景下,以帮助其找出最相关的翻译,然后重新调整单词顺序更像人类用正确的语法。这样更容易理解每个句子,段落和文章翻译会更顺利、更容易阅读。端到端学习系统建立在神经机器翻译,这基本上意味着随着时间的推移系统学习创造更好的,更自然的翻译。

Turovsky进一步说:“今天谷歌神经机器翻译可以翻译八种语言,英语和法语,德语,西班牙语,葡萄牙语,中文,日语,韩语和土耳其。这些代表了母语约三分之一的世界人口,覆盖35%以上的所有谷歌翻译查询”。 通过这一次更新,谷歌翻译一次性提升的性能超过了过去十年进步的总和。但这只是一个开始。尽管我们目前在谷歌搜索、谷歌翻译应用和网站上只有 8 种语言,但我们的目标是将神经机器翻译扩展到所有 103 种语言,并让你能随时随地都能接入到谷歌翻译。

除此之外,谷歌今天还宣布了提供机器学习 API 的公共云服务 Google Cloud Platform,「能让任何人都轻松地使用我们的机器学习技术」。今天,Google Cloud Platform 也使神经机器翻译背后的系统向谷歌的企业用户开放了——谷歌提供了 Cloud Translation API:https://cloud.google.com/translate/

  • 论文:谷歌的多语言神经机器翻译系统:实现 zero-shot 翻译(Google's Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation)

我们提出了一种使用单个神经机器翻译(NMT)模型在多种语言之间进行翻译的简洁优雅的解决方案。我们的解决方案不需要对我们的基础系统的模型架构进行修改,而是在输入句子的一开始引入了一个人工 token 来确定所需的目标语言(required target language)。模型的其它部分(包含了编码器、解码器和注意(attention))保持不变,而且可以在所有语言上共享使用。使用一个共享的词块词汇集(wordpiece vocabulary),我们方法能够使用单个模型实现多语言神经机器翻译(Multilingual NMT),而不需要增加参数,这比之前提出的 Multilingual NMT 方法简单多了。我们的方法往往能提升所有相关语言对的翻译质量,同时还能保持总的模型参数恒定。

在 WMT' 14 基准上,单个多语言模型在英语→法语翻译上实现了与当前最佳表现媲美的结果,并在英语→德语翻译上实现了超越当前最佳表现的结果。类似地,单个多语言模型分别在 WMT'14 和 WMT'15 基准上实现了超越当前最佳表现的法语→英语和德语→英语翻译结果。在用于生产的语料库上,多达 12 个语言对的多语言模型能够实现比许多单独的语言对更好的表现。

虽然许多谷歌翻译是的最受欢迎语言翻译软件,但是仍有很长的路要走。正如有些人说的,“不要让完美的更好”。换句话说,Google神经机器翻译是值得称赞的,即使只有一小部分用户体验到它的好处。


轻敲互动翻译平台

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多