分享

人工智能:机器翻译

 人生好比斗地主 2022-11-12

我们在生活和工作中少不了要接触英文,这时候就要依赖于机器翻译。尤其是当你出国旅行的时候,那么更多地会看到这些英文,那么这个我相信对于英文不是特别流利的朋友来讲是一个挑战,那么这样以前我们需要借助我们的翻译者,然后现在我们就可以借助机器翻译来为你传授,传送这些信息。但翻译有时候也会闹笑话,因为机器翻译总容易翻出一些奇怪的句子。比如说我们这句话叫“我说了算”,但如果说你把汉语逐字的进行替换的话,那么我们就看到一个很奇怪的英文。l said the calculation,机器翻译就会以为那是计算的意思。所以这个实际上也体现了我们人类的自然语言的丰富多彩的多样性。当然了在以前这个翻译有时候也会闹笑话。至于为什么会出现这样的笑话,因为旧时候的翻译的方法主要是基于统计的机器翻译。

旧翻译方法:统计机器翻译SMT,它把两种语言当中同义的句子都切分成词,然后根据词来进行匹配。这样才能够把英文变成了中文,或者说反过来把中文变成英文。那么所以所有的这些结论都是机器通过统计数据来得出来的。

统计机器翻译类型。那么对于统计机器翻译的来说,经过不同的发展阶段,有不同的类型,第一个类型就是基于词,就是我们把一段完整的句子分解成一个一个的最小的单词,然后再进行单词的替换。当然这个是最直接的想法。当然也会是最直接闹笑话的想法。刚才我们看到了“我说了算”就是基于词的翻译的这种产物。第二种就会更进一步,把词进一步的组合成短语也就是基于短语。那么这种包含了几个单词的这种短语,就能够更加地表达我们一些成语,或者说一些常见的用法,所以它能够提高一些准确性。第三种也是最后一种,是一个基于名法的翻译,在这种翻译的技术里边,它是对于一个句子来进行一个句法的分析,把主谓宾定状补,把它都分解出来,然后再用相同的其他语言当中的句子来去替换他。所以最后基于句法的规则的翻译是基于统计机器翻译的最高的阶段了。当然我们还会有其他很多的辅助的技术加进去。但是人们发现经过了多年的努力之后,这种方法它仍然效果没有达到预期那么理想。正当人们陷入了一个很失望的一个状态的时候,那么在2016年9月,谷歌公司宣布了一个是用神经网络进行机器翻译的一个产品。

智能翻译方法。2016年9月,谷歌公司宣布了一个是用神经网络进行机器翻译的一个产品。那么这种智能翻译可以说是一种一个强大的一个颠覆,使人们对于机器翻译 又重拾起很多的信心神经机器翻译的单词错误减少了50%,词汇错误减少17%,语法错误减少19%。那么整个的结果看起来它是相当逼近于人工的翻译的,那么这种全新的机器学习的翻译系统,就在我们的谷歌怕的Translate的这个产品里头去全面启用中文翻译英文。那么这个翻译的结果就更加的通顺流畅。同样是“我说了算”这一句,它再也不会闹原来的笑话。而是翻译的比较精确的叫做l have the final say。就是说最后是由我来说话(我说了算)。那么对于一些新闻的这种翻译也是能够做的非常的接近人工翻译的这种成果。

当然除了谷歌公司,那么微软公司它的机器翻译的产品也人工智能,它的产品也得到了很大的发展。他们的进展主要体现在通用的新闻报道的翻译上,我们知道新闻报道,包括社会的事件包括体育的新闻,这些报道它体现了人的自然语言的一些,有一些限制的这种自然语言。那么在这些报道之上,微软的机器翻译系统基本上能够达到和人工翻译媲美的这种水平。那么所以我们可以说微软的这种翻译系统,它是第一个在新闻报道的翻译质量和准确率方面都可以比肩人工翻译的一个翻译系统。那么在微软的机器翻译当中,它的人工智能体现在他提出了两个技术,一个是对偶学习,那么他们认为说中文翻译成英文,和英文翻译成中文两个任务,它存在着某种对称和对偶的结构,所以这两个任务可以相互的提供反馈的信息来互相提高。再进一步它推出了推敲网络。也就是在神经网络上的一个翻译的任务完成之后,机器可以继续学习,反复的继续的进行推敲。而且它能够基于前一段阶段的翻译结果,来进行对新闻报道翻译结果进行润色,以达到更高质量的结果。

国内甜味能翻译产品。当然我们国内也有很多智能翻译的产品。比如说像“有道翻译官”,他能够做语音对讲这个翻译。也可以通过手机的摄像头拍照,然后对识别文字进行翻译。比如网易见外,他可以在视频当中提取语音来进行实时的翻译。

实时视频字幕。机器翻译的一个很典型的一个应用,就是实时的视频字幕。我们知道,很多的外文的电影或者影视作品,要让中国的一般的观众能要看得懂的话,就必须要加字幕,通常都是由字幕组他付出了辛勤的劳动,去进行人工的翻译 。但是在我们说最大的视频分享网站youtube,他就出现了自动的字幕。也就是说不需要人工去进行添加字幕了。那么在youtube上超过10亿个的线上影片的字幕都是由系统自动产生的。那么实际上youtube从2009年开始他就已经启动了自动字幕,那么当时它是用语音识别的技术来生成英文字幕,但是仅仅是生成英文的字幕,而目生成的质量还不是那么的高,那么随着人工智能的语音识别技术发展之后,那么在youtube上自动英文字幕,就大幅度的提高了识别的准确率,那么而且在机器翻译技术的支持和发展之下,它可以把识别的英文字幕当中的英文进行实时的翻译成中文、法文、西班牙文等其他的所有的这些非英文的字幕。这样我们在视频共享网站上就够看到,并不需要人工来操作,就可能看到各种语言的这种字幕。而且我们可以看到这些字幕的产生的质量还是相当的高的

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多