SCI文献的全文翻译一直是个技术难题,因为: (1)PDF是非编辑文档格式,在PDF中没有段落的概念,也没有语句的概念,所有文字、图片、表格一切都是打印对象(Object);所以在源文档转成PDF的时候,段落和语句已经消失了,甚至于一个单词都被拆成两个对象。然而翻译引擎需要按段落或者按语句才能准确翻译;如果按打印对象进行翻译,必然是支零破碎、不知所云。因此,我们需要从PDF中“还原段落”,这个逆向运算是很复杂的。 (2)SCI文献一般都是双栏排版,甚至三栏排版,而且文字和图片、表格交织,这也给段落还原算法带来了更大挑战。 下面看两篇论文的示例: 1 肺癌大剂量放疗 原文:前言部分 某歌文档翻译:内容不连贯 深容SCITranslate全文翻译,内容和排版都更好 原文:方法部分,请注意断裂的单词(腺癌、断层放疗、可检测的) 某歌翻译:译文难懂,三个断裂单词译错两个 深容SCITranslate:译文准确,断裂单词也完全正确 原文:讨论部分 某歌翻译:译文难懂,格式也不美观 深容SCITranslate:内容准确,排版整洁 2 COVID-19突变 原文:前言部分 某歌翻译:内容不连贯,难以理解 深容SCITranslate:译文接近人工翻译 原文:方法部分,请注意断裂词(系统,文库富集) 某歌翻译:内容不可读,两个断裂词翻译都不准确 深容SCITranslate:译文很地道,断裂单词翻译正确 原文:方法部分 某歌翻译,跨页啦 深容SCITranslate:翻译准确 原文:讨论部分 某歌翻译:译文不流畅,格式很乱 深容SCITranslate:译文准确,格式整洁 通过两种全文翻译的比较很容易发现,深容SCITranslate 20.0 版已经较好的解决了全文翻译的难题,这对于文献泛读非常有用。同时我们必须声明:这项技术只是在某歌工作基础上的一点点改进,我们是站在某歌巨人肩膀上,感谢某歌强大的翻译引擎。 SCItranslate20 软件下载地址: (请用Windows电脑下载使用) http://www./s20.htm 老用户不需要下载,请进入原软件目录,运行一下更新程序,快速升级! 如果杀毒软件误杀怎么办? 由于自动升级功能涉及exe文件的下载,部分杀毒软件误报病毒,深容担保绝对没有病毒或木马。解决方法如下:先建一个专用文件夹,在Windows安全中心,把这个文件夹设为排除项,然后把压缩包下载到该文件夹,解压即可。其它杀毒软件请自己搜索一下如何设置安全目录。 |
|