分享

python免费使用谷歌翻译的方法

 文炳春秋 2020-03-14

本文介绍一下如何通过python免费使用谷歌翻译。

前面两篇文章中使用了google 付费的API有如下两个问题:

1,费用在100万字符20美元,资费还是比较昂贵的。如果经常翻译的话,花费较大。
2,速度比较慢。猜测原因可能是google为了提供较好的翻译服务,后台使用了神经网络等机器学习的方法,对于有的不通顺的句子响应非常的慢。

由于我们在translate.google.com的页面翻译是免费的,那么则是可以通过模拟浏览器的的调用来实现免费的。鉴于此,在github上寻找到了一个可以免费翻译的项目。原来的项目提示时在python3.4+下使用,我在python2.7下面验证也是可以使用的,如果想直接在python2.7下使用,也可以之直接访问我的github,这里,我将源项目fork过来,根据自己的实践做了修改,主要解决HTTP的异常响应处理,使其能够批量的翻译而不会导致程序中断。

如果想要运行该项目,建议使用源码安装,首先代码较为简单,其次可以按照自己的方式修改。操作如下:

1,git clone https://github.com/IAMABOY/GoogleFreeTrans.git

2,需要安装几个软件包,如下pip install pytest;pip install flake8;pip install coverage;pip install PyExecJS

3,有几个地方编码问题,文件 GoogleFreeTrans/CalcTk.py以及tests/test_all.py开头加上# encoding: utf-8,我已经添加完毕,不需要在额外的添加

4,运行python setup.py test后可能提示tests/test_all.py::test_unicode FAILED,主要是test中的韩文,改成英文即可, 对于后续翻译没有影响,可以忽略

6,运行python setup.py install完成安装

7,完成安装后就可以运行如下的测试脚本

from GoogleFreeTrans import Translator

if __name__ == '__main__':
    translator = Translator.translator(src='en', dest='fr')
print(translator.translate('china'))

可以得到正常的翻译结果。

当然该项目主要的执行逻辑在GoogleFreeTrans/Translator.py下面,即用代码模拟浏览器向谷歌翻译服务器https://translate.google.cn/translate_a/single发起的GET 请求,解析返回的结果,因此是免费的。

GET请求中很多的参数是固定的,但是google为了防止爬虫,其中的参数tk(ticket)会根据请求内容的不同发生变化。Tk的值是根据文本内容以及TKK 算出来的,TKK 是根据 translate.google.cn 这个网页源代码中有一段js代码算出来的。当然这些复杂的操作已经有现成的实现,对应的就是GoogleFreeTrans/CalcTk.pyGoogleFreeTrans/gettkk.py中的代码。如果想了解背后的原理,建议使用chrome F12分析一次翻译请求即可。

在该项目的基础上,就可以批量的获取google 翻译提供的服务,且免费。目前24h能够解析大概15000次请求,单一的IP Google并没block的动作,如果出现此情况,可以考虑代理等

本文为CSDN村中少年原创文章,转载记得加上小尾巴偶,博主链接这里

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多