分享

奶爸1.6G Mdict词库的补充及在Bluedict中使用的心得

 昵称32564205 2016-11-30
V1.6

楼梯:
comments page 1
comments page 2

以下讨论的各词典的顺序按照奶爸的学雷锋纪念日2那个日记http://www.douban.com/note/265113899/

[注意]
1、为了防止混淆,定义几个术语:
(1)词典 - 又称字典,就是dictionary啦(相当于没解释~),一般是由某些公司出版的,比如牛津出版社的牛津高阶词典、简明牛津词典、牛津大辞典,郎文出版社的郎文当代词典等。现在很多纸质词典都有电子版。
(2)词库 - 词典的电子化载体,表现形式是一些特殊格式的文件,其内容一般是从各种纸质词典的电子版转换而来。词库文件本身不能直接运行,需要对应的词典软件才能打开。词库格式有多种,比如巴比伦词库格式后缀名是.bgl,Mdict词库格式是*.mdx(*.mdd),灵格斯词库格式是*.ld2,等等。现在很多词库格式可以由两种或以上的词典软件打开,比如Mdict词库格式*.mdx(和辅助资源文件*.mdd),Mdict和BlueDict两种词典软件都可以打开。
(3)词典软件 - dictionary software,即能够在电脑或手机等电子设备上运行的,有词典功能的软件。词典软件分为单一词库的和多词库的,前者如有道、金山词霸或各纸质词典的电子版等,特点是词库和词典软件不能分离,词库单一且不能定制;后者如Mdict、BlueDict、GoldenDict、巴比伦、欧路、灵格斯等等,特点是词典软件和词库一般是分离的,通常词典软件本身并不包含词库,而要由使用者自己另外去下载词库,然后按自己的需要加载。有的词典软件支持多种词库格式,比如M大推荐的GoldenDict,同时支持Babylon(*.bgl )、StarDict(.ifo/.dict./.idx/.syn )、Dictd(.index/.dict) 、ABBYY Lingvo(.dsl)和Lingoes(*.ld2)等5种词库格式。
以上三类术语常常不严格区分,容易造成混乱。本文以奶爸的那个1.6G词库包为基础,讨论的是应用于BlueDict词典软件的(同时也适用于Mdict词典软件),各种英英(或双解)词典的*.mdx(*.mdd)格式词库。

2、BlueDict词典软件的词库文件包括扩展名为.MDX的主文件和扩展名为.MDD的资源文件,个别词库还有扩展名为.CSS的风格样式表文件:
(1)*.mdx是词库主文件,存放词库的词条释义文本;
(2)*.mdd是资源文件,存放词库的语音、图像等资源信息。注意这个文件有的词库没有,即带语音和图像的词库有这个文件,纯文本的词库则没有;
(3).css是排版风格样式表文件,个别词库需要这个文件;
(4)对于同一个词库,.mdx、.mdd和.css的文件名必须相同。
(5)[黑体字] 以下讨论中提到词库文件名时,图省事没有写后缀名,请注意如果有同名的*.mdd文件和.css文件,要一并拷贝到词典的\Dicts目录下!

3、MDX格式的词库资源非常丰富,其实不需要也不可能都装到Bluedict里。开始时可以多装一些,慢慢用起来,找到自己喜欢的、合适自己当前水准的词库。词库的选择在Bluedict里也容易操作,在“词典管理”界面轻轻单击任何一个词库,都可以随时打开或关闭它。另外,Bluedict支持“词典多重配置”功能,可以把几十部词典都拷贝进去,然后配置几个方案,分别应用于不同场合。我的做法是建立2个配置,一个比较全的配置给bluedict本身,应用场合是直接运行Bluedict,然后在搜索框里输入单词查询。这个配置里有20多部词典,包括英英,双解,汉英,thesaurus等等类型;另一个简化配置,应用场合是在MoonReader阅读器的即指即译,这个场合要求速度快,我配置了10部词典,包括AHD4、CODT11、ODE2双解、OALD7双解、LDOCE5、CALD3、韦氏高阶、韦氏新国际3、Word Net 3和English Etymology。

4、另外补充一点,词库的文件名可以修改,修改的原则参见上面第2.(4)条。特别是奶爸1.6G包里很多文件名很长,这样带来的一个问题是,在Bluedict多词典联合搜索时,每个词库的标题栏名字就是词库的文件名,名字若太长标题栏会分几行,浪费手机屏幕空间。

一、ESL学习词典

1、[英英、双解]柯林斯高阶 Collins COBUILD Advanced Learner's English Dictionary (推荐:我的补充包)
“柯林斯双解”(奶爸1.6G包)实际上是Collins COBUILD Advanced Learner's English Dictionary 3th的双解版。Collins COBUILD词典释义风格独特,喜欢的童鞋推荐英英版的“Collins COBUILD Advanced Learner's English Dictionary 3th” (我的补充包),排版优于双解版。这个词库另外一个比较实用的特色是有大量的短语索引,可以直接检索短语。柯林斯词库另外还有6th版,感觉不如3th版好;至于8th版,则完全失去了柯林斯自己的风格,更像牛津简明,但比起CODT又差太远(纠正:经M大提醒,这个8th词库是母语词典Collins English Dictionary,不是柯林斯高阶)。

2、[英英]郎文 Longman Dictionary of Contemporary English 5th(推荐:附录1.7Asicsfree加强版)
“LDOCE5“
“LDOCE5_Activator”
奶爸1.6G包里的这个词库是Superfan版本,4个文件有1G多,排版精美,不但词条有英、美两种语音和大量的图片,而且例句也有真人语音,绝对的巨无霸,另一个特色是有大量的thesaurus、collocation。美中不足的是,有一个词条索引Bug,此词库中有大量的词条比如“give”,其索引不是“give”,而是“give + (空格,) + noun”和“give + (空格,) + verb”,这样当多词典联合搜索时,输入“give”,LDOCE5的相应词条就不会显示出来。如此优秀的词库只好打个7折(注:新版本bluedict已修正此Bug)。如果是直接在Bluedict词典中查词,那么在正文(词条释义)界面下方的工具栏按“右箭头”(向后浏览词条),即可以显示LDOCE5的释义;如果是在MoonReader等阅读器中即指即译,此时的浮动窗口界面上没有这个工具栏,就没办法了(注:BlueDict 5.8.6中,浮动窗口界面的下方增加了左右翻页箭头透明按钮)。其实这也不是什么大问题,因为还有其他词库嘛,东方不亮西方亮,这就是多词典联合搜索的好处。

[P.S] 掌上百科近期又出现了Asicsfree版http://pdawiki./thread-10674-1-2.html,修复了Superfan版的bug,并保留了superfan版的排版风格。另外还有一个Huge版 http://pdawiki./thread-10674-1-1.html,也修复了Superfan版的bug,但排版风格也改变了不少,个人认为不如Asicsfree版。

[P.P.S] superfan版和Asicsfree版的发音喇叭图标太小,在手机上按很不方便,bluedict的作者蓝大作了修改(外挂了一个mdd文件)。修改后的Asicsfree版见附录1.7,(注意1.7包里没有包含主mdd文件,即奶爸1.6G包里的LDOCE5.mdd。所以需要把奶爸包里的这个文件名修改为“LDOCE5-Asicsfree.1.mdd”,与附录1.7包里的3个文件搭配)
也就是说,新的朗文5应该包括下面4个文件(而不是通常的1个或2个)
LDOCE5-Asicsfree.1.mdd (奶爸1.6G包里的那个最大的0.98G的文件LDOCE5.mdd,改成这个名字) ;
LDOCE5-Asicsfree.css (词库的风格样式表文件,附录1.7包里) ;
LDOCE5-Asicsfree.mdd (修改发音小喇叭文件,bluedict作者蓝大提供,附录1.7包里);
LDOCE5-Asicsfree.mdx (Asicsfree修改版的词库主文件,附录1.7包里) 。
[备注]这个经蓝大改版的Asicsfree版好像在IOS的欧陆下乱码,所以用欧陆词典的童鞋还是直接用掌上百科的Asicsfree版(经沐轻尘童鞋提醒,IOS下用2013.06.22的Huge版也不错http://www./forum/thread-10697-1-1.html

3、[英英]剑桥高阶学习词典 Cambridge Advanced Learner's Dictionary 3th(推荐:奶爸1.6G包)
“[MDict电子词典资源合辑].CALD3_v1.4”
这个词库也比较大,有300M。词条有英、美两种语音,有smart thesaurus。CALD3另外还有一个280M的版本,不如奶爸这个版本好。这种动辄300M以上的大部头ESL词库的词条一般都有语音,比如牛津高阶8th和Macmillan English Dictionary for Advanced Learners 2th。

4、[英英]韦伯斯特高阶学习词典(推荐:奶爸1.6G包)
“Webster's Advanced Learner's Dictionary”
这个词库的最大特色是有大量的短语索引。在我试过的Mdict词库中,有几部词典的短语检出率相对比较高,除了此词库外,还有上面的柯林斯高阶3th,以及下面的麦克米伦高阶学习词典,牛津简明(CODT)11,韦氏新国际3,以及Word Net 3.0等。

5、[英英]麦克米伦高阶学习词典(附录1.3)
最近才安装了这部大部头辞典的词库,发现其短语索引量甚至超过了上面的韦氏高阶和下面的COTD。比如set for life,come to a stop等短语,只有这个词库可以直接索引到。透析的话强烈推荐装上这个词库!另外,这个词库同样带有很不错的thesaurus,而且词条的不同释义项对应不同的thesaurus,这一点优于LDOCE5,个人感觉是这类ESL词库中做得最实用的。
词库在附录1.3 ,包含下面2个文件:
Macmillan English Dictionary for Advanced Learners.mdx 大小为15M
Macmillan English Dictionary for Advanced Learners.mdd 大小为284.5M

二、母语词典

1、[英英]牛津简明(推荐:奶爸1.6G包)
“CODT_v3_bg”
这个词库是CODT 11版。CODT 11版虽然有种种缺点,如没有音标,名词没有可数不可数的标注,动词也没有及物不及物的标注,几乎没有例句等等......但是正如奶爸所说,此词典优点之一是释义最简洁可读(词源项也有这个特色,不象AHD4等啰里啰唆一大堆),之二是有大量的短语索引,所以这个词典非常适合用于手机透析,绝对的利器!这个词库的另一个比较实用的特色是包含了thesaurus(注意下词条释义界面右上角有两个小切换按钮,“DI”是dictionary,'TH'是thesaurus)
注意此词库也有一个词条索引的Bug,就是同形异义词分为多个词条,但多词典联合搜索时,只能显示第1个词条。当然这也不是什么大问题,理由同上,补救办法也同上。

2、[英英、双解]新牛津ODE(推荐:我的补充包)
“Oxford Dictionary of English 2nd”(奶爸1.6G)是英英,另外推荐一个双解版的“New Oxford English-Chinese Dictionary”(我的补充包),排版和完整性均超过了奶爸1.6G包的版本。ODE2可以说是目前双解里面收词量最大的之一(另一个是AHD4双解版),而且也没有什么明显的Bug。当然ODE的汉语释义不是很理想(AHD4双解版同样有这个问题),那么再来一个牛津高阶7的双解版“Oxford Advanced Learner's English-Chinese Dictionary 7th”(我的补充包),互相印证一下吧。(补充包里的这部牛津高级7版的词库有个很奇怪的bug,很多应该是'one'的写成了'six',应该是'two'的写成了'ten',刚使用时注意下,用常了也就习惯了~)

3、[英英]美国传统AHD4(推荐:奶爸1.6G包)
“American Heritage Dictionary 4th”(奶爸1.6G包)。目前我知道的AHD4词库英英版的有2个,双解版的就更多了 - etong版,huge版,Freegut版,bowang版,mimihuhu版,asicsfree版,各有优缺点;英英版中奶爸这个是最好的(也是BlueDict所有词库中我最喜欢的之一),排版紧凑、精美,有音标(虽然是AHD自己独特的音标,但与韦氏音标是亲戚,熟悉韦氏音标的话会很快上手),有词源,有大量的图片。双解版的话推荐Asicsfree双解版(附录1.8)。英英版与双解版相比,缺点一是少了很多同义词辨析;二是在目前版本的Bluedict(5.7.1)下,同样有词条索引的Bug,即某些词条如liable检索不出来(但词库中实际上有,同样的词库文件放到Mdict词典软件下就没问题)。此Bug已反映给Bluedict的作者,蓝大会在下一个版本中改掉(此Bug已更正)。

4、[英英]韦伯斯特新世界大学词典(推荐:奶爸1.6G包)
“Webster'New World College Dictionary”

5、[英英]韦氏大学词典(推荐:我的补充包)
奶爸1.6G包里的“韦氏大学.mdx”少了配套的.MDD资源文件。“Merriam-Webster's Collegiate Dictionary 11th Edtion”(我的补充包)版本和奶爸资源包里的是一样的,但两个文件齐全。

6、[英英]兰登韦氏词典(推荐:奶爸1.6G包)
“Random House Webster's Unabridged Dictionary [167746](090610)”
这个词库同样有索引Bug,导致在联合检索时出镜率不高~~~

7、[英英]韦氏新国际3(补充:我的补充包)
这本奶爸1.6G包里没有,“Webster's Third New International Dictionary of the English Language”(我的补充包)。韦氏新国际3无论收词量还是短语都比较全,例句也相对丰富,建议安装此词库。

8、[英英]SOED(补充:我的补充包)
“Shorter Oxford English Dictionary”

三、各种搭配词典和同义词词典

1,牛津搭配词典第二版(推荐:奶爸1.6G包)
“牛津搭配语词典第2版”

2,collins柯林斯英语同义词字典(推荐:奶爸1.6G包)
“collins柯林斯英语同义词字典,Collins Thesaurus,darkdickens”

3,Collins柯林斯英语用法词典(推荐:奶爸1.6G包)
“Collins柯林斯英语用法词典,Collins COBUILD English Usage,darkdickens”

4,BBI英语搭配词典(推荐:奶爸1.6G包)
“bbi”

5,普林斯大学WordNet 3.0(推荐:奶爸1.6G包)
“WordNet 3.0”,我个人比较喜欢的词库,收词量较大,释义较浅显易懂,短语索引也很多,同时有大量的同义词(synonyms)、上意词(hypernyms)、下意词(hopernyms),还有少量的反义词,帮助编织你的word net。

6,USE THE RIGHT WORD(推荐:奶爸1.6G包)
“USE THE RIGHT WORD”
非常详细的专门的同义词辨析词库,对阅读和写作都有好处。

7、Word Web(补充:我的补充包)
“Word Web”
与Wordnet有点类似,另一个特色是释义尾部有直接到wiki的链接。这个词库很奇怪,很多词条正常索引不到,必须使用Bluedict的正文(词条释义)界面下方的工具栏的“右箭头”(向后浏览词条)才能翻到,但不像LDOCE5,其索引看起来根普通索引没区别。所以此词库不适合配置在即指即译场合。

8、词源词典(补充:我的补充包)
“English Etymology”
我个人比较喜欢的专门解释词源的词库,收词量较大。

附录1 一些Mdict词库的百度云资源
1、奶爸1.6G包 http://pan.baidu.com/share/link?shareid=434963&uk=2902556240
2、bluedict的作者yhssdl的分享,目前已超过8G,有大量的专业词库 http://pan.baidu.com/share/link?shareid=409113&uk=370055267#dir (此链接已失效)
3、麦克米伦高阶学习词典 http://pan.baidu.com/s/1i5g8Pmd
4、本文对奶爸1.6G包的补充 '我的补充包' http://pan.baidu.com/share/link?shareid=416737&uk=3809515419
5、AHD4 Huge双解版 http://pan.baidu.com/share/link?shareid=433856&uk=3809515419
6、LDOCE5 Asicsfree版-增大发音图标bluedict版(欧陆词典不适用) http://pan.baidu.com/share/link?shareid=93214400&uk=3809515419
7、AHD4 Asicsfree双解版http://pan.baidu.com/share/link?shareid=3485920596&uk=3809515419

附录2 静读天下
1、静读天下专业版1.9.3(MoonReader Pro)已付费版 http://pan.baidu.com/share/link?shareid=422440&uk=3809515419
2、静读天下专业版3.0(MoonReader Pro)中文已付费版http://pan.baidu.com/s/1pJ7Jjdh

静读天下的特色:支持BludeDict/GoldenDict/ColorDict即指即译,支持以下10种格式 - EPUB PDF MOBI HTML TXT CHM UMD FB2 CBZ CBR

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多