分享

译文:算词汇量,怎样才算一个词?有没有高频词汇列表?

 昵称70926123 2020-07-21

本文为《算词汇量,怎样才算一个词?有没有高频词汇列表?专有名词算不算词汇量?(英语教学法原著选读68)》一文中英文原文的中文翻译。建议朋友们先认真看过原文,力争读通读透,再来看本文。

------------------------

两项各自独立的研究(杜普伊,1974;古尔顿,纳辛和里德,1990)关注到《韦伯斯特第三版国际词典》(1963),这是出版时最大的非历史性英语词典。去掉合成词、古奥词、缩略词、专有名词、异体字、方言形式,把剩下的单词分成包含基础词、词形变化形式和直接衍生词在内的词族,《韦三》的词汇量约有54000词族。这一学习目标对二语学习者来说实在是难以触及,而我们将看到,对绝大多数母语者来说也是如此。

有许多英语常见词的列表,现将其中最有名的几份简述如下:

通用词表(韦斯特,1953):GSL包含2000基本词,是1940年代开发出来的。绝大多数单词的词频数字都是基于一个500万词的书面语料库统计出来的。(该词表)给出了基础词不同词义、词性的百分比数字。尽管已经有些年岁,也有一些错误,并且仅仅基于书面语,这份词表仍然是现有列表中最佳的,因为它给出了每个词不同意思的不同词频,而韦斯特也认真应用了词频和使用范围以外的判断标准。

教师用30000词汇本(索恩代克和洛吉,1944):这份30000词元的列表可换算成13000词族(古尔顿,纳辛和里德,1990),基于1800万词的书面语料库开发。其价值在于其容量。这份词表基于大型语料库,包含了大量的词汇。然而,由于开发时基于60年前的计数,这份词表已经老化了。

美国传统词频表(卡罗尔,戴维斯和利奇曼,1971):这份综合性列表基于500万取自用于美国学校的书面文本的行文,涵盖各年级、各种主题领域。这份列表的主要价值在于其对学校文本的聚焦及对使用范围数字的罗列——即各单词在各年级、各主题领域的出现频率。

布朗(弗朗西斯和库切拉,1982)、LOB及其他相关语料库:现在有多份100万词书面语料库,各代表了一种英语方言。其中一些语料库重点突出了以词元为单位的词汇列表,排列依据是词频。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多