分享

【科研必备】汉俄常用语料库推荐

 柠檬俄语 2022-02-03

语料库是指存放语言材料的仓库(数据库)。语料库中存放的是在语言的实际使用中真实出现过的语言材料。

corpus  n. (pl. corpora)

refers to a large collection of well-sampled and processed electronic texts, on which language studies, theoretical or applied, can be conducted with the aid of computer tools.

语料库的分类:

按照采集原则划分:

⑴异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;

⑵同质的(Homogeneous):只收集同一类内容的语料;

⑶系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;

⑷专用的(Specialized):只收集用于某一特定用途的语料。

按照语种划分:语料库可分成单语语料库、双语语料库和多语语料库。

按照语体划分:语料库可分为书面语料库、非书面语料库。

按照对应方式划分:语料库可分为平行语料库、对照语料库。

今天给大家推荐一些俄罗斯和国内常见的语料库!

俄罗斯语料库推荐

1/ Национальный корпус русского литературного языка 

https:///resourses.htm

2/ Национальный корпус русского языка

https:///new/search-main.html

3/ Корпуса, созданные при поддержке Программы фундаментальных исследований Президиума РАН «Корпусная лингвистика»

http:///

4/ Компьютерный корпус текстов русских газет конца ХХ века

http://www.philol./~lex/corpus/

5Корпуса звучащей речи:

https:///click?_URL=http:///

6/  Корпус М. В. Ломоносова

http:///

7/ «Манускрипт». Славянское письменное наследие

http:///

8/ Машинный фонд русского языка

http://cfrl./

9/ OpenCorpora — открытый корпус русского языка

http:///

10/ Срав­ни­тель­ная поэ­тика и срав­ни­тель­ное лите­ра­ту­ро­ве­де­ние: cpcl.

http://cpcl./

国内语料库推荐

1/北京大学中国语言学研究中心的CCL语料库(Center for Chinese Linguistics PKU)

http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp

2/ 中国特色话语对外翻译标准化术语库

http://210.72.20.108/index/index.jsp

3/ 国家语委现代汉语通用平衡语料库

http://www./cncorpus/index.aspx

4/北京语言大学语料库中心BCC语料库

http://bcc.

5/清华TH语料库

openslr.org/18

6/ 中国思想文化术语库 

https://www./phone/

7/ 中国核心词汇

http:// www.cnkeywords.net/index

8/ 术语在线 

https:///index.htm

9/ 新时代人民日报语料库(NEPD)

http://corpus./

10/  全球汉语中介语语料库

http://qqk./#/login

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多