所有计量经济圈方法论丛的程序文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问. 本文出处在文后。本文对文本大数据分析在经济学和金融学中应用的文献进行综述。文本大数据具有数据来源多样化、数据量增长快和时频高的特征,能够为经济学和金融学研究提供新的信息和独特的分析视角,但是处理文本大数据存在许多挑战。我们梳理了文本大数据的信息提取步骤,总结了常用的词典法、机器学习方法和深度学习方法的实现原理和技术特点。在经济学研究领域中,文本大数据主要用于测度经济和政策不确定性、基于文本的行业动态分类、度量和预测商业周期,以及量化媒体的政治倾向等问题。在金融学研究领域,文本大数据主要用于度量投资者和媒体关注度、不同市场参与主体的情绪、基于新闻的隐含波动率以及投资者的意见分歧等指标。我们对这些应用研究的数据来源、处理方法和分析结果进行了全面的梳理。在此基础上,本文还讨论了基于文本大数据的实证分析的新特征以及未来可能的研究趋势。 文献来源:CCER讨论稿:沈艳 、陈赟、黄卓, 文本大数据分析在经济学和金融学中的应用: 一个文献综述, 2018. |
|