分享

如何将计算的方法应用于人文社会科学研究?

 扫地僧一一 2017-08-23

2012年随着社会化媒体和开放数据的逐渐兴起,互联网信息总量呈现井喷式发展。在社会科学研究领域,大数据可以提供了丰富的信息,例如网络媒体中民众政治意见的表达、政治信息的传播和获取,品牌营销,病毒式传播,媒体报道的议程设置以及政府与民众的互动、公共政策的制定等等。大数据的出现为传统的社会科学研究提供了新的研究路径和方式。以此同时,数据资源呈现出数据粒度小,记录单元碎片化,结构多元化的特征,资料的汇集、保存和综合对计算机的的依赖也更加明显。

大数据环境下,数据不仅可以作为科学研究的结果,还是科学研究的必要基础;面对人文社科领域内的海量数据,对知识对象化、可计算化趋势更加明显。人文社会科学的“科学性”显著增强,以“人文计算”、复杂网络分析、大规模数据分析为特征的研究方法逐渐被采纳,人文社会科学的研究过程中对计算机的依赖也逐渐加强。

为此,本系列课程以数据的抓取和文本挖掘为主,主要教授如何从互联网上通过程序自动爬取需要的研究内容,然后针对大数据里最有价值的文本数据,我们将教授如何对文本进行挖掘和分析。

说到数据计算,很多从事社科研究的老师和学生就会很头疼,一边是数据计算在科研中越来越重要,一边是大多讲数据分析的课程都晦涩难懂,学习周期长,入门门槛高。

但是这些你都不用担心,学长为大家请来了知深的人气老师谈和(小唐老师),谈老师之前在知深上开设的课程获得众多学员的一致好评,这一次他带着最新课程来了。文科生没有计算机基础?不怕!谈老师在授课过程中充分考虑大家的知识接受能力,用通俗易懂的语言教你学计算研究方法。

教师简介

谈和老师,中国传媒大学互联网信息研究院博士生。中国传媒大学大数据挖掘与社会计算实验室研究员,主要负责数据抓取、文本处理以及可视化开发。同时也是中国传媒大学数据新闻专业的授课者之一,负责教授信息图设计制作和可视化编程等技能。目前的研究方向为互联网群体传播与群体行为、新闻报道中的交互式数据可视化和社会媒体研究中的自然语言处理。

课程简介

第一讲 研究数据的获取(9月4日19:30——21:30)

1. 数据获取的途径和方法

2. 网络数据抓取的机制和原理

3. 爬虫软件的使用

4. 用python编写爬虫程序

5. 案例:微博数据的抓取

6. 案例:弹幕的抓取

第二讲 文本数据的处理(9月5日19:30——21:30)

1. 文本挖掘的原理

2. 文本挖掘的工具介绍

3. 文本数据的清洗

第三讲 文本挖掘(9月7日19:30——21:30)

1. 词频分析

2. 情感分析

3. 文本分类

4. 主体模型

第四讲 网络分析(9月8日19:30——21:30)

1. 微博转发数据的处理

2. 网络分析工具

3. 微博转发路径的构建及分析

适用人群

高校老师、本硕博在校生

特别说明:本课程面向所有从事人文社科研究的老师和学生,不需要有专业的计算机基础,只要你使用过电脑,老师都能教会你。

课程信息

时间:9月4日——8日

费用:299元/人

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多