分享

六个步骤掌握学术论文数据分析(内含安装包)

 wheatfa 2023-06-17 发布于辽宁

图片 图片 

图片 图片 图片 图片 图片 图片 图片


(一)你真的理解在学术科研中数据分析的意义吗
图片

老师,我知道发论文对我很重要,但是我发的论文问卷收集数据总是找不到合适的群体填写,并且已经被4本期刊所拒绝发表,而且导师说论文数据分析太片便,没有意义,且创新点缺乏,真的好难!

图片

论文问卷数据也找了很多同学帮我填,也回收了很多数据,但是好像也分析不出来什么显著的研究结果!是我方法不对吗?而且我不明白研究变量更适合哪种分析方法?

图片

发布论文意义非比寻常,而论文的好坏,往往核心在于论文问卷数据的质量以及收集到数据怎么去分析使用?

是否可以在从大量数据中发现有价值的信息,优化研究方向和流程

图片

通过数据分析,研究者可以检验自己的假设是否成立或者需要进行修改可以揭示各种数据之间的潜在关系和影响,帮助研究者发现更深层次的规律和趋势?

图片

通过数据分析,研究者还可以评估实验设计的可行性和效果,可以提供量化的信息和结果,使得研究者的研究可以被其他人轻易的重现和验证?

在做数据分析时,经常会有这样的困扰:面对几种相似的方法,既不清楚它们各自的使用场景,也无法分清它们之间的差别,一念之差就可能选错方法
在做数据分析时,经常会有这样的困扰:面对几种相似的方法,既不清楚它们各自的使用场景,也无法分清它们之间的差别,一念之差就可能选错方法。

图片

本文不仅帮助大家理清不同数据分析方法的区别与使用场景,方便选出正确的方法进行分析,还列举了一些常见的学术科研中数据分析工具安装包以及具有学术价值且被高校内师生常常使用的论文数据收集平台

总之,数据分析在学术科研过程中扮演着至关重要的角色。只有通过数据分析,研究者才能更好地理解自己的研究成果,并从中发现更多的科学发现。

当今科研环境下,发表论文期刊不仅是对科研工作的一种肯定和表彰,更是评价科研人员学术水平和职业成就的重要指标之一。发表高质量的论文可以增加科研人员的知名度和声誉,提高其职业竞争力,同时也有助于获得更多的研究资源和资金支持。甚至可以推动学术界和行业的发展,提高科研成果的应用和推广价值,为社会发展做出贡献。

今天,就写论文必不可少的数据分析方法这一要点,给大家进行一次较为系统的梳理和科普,一共分为检验数据可用性和分析数据关系两大版块,为大家介绍了当前较为主流的分析方法。


(二) 如何进行数据分析

很多研究需要采用定量研究方法,收集、处理、分析数据。数据收集方法较多,在此介绍问卷调查。这可分为两种:

一是采用前人编制的成熟量表,进行更新和改良

二是自己设计问卷,并经过信效度检验,如alpha信度系数检验等。

进行数据处理和分析前,可多看相关论文,摸索研究思路,建议按照下图找到对应的研究方法,理清不同方法的区别与使用场景,以便选出正确的方法进行分析。

一般而言,社科领域论文的数据处理和分析可按照以下顺序进行:人口统计学描述性分析,问卷信效度分析,差异性分析,相关、回归分析,验证假设。

1、基本描述统计

1.概念:描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的频数、集中趋势、离散程度、分布以及一些基本的统计图形。

2.SPSS操作:单击菜单栏:“分析”——“描述统计”——“描述”,单击“选项”,在弹出的对话框中,在“均值”、“方差”前打勾选中。

分类汇总用于研究不同分类时的汇总情况,输出的指标为汇总结果。

比如不同区域分类项,销售额(汇总项)的差异情况。






图片

2、差异关系研究

常见的差异关系研究方法包括方差分析、t检验、卡方检验、非参数检验。

‍(1)方差分析

方差分析用于进行定类数据与定量数据之间的差异关系研究;按照研究内容和数据类型等不同,可分为以下几类:






图片

(2)t检验

t检验,用于分析定类数据与定量数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下几类:






图片

(3)卡方检验

卡方检验,用于分析定类数据与定类数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下几类:






图片

3、影响关系研究

影响关系研究包括进行相关分析、回归分析、logit回归分析三大类。

‍(1)相关分析

相关分析可分为以下三类:






图片

‍(2)回归分析






图片

回归分析主要进行影响关系研究,可以细分为二十几种,由于篇幅有限,这里仅介绍比较常用的回归分析方法,感兴趣同学可以进行学习。

‍(3)logit回归分析






图片

当研究X对Y的影响时,如果因变量Y为定类数据,则应该使用logit回归分析。

4、信息浓缩方法

信息浓缩常见方法为因子分析、主成分分析。

因子分析和主成分分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。原因在于因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名。

5、信度分析

1.概念:代表测量的可靠程度,或不受测量误差影响真分数测量的程度。一个好的测量,它的结果是可靠的,多次反复测量,其结果保持一致。

信度分析的方法主要有三种:Cronbachα信度系数法、折半信度法和重测信度法。其中,Cronbachα信度系数法为最常使用的方法,即通过Cronbachα信度系数测量测验或量表的信度是否达标。

2.SPSS操作:单击菜单栏“分析”——“度量”——“可靠性分析”。

表2 可靠性分析输出结果

Cronbach’s Alpha

项数

.841

4

3.结果分析:一般Cronbach’sAlpha值大于0.7,则说明数据的可靠程度较好。

6、效度分析

1.概念:反映测量工具能够正确无误地测出潜在特质的程度,也就是研究者可以掌握到抽象意义的程度。

效度有很多种,可分为四种类型:内容效度、结构效度、区分效度、聚合效度。较为主流的为区分效度,通过计算平均变异数抽取量(AVE)进行分析,该构念的各因素负荷量平方和的平均值。

2.SPSS操作:单击菜单栏“分析”——“降维”——“因子分析”。

3.结果分析:潜在变项的变异抽取量(VE)是计算潜在变项各测量变项对该潜在变项的变异解释力,若VE值愈高,则表示潜在变项有愈高的信度与收敛效度,一般要求其标准值须大于0.5。

区别效度之判定标准为:若每一个变项之变异抽取量(VE)须大于各成对变项间之相关系数平方值,则称为具有区别效度。因此我们只要证明,所有构念之间的最小AVE大于相关系数矩阵中的最大值的平方值,即代表有良好的区别效度。

表3 因子分析输出结果

图片

(三) 数据分析常用软件推荐

1、Origin

Origin常被认为是数据处理软件,其实用它做模型图也是一个不错的选择。对于数据绘图,提供了N多数据图形的模板,同时支持常见的数据分析方法。






图片

下载:公众号内回复“Origin”

2、Sigmaplot

SigmaPlot是一个完全专业的图形和数据分析程序,它比Excel程序功能更强大,工具更多。它是数据分析最有效的图表工具。虽然SigmaPlot不是化学软件,但它对于参与图表和数据分析的化学研究人员非常有用。当然,所有处理数据的研究人员SigmaPlot肯定对他们有用。土木工程师、工业、农业、统计学、地质学、物理学、生物学、数学等等,都可以使用SigmaPlot来分析数据。






图片

下载:公众号内回复“Sigmaplot”

3、Mathematica

Mathematica是一个老牌的科学计算软件,在数据分析、数学计算等领域提供了强大方便的使用场能。它的功能非常强天,原生函数非常多,有近5000个,并涉及多个领域。如果是函数或者数值结果画图的话,绝对用它!






图片

下载:公众号内回复“Mathematica”

4、spss

SPSS是世界上最早的统计分析软件。并具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。






图片

下载:公众号内回复“spss”

5、Python

Python是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。






图片

Python既支持面向过程的编程也支持面向对象的编程。在“面向过程”的语言中,程序是由过程或仅仅是可重用代码的函数构建起来的。在“面向对象”的语言中,程序是由数据和功能组合而成的对象构建起来的。

下载:公众号内回复“Python”


(四)数据采集和描述部分写作

广义的数据分析,包括数据采集和数据分析两个环节。

数据采集是数据分析的基础和前提。开展数据分析之前,介绍数据采集结果十分必要。假如我们将整个数据分析比如成做菜,那么数据的采集如果买菜和备菜的过程。

本部分可以包括四个方面内容,分别是数据来源、数据规模、数据预处理和数据特征描述。

(1)数据来源。这一部分需要交代数据如何获得,包括数据来自哪个机构或者信息系统、数据采用何种调查问卷获得的、数据在什么地点采集获得的、甚至数据采用何种实验器材获得等一个方面或者几个方面的信息。

(2)数据规模。论文需要告诉读者数据采集的范围和规模。数据采集范围主要是指数据采集的时间范围和空间范围;数据规模主要是指记录数和字段数。有时,数据采集之后还需要剔除部分数据,比如调查问卷发放200份,但由于种种原因,只回收了180份调查问卷;再比如利用信息系统获得1000条数据,但因为部分项目缺失,导致只有980条数据可以使用,这些情况都需要说明

(3)数据预处理。原始数据可能并不适合直接用来分析,需要进行一定的加工处理,如,将连续数据处理为离散数据、数据标准化、将分类变量处理成哑变量等等。如,因为数据分析方法要求,将当事人按照某个标准,划分为青年、中年和老年,这就是将连续数据处理成离散数据,需要在论文中说明。

(4)数据特征描述。有时由于数据规模较大(记录数和字段数都比较多),为了让读者能够全面而简要地了解数据基本情况,往往采用数据的基本统计量(平均值、中位数、方差、最大值)等等,或者频数直方图对数据整体情况进行描述。

需要指出的是,数据的描述和数据的描述性分析并不相同。数据的描述是让读者了解数据的基本情况,如规模、平均值等等。而数据的描述性统计则是,通过对比分析、趋势分析、比例分析等描述统计分析方法,让读者了解隐藏在数据背后的规律。

不过,有的研究数据采集内容,则论文中没有数据采集部分,有的研究数据采集工作较少,则论文将数据采集与方法或分析结果合并成为一节。


(五)回收问卷无效?如何保证数据质量?
学术研究中,对于网络问卷调查而言,应答数量很重要,但网络问卷的应答数量及其相关的应答率不应该是衡量网络问卷数据质量的唯一指标或者最重要的指标。作为严谨的研究者,应该从网络问卷调查的整个环节审查数据质量。

建议你把问卷委托平台进行专业采集,可以进行免费的预调查数据回收,帮助优化问卷设计,可以快速抽样进行被访者邀请,完成问卷数据。

极术云平台会从网络问卷的各个阶段进行问卷数据质量控制

 1、问卷设阶段优化网络问卷以适应移动智能终端,并充分利用网络问卷系统的样本监测、自动跳转、数据检测等技术优势;平台内通过设置一些必答的身份识别问题作为身份过滤网,根据被调查者的回答,决定其是否符合研究对象的要求。在问卷填答过程中实现有效范围清理和逻辑一致性清理,促使问卷填答者提供符合要求的数据,进而在源头上提高网络问卷的数据质量。

2、抽样阶段,针对网络问卷多用于非概率抽样研究这一事实,采用被访者驱动等可实现统计推论的方法,提升抽样的科学性;

3、数据收集阶段,增强对于社交平台用户邀请方式、电子红包等激励方式的控制,实现对于网络问卷扩散及填答方式的掌控;保证同一用户所填答的两个或者两组关联性问题答案之间的逻辑联系应该是符合常识的。

4、资料处理阶段,需要根据网络问卷的内部和外部特征进行在线即时审核资料控制,并利用特定统计技术实现数据清洗。针对不同的数据误差来源,主要包括以下可供使用的统计技术方法:利用加权调整法修正网络调查覆盖误差与抽样误差;利用二级抽样和热卡插补技术修正网络调查无回答误差;采用混合效应随机化项目回答技术修正网络调查测量误差。

将有助于改善网络问卷的质量控制,进而促使网络问卷成为社会科学的重要调查工具,为社会科学实践提供真正有效的数据支撑。


图片

图片


(六)专业的学术性数据服务平台

极术云平台依托来自海内外著名高校的一线科研人员,结合高校学术科研现状和最新数据发展趋势发起创建,旨在为国内外高校科研人员开发的专业网络实验数据平台。

平台提供自建和联盟合作的大样本量数据库支持,您可以自行创建项目并抽样符合条件的样本进行数据回收。有严格的数据质量控制体系,为您的项目数据保驾护航!

致力于为学术研究者提供高效、专业的数据采集服务,已经与数百所高校及数千名教师合作,为高校师生提供了快速、高质量、低成本的问卷数据采集服务。

极术云平台的优势在于:

1、高质量的数据采集:极术云平台拥有百万级样本库,可以根据研究需求进行随机抽样,保证采集到的数据具有较高的代表性和可信度,为您的学术研究提供有力的支持。

2、学术认可度极高:极术云已经成功帮助众多研究人员完成了数据采集工作,并且获得了学术界的认可。

在中国知网、谷歌学术中搜索极术云或Jishuyun关键字,你可以搜索到已发表的使用了极术云收集数据的SCI一区期刊论文、CSSCI和北大核心。

3、费用合理的价格:极术云平台的服务价格合理,根据研究项目的需求进行定制化服务,节约研究经费。

不仅如此,极术云平台还有许多成功的案例。目前,使用极术云平台采集数据的论文已经被多个期刊发表,包括SCI一区期刊、CSSCI和北大核心等,这充分说明了极术云平台在学术数据采集领域的专业性和可靠性。

很多高校教授在极术云后台和我们分享了他使用极术云处理了数据的论文被收录于SCI一区Q1。










图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多