前年,我个人有个学术会议经历让我对“定量分析”重要性非常深刻!作为一个经管专业的学生,我有幸参加北京一重点大学的社会政治学领域的一个交流会议!在会议结束的总结陈词中,一位北大的老教授格外重视社会学政治学的发展要重视定量分析的重要性,刻意提醒后辈们注重提升自身的定量分析在社会学等领域研究的能力,社会学政治学作为一个重要的社会科学门类,逐步明确了自身学科发展的方向。 大家都知道,实证研究之所以能得到学界的认可和支持,其重要原因在于它的严谨性,方法得当、数据样本夯实,让我们的观点和理论有据可依!这也是为什么我们的社科领域的学术研究逐渐从定性分析发展到今天的定量分析,而且这种趋势还在持续强化中! 相对而言,实证定量分析之所以比较严谨科学,其原因在于实证研究过程的方法科学,操作方法透明,每一个步骤具备重现性,所用的数据样本都是公开信息。为此,为了提升实证分析的合理性和准确性,我们在实证分析(即实证论文中的“第四部分”)之前,需要做哪些必须准备的工作呢? 1、样本选择以及清理的方法得当 实证分析的基础,在于实证分析中所依赖的样本数据。选择适合得当的样本,无疑对你的研究主题和论文质量是起到锦上添花的作用。譬如:你所开展的研究为实体企业金融化行为,如果你将金融行业样本作为研究样本,或者将金融行业样本纳入其中,那显然是不严谨的,而是将实体企业作为研究对象。为此,这就涉及到作者对样本筛选问题了!在实证样本选择和清理过程中,作者要重视什么因素会影响分析结果,常用的样本清理思路有如下特点:行业属性不同、缺失值样本、异常样本值(如不合理的负值)、极端值等。 2、模型设计的理论依据合理科学 模型设计,显然是实证研究中最为重要的一环,因为它构成了后文大篇幅实证分析的始终!所以,模型设计的合理性和准确性不容置疑!在这里,针对模型设计的问题我们需要注意以下几个方面:(1)模型的分析方法,这个也是实证操作的基础,在以前的推文中我们有过阐述(推文导读:写好论文的实证部分,有几点你需要注意!),需要根据因变量的样本分布情况来选择和操作进行。(2)自变量和因变量的定义以及测量,自变量和因变量的准确定义和度量是关系到你的论文主题把握成功与否的关键,既要理论依据的支撑,也要度量方式的科学合理。(3)选取哪些控制变量予以控制,重要的影响变量是我们甄别选取控制变量的最佳选择,所以我们必须了解和掌握哪些因素是影响因变量的重要指示(推文导读:实证研究中常常忽视的一个点:该如何将“控制变量”的选择进行到底)。 3、变量数据的整理、描述性统计 在界定变量的定义和度量方法后,我们常常关心的是变量数据是否跟正常情况一样,譬如企业的资产负债率,正常的来讲这个指标是大于0的,但是在数据获取、整理和操作中存在大量的负值;或者,有些变量的有小部分的样本值过大,需要我们进行统计处理,这个时候需要我们度过某个变量进行缩尾处理(winsorize),这个命令在stata分析软件中经常予以使用。此外,我们还需要对诸多重要变量进行描述性统计分析,这是一个非常重要的统计分析,几乎在所有的实证论文中都会予以披露描述性统计结果,之所以重要是因为通过描述性统计中的均值、方差和最大(小)值可以挖掘变量数据的社会经济内涵,从而指导我们理论研究。 4、相关性分析和多重共线性问题的探讨 相关性分析,也是实证分析中比较重要的部分,它一方面让我们初步把握变量之间的相关性,探讨变量之间的正负相关关系;另一方面,它可以帮助我们找到变量之间可能存在的统计分析问题,如多重共线性问题,如果自变量和控制变量之间的相关性系数较大,如大于0.5,即可能会存在一定的多重共线性问题,这就需要我们提供进一步的信息来确认模型是否存在干扰数据分析的多重共线性问题,如膨胀因子分析(VIF)。膨胀因子分析法,是一个在实证模型分析前予以界定变量之间是否存在多重共线性问题的措施。实际上,很多作者在开展实证研究中依次加入控制变量后发现,自变量的系数或者主要控制变量的系数发生重大反转,这其中很有可能是由多重共线性问题导致的。在膨胀因子分析中,如果因子VIF大于10,则认为可能存在多重共线性问题,也需要剔除一些影响数据分析稳定性的变量。 |
|