普通心理学

大华府斯 2010-11-01

展开全文

心理统计笔记

1.       绪论
a)       教育与心理统计学的任务：用简单的统计数字来说明问题，还要对有关数字作更深一步的研究，找出教育与心理研究中的规律性的东西。
b)       教育与心理统计学的要领：教育与心理统计学是应用统计学的一个分支，是数理统计学与教育学、心理学的一门交叉学科。
c)       描述统计学的含义：主要是研究和减缩数据和描述这些数据。
d)       推断统计学的含义：主要是研究如何利用数据去作出决策的方法。
e)       多元统计分析的含义：主要是研究超过两个因素的教育与心理的研究和实验。
f)       总体：我们所研究的具有共同特性的个体的总和。
g)       总体中的每个单位成为个体。
h)       样本是从总体中抽取的作为观察对象的一部分个体。一般来说，样本中个体数目大于30称为大样本，等于或小于30称为小样本。在对数据进行处理时，大样本和小样本所用的统计方法不一定相同。
i)       1904年美国人桑代克（E.L.THORNDIKE）写的《心理与社会测量导论》被认为是世界上第一本有关教育与心理统计学的专著。
j)       随机变量：在相同的条件下，其结果可能不止一个，由实验或观测所得到的数据，事先无法确定，这类现象称为随机现象。因为可以用数字来表现，称这些数字为随机变量。
k)       常用的符号：
a)       其中Σ表示连加号；C表示常数；而Xi是观测变量
ii.       变量一般以大写英文字母表示：如变量X，变量Y
iii.       变量中的元素则以小写英文字母表示：如变量x，变量y
iv.       变量平均数；          平均差；标准差S；方差
第一章……………常用统计表与图
      次数分布：指的是一批数据中各个不同数值所出现的次数情况，或者是指一批数据在量尺上各等距区组内所出现的次数情况。
      次数分布图通常的两种表达方式：次数直方图和次数多边图两种
      简单次数分布：通常简称为次数分布表，其实质是反映一批数据在各等距区组内的次数分布结构。
a)       求全距：全距是一批数据中最大值与最小值之间的差距。用R表示    R=Max-Min
b)       定组数：就是要确定把整批数据划分为多少个等距的区组。用K表示 N为数据个数。
c)       定组距：用表示    通常取整数
d)       写出组限：组限是每个组的起始点界限
e)       求组中值：组中值是各组的组中点在量尺上的数值
i.       组中值=（组实上限＋组实下限）÷2
f)       归类划记：
g)       登记次数
      相对次数分布：就是各组的次数与总次数N之间的比值，以表示相对次数。则：。说明：相对次数较大的组，则说明落入该组内的数据个数据占全部数据个数的比例也越多。反之，则越少。
      累积次数分布表
      次数分布图通常有两种表达方式：次数直方图和次数多边形图。
      几种常用的统计分析图：散点图、线形图、条形图、圆形图。（散点图适合于描述二元变量的观测数据；线形图适用于描述某种事物在时间序列上的变化趋势等；条形图适用于描述离散性变量的观测数据；圆形图适用于描述百分比结构的分类数据）
第二章……………常用统计参数
一、集中量数：描述集中趋势的统计量称为集中量数。集中量数包括算术平均数、加权平均数、几何平均数、中数等，它们的作用于度量次数的集中趋势。
      算术平均数：
1.1.1       样本平均数：简称为平均数或均数
因为实际上我们经常得到的是样本值，很难得到总体μ，所以算术平均数常指样本平均数
1.1.2 加权平均数：若已知各组平均数和各组人数，要求总的平均数时，则要用加权平均数的方法
1.1.       3算术平均数的性质：见书本（共5点）
1.1.4算术平均数的优缺点：具有反应灵敏、确定严密、简明易解、计算简便并能作进一步的代数演算等优点，但是算术平均数具有易受极端数据影响、出现模糊数据和存在不等数据时无法计算。
      几何平均数：1当一组数据中任何两个相邻数据之比接近于常数据，而数据按一定的比例关系变化时（在教育与
心理研究中，求平均增长率或对心理物理学中的等距与等比量表实验的数据处理，均应用几何平均数
2当一数据中存在极端数据，分布呈偏态时，算术平均数不能很好地反映数据的典型情况，此时应
用几何平均数或集中量数（中数、众数）来反映
a)          式中 ——几何平均数 N——数据个数 Xi——原始数据
b)          式中 ——反对数    ——XI的对数
      中数：当一数据中存在极端数据，分布呈偏态时，算术平均数不能很好地反映数据的典型情况，此时应求中数。
   式中 ——中数在数列中的位置 N——数列数据个数
            中数具有计算简单、不受极端数据影响的特点，但由于中数是根据0数据的相对位置来确定的，从而有较大的抽样误差，不如平均数稳定；故而，中数不如平均数应用广泛
      众数：指次数[]分面中出现次数最多的那个数的数值。
         皮尔逊的经验法：式中 ——众数 ——中数    ——平均数
二、差异量数：描述离中趋势的统计量称为差异量数，包括平均差、方差与标准差等，它们的作用在于度量次数分布的离中趋势。
      平均差：用符号AD表示（因为计算要取绝对值，不利于进一步的统计分析，不常和）
例：有5名被试的错觉实验数据如下，求平均值？
被试       1       2       3       4       5
错觉量(单位：毫秒）       16       18       20       22       17
解：n=5 =18.6
      方差和标准差
1)       方差：指离差平方的算术平均数。（样本方差）
2)       标准差：指离差平方和平均后的方根。即方差的平方根。（样本平均差）
3)       标准差的合成：例某能力研究，共抽取三个样本，测得该能力得分如下表，求标准差。
样本       n             S
1       42       103       16
2       36       110       12
3       50       98       17
解：求总平均得分：
  求总标准差：
4)       标准差的性质：○1第一个观测值都加一个相同常数C后，计算得到的标准差等于原标准差。○2每一个观测值都乘一个相同的常数C，则所得的标准差等于原标准差乘以这个常数C。○3每个观测值都乘同一个常数C，再加一个相同常数D，所得的标准差原标准差乘以这个常数C再加一个相同常数D
5)       方差和标准差是表示一组数据离散程度的最好指标。其值越大，说明次数分布的离散程度越大，其值越小，说明次数分布的离散程度越小。
6)       方差和标准差具有反应灵敏、计算严密，受抽样变动的影响较小。而且方差具有可加性。
      差异系数CV
例：某校高考考生语文平均分为63分，标准差为11分。数学平均分为75分，标准差为12分，试比较考生哪一科离散程度较大。
解：
即：语文科的离散程度更大
三、地位量数
      地位量数的涵义：研究对象某一属性的数量化指标——原始变量在其所处分布中地位的量数。因为它是相对于次数分布而言，又称为相对地位量数。
      百分位分数：是一种相对地位量数，是次数分布中的一个点。
      百分等级分数：也是一种相对地位量数。（越小，原始数据在常模中的位置越低，越大则越高）
四、相关分析
      相关：事物之间存在联系但又不能直接作出因果关系的解释时，称事物间的这种关系为相关。
      相关分析：用一些合理的指标对相关事物的观测值进行的统计分析叫相关分析。
      积差相关系数的应用条件：○1两列变量都是等距或等比的测量数据；○2两列变量所来自的总体必须是正态的或近似正态的对称单峰分布；○3两列变量必须具备一一对应的关系。
      等级相关系数的应用条件：具有等级顺序的测量数据，或者得到的数据是等距或等比的测量数据，但其所来自的总体分布不是正态的。
      点双列相的应用场合：适用于双列变量中一列为来自正态总体的等距或等比的测量数据，另一列变量为二分称名变量，即按事物的某一性质只能分为二类相互独立的变量。
      双列相关的应用场合：适用于两列变量均来自正态总体的等距或等比变量，而其中一个被人为的划分为两个类别的数据。

第四章：抽样理论与参数估计
a)       总体：我们所研究的具有共同特性的个体的总和。
b)       总体中的每个单位成为个体。
c)       样本是从总体中抽取的作为观察对象的一部分个体。一般来说，样本中个体数目大于30称为大样本，等于或小于30称为小样本
d)       参数总体数据特征的量数统称为参数。简称参数。
e)       反映样本数据特征的量数统称为样本统计量，简称统计量。
f)       简单随机抽样，就是对某一些特定总体中抽取样本时，总体中每一个元素（或个体）被抽取的可能性是同等的，而且任何元素（或个体）之间彼此被抽取的机会是独立的。
g)       X2分布的特点：
1．       X2分布是一个正偏态分布。当自由度df→∞时，X2分布即为正态分布。
2．       X2值都是正值。
3．       K个X2分布的和也是X2分布。
4．       与方差。若df>2时，则X2分布的平均数等于df，方差等于2df。
5．       X2分布是连续型分布，但有些离散型的分布也近似于X分布。
6．       见书本P109。
h)       T分布与标准正态分布的关系：
1．       t分布与正态分布的相似之处：t分布基线上的t值从-∞－+∞；从平均数等于0处，左侧t值为负，右侧t值为正；曲线以平均数处为最高点向两侧逐渐下降，尾部无限延伸，永不与基线相接，呈单峰对称形。
2．       区别之处在于：t分布的形态随自由度（df=n-1）的变化呈一簇分布形态（即自由度不同的t分布形态也不同，见图6.1）。自由度逐渐增大时，t分布逐渐接近正态分布。
i)       F分布的用处：主要用于比较数据的离散程度。
j)       F分布的两个结论：略。见书P113。
k)       样本容量的计算：
l)       点估计：用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。
m)       区间估计：以样本统计量的抽样分布（概率分布）为理论依据，按一定概率要求，由样本统计量的值估计总体参数值的所在范围，称为总体参数的区间估计。
n)       判断估计量优劣的标准：无偏性、有效性、一致性。

第五章          假设检验
      假设检验的原理：利用样本信息，根据一定概率，对总体参数或分布的某一假设作出拒绝或保留的决断，称为假设检验
      两类错误的概念：
1)       若实际情况是不应当拒绝原假设，此时拒绝了原假设H0。称这种错误为第一类错误或“弃真”错误。
2)       若实际情况是不应当接受原假设，此时接受了原假设H0。称这种错误为第二类错误或“取伪”错误。
      双侧检验：只强调差异而不强调方向性的检验。    单侧检验：强调差异和方向性的检验。
      双侧检验和单侧检验的区别：
1．       问题的提法不同。双侧检验的提法是：μ和已知常数μ0是否有显著差异？单侧检验的提法是：μ是否显著的高于已知常数μ0。或μ是否显著的低于已知常数μ0。
2．       建立假设的形式不同。双侧检验的原假设和备假设为：H0：μ=μ0，H1：μ≠μ0。单侧检验的原假设和备假设为：H0：μ≤μ0，H1：μ＞μ0。或H0：μ≥μ0，H1：μ≤μ0。
3．       否定域不同。双侧检验的否定域为|Z|＞ ,而单侧检验查表得Za
      总体均值的显著性检验：
1．       总体服从正态，总体方差σ2已知，则用Z检验：
例：有人调查早期教育对儿童智力发展的影响，从受到过良好早期教育的儿童中随机抽取100人进行韦氏儿童智力测验(μ0=100，σ0=15)，结果 =102.5，能否认为受过良好早期教育的儿童智力高于一般水平。
要点：①H0:μ0≤μ0,H1:μ1>μ0
② =SE = =1.5
③Z= =1.67
④当α=0.05(双侧)时，查正态分布表得Z =1.96
因为Z=1.67<1.96,所以P>0.05
结论：受过良好早期教育的儿童智力不比一般水平高。
2．       总体服从正态，总体方差σ2未知，则用t检验：
例：有人调查早期教育对儿童智力发展的影响，从受到过良好早期教育的儿童中随机抽取6名学生的成绩分别为：48.5，49.0，53.5，49.5，56.0，52.5。而在该学年中，全年级的总平均分为52.0分，试分析采用早期教育与未采用早期教育的儿童智力发展有无显著差异（取a=0.05）。
解：题意：μ0=52，还可以计算到
①假设检验：H0:μ0=μ0,H1:μ1≠μ0
②
③由a=0.05，自由度df=6-1=5，查t分布得到临界值
○4由|t|=|-0.41|=0.41<2.571= ，则接受假设H0，即认为两种教育方法并没有显著的差异。
3．       总体非正态：采用非参数检验，当N≥50时，仍用
      两总体均值差异的显著性检验
1．两个总体方差都已知，用       2。其它：略。
      两正态总体方差的显著性检验
1.       样本方差与总体方差差异的显著性检验：（查表时，df=n-1）
2.       两样本方差差异的显著性检验：（查F分布表）

第五章          假设检验
      假设检验的原理：利用样本信息，根据一定概率，对总体参数或分布的某一假设作出拒绝或保留的决断，称为假设检验
      两类错误的概念：
1)       若实际情况是不应当拒绝原假设，此时拒绝了原假设H0。称这种错误为第一类错误或“弃真”错误。
2)       若实际情况是不应当接受原假设，此时接受了原假设H0。称这种错误为第二类错误或“取伪”错误。
      双侧检验：只强调差异而不强调方向性的检验。    单侧检验：强调差异和方向性的检验。
      双侧检验和单侧检验的区别：
1．       问题的提法不同。双侧检验的提法是：μ和已知常数μ0是否有显著差异？单侧检验的提法是：μ是否显著的高于已知常数μ0。或μ是否显著的低于已知常数μ0。
2．       建立假设的形式不同。双侧检验的原假设和备假设为：H0：μ=μ0，H1：μ≠μ0。单侧检验的原假设和备假设为：H0：μ≤μ0，H1：μ＞μ0。或H0：μ≥μ0，H1：μ≤μ0。
3．       否定域不同。双侧检验的否定域为|Z|＞ ,而单侧检验查淼肸a
      总体均值的显著性检验：
1．       总体服从正态，总体方差σ2已知，则用Z检验：
例：有人调查早期教育对儿童智力发展的影响，从受到过良好早期教育的儿童中随机抽取100人进行韦氏儿童智力测验(μ0=100，σ0=15)，结果 =102.5，能否认为受过良好早期教育的儿童智力高于一般水平。
要点：①H0:μ0≤μ0,H1:μ1>μ0
② =SE = =1.5
③Z= =1.67
④当α=0.05(双侧)时，查正态分布表得Z =1.96
因为Z=1.67<1.96,所以P>0.05
结论：受过良好早期教育的儿童智力不比一般水平高。
2．       总体服从正态，总体方差σ2未知，则用t检验：
例：有人调查早期教育对儿童智力发展的影响，从受到过良好早期教育的儿童中随机抽取6名学生的成绩分别为：48.5，49.0，53.5，49.5，56.0，52.5。而在该学年中，全年级的总平均分为52.0分，试分析采用早期教育与未采用早期教育的儿童智力发展有无显著差异（取a=0.05）。
解：题意：μ0=52，还可以计算到
①假设检验：H0:μ0=μ0,H1:μ1≠μ0
②
③由a=0.05，自由度df=6-1=5，查t分布得到临界值
○4由|t|=|-0.41|=0.41<2.571= ，则接受假设H0，即认为两种教育方法并没有显著的差异。
3．       总体非正态：采用非参数检验，当N≥50时，仍用
      两总体均值差异的显著性检验
1．两个总体方差都已知，用       2。其它：略。
      两正态总体方差的显著性检验
1.       样本方差与总体方差差异的显著性检验：（查表时，df=n-1）
2.       两样本方差差异的显著性检验：（查F分布表）

第六章       方差分析
      方差分析的基本功能：在于分析实验数据中不同来源的变异对总变异的贡献大小，从而确定实验中因素对反应变量是存在显著影响。
      方差分析的应用：两种以上实验处理的数据分析，同时比较两个以上的样本平均数。
      方差分析的几个基本：
1．       总体服从正态分布。
2．       变异的可加性。
3．       各处理内的方差一致。（方差一致又叫方差齐性）。
      完全随机设计：用随机化的方法给处理指派实验序号和实验对象的实验设计。

第七章       回归分析

      回归分析的主要内容：统计学中的回归分析是借助于数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写，其目的在于为不确定现象的研究提供更为科学、精细的手段，以应用于相关随机变量的估计、预测和控制。
      回归分析的意义：能够判断两变量之间是正相关还是负相关；通过自变量的值去估计和预测因变量的发展变化。
      回归分析的基本原理：（略）
      回归分析的主要内容：建立回归方程、检验和评价所建回归方程的有效性、利用所建回归方程进行预测和控制。
      一元线性回归方程的简单步骤如下：
1.       由自变量数据求出x，求得x的均值  和离均差平方和Lxx；
2.       由因变量数据求出y，求得y的均值  和离均差平方和Lyy；
3.       由数据列x和y，求得x和y的协方差Lxy；
4.       求出a和b；
5.       列出回归方程：
      回归方程有效性高低的指标R2的意义：衡量回归方程有效性高低的指标。（如果以方差分析检验方程无效求取决定R2系数是无意义的）

第八章       χ2检验
      总体分布的假设检验
一、       χ2检验：是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。（即根据样本的频数分布来推断总体的分布。它属于自由分布的非参数检验。）
二、       χ2检验的应用场合：它可以处理一个因素分为多种类别，或多种因素各有多种类别的资料。所以，凡是可以应用比率进行检验的资料，都可以用卡方检验。
三、       连续变量观测次数分布的假设检验的基本思想：一般检验是否正态分布。
四、       非连续变量观测次数分布的假设检验：

第九章             非参数检验
      非参数检验较之参数检验的特点：
1.       它一般不需要严格的前提假设；
2.       非参数检验特别适用于顺序资料
3.       非参数检验很适用于小样本，且计算简明、迅速。
      非参数检验的最大不足是未能充分利用资料的全部信息。
      符号检验：符号检验是通过多两个相关样本的每对数据之差的符号（正号或负号）进行检验，以比较这两个样本差异的显著性。
小样本的情况：当样本容量较小，n<25时，可用查表法进行符号检验。
大样本的情况：当样本容量较大，即n>25时

      符号秩序检验：威尔科克逊（F.Wilcoxon）提出了既考虑差数符号，又考虑差数大小的符号秩次检验法。
小样本的情况：当样本容量n<25时，可用查表法进行符号秩次检验。
大样本的情况：当样本容量n>25时，二项分布接近与正态。
      秩和检验：当比较两个独立样本的差异时，可以采用曼-惠特尼（Mann-Whitney）两人提出的秩和检验方法。又称曼-惠特尼U检验法。
小样本的情况：当两个独立样本的容量n1和n2都小于10，并且n1≤n2时，可用查表法。
大样本的情况：当两个独立样本的n1和n2都大于10，T分布接近与正态，对于两个样本的差异可以用正态分布的Z比率进行检验。
      中位数检验：中位数的检验方法是将各组样本数据合在一起找出共同的中位数，然后分别计算每个样本在共同中位数上、下的频数，再进行r×c表卡方检验。