什么是非参数检 检验? 01 卡方拟合优度检验 算法原理:拟合优度指的是,抽样获得的观测频次和原假设分布中理论频次(也叫期望频次)的差异,若观测频次和理论频次越接近,意味着符合程度越好,即拟合优度更好。 (卡方)拟合优度检验所构造的统计量如下所示: 其中,k表示原假设分布的定义域,将区间(-∞,+∞)分成了k个互不重叠的区间。表示在假设的分布的每个对应区间内,样本值实际出现的次数,又叫做观测频次。表示按照假设的分布,在每个区间内样本值在理论上应该出现的次数,又叫做理论频次。 进一步分析,观测频次减去理论频次的偏差的平方和再比上理论频次,反映了一个区间内观测频次和理论频次的变异。将所有区间内的观测频次和理论频次的变异求和得到的值,服从卡方分布。最后,给定一个检验水平𝛼,若卡方值落在拒绝域内,则小概率事件发生,拒绝原假设。 下面我们来看一个例子。 应用实例:一种饮料的容器材料可以选择玻璃、塑料或者金属。为了比较消费者对包装材料的偏好,对120名消费者进行了抽样调查,发现最喜欢玻璃、塑料和金属容器的分别有55、25和40人。根据调查结果,能否认为消费者对3种材料的偏好程度是无差异的? 在这个例子中,如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则从理论上来说,调查120名消费者,偏好每种材料的人数应该都是相等的,为40人。各种观测到的人数与理论人数(期望值)之间的差异应该都是由于抽样的随机性造成的,因此不应该太大。如果二者之间的差异太大,则说明我们所作的假设(消费者对3种材料的偏好程度是无差异的)很可能不成立。 在进行检验时需要构造统计量: 式中:k是样本分类的个数,Oi表示实际观察到的频数,Ei表示理论频数。观察频数与期望频数越接近,则 统计量渐近服从于k-1个自由度的 表1列出了各组的频数、期望频数以及二者的差,表2是统计量的计算结果和相应的p值。 表1 各组的频数和期望频数 表2 统计量计算结果和相应的p值 根据表2,计算出的 02 单样本K-S检验 算法原理:单样本K-S检验是以两位苏联数学家Kolmogorov和Smirnov的名字命名的,它是一个拟合优度检验,通过对两个分布差异的分析确定能否认为样本的观察值来自所设定的理论分布总体。 设是一个样本量为n的随机样本的累积概率分布函数,即经验分布函数; 是一个特定的累积概率分布函数,即理论分布函数。定义,显然若对每一个x值来说,如果 根据检验统计量 下面通过一个例子来看一下K-S检验在SPSS软件中的操作和结果分析。 应用实例:假设有100名儿童每周看电视时间的数据,现检验能否可以认为总体中儿童每周看电视的时间服从正态分布。 这里K-S检验的零假设和备择假设为: :总体中儿童每周看电视的时间服从正态分布。 :总体中儿童每周看电视的时间不服从正态分布。 我们在SPSS软件中输入数据文件并进行K-S检验,分析结果见下表: 表3 单样本K-S检验的计算结果和相应的p值 计算出的统计量的值为0.960,相应的p值(渐近显著性)为0.315。由于0.315大于0.05,所以在5%的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非正态的。 参考资料: 1.刘扬, 毛炳寰. 统计学[M]. 中国统计出版社, 2019. 2.MysticSpectre. 数理统计8.5-卡方拟合优度检验[EB/OL].(2022-10-22)[2023-11-06].https://zhuanlan.zhihu.com/p/576009139. 3.酒酒. 非参数检验[EB/OL].(2022-11-17)[2023-11- 06].https://zhuanlan.zhihu.com/p/528655450. 1 END 1 了解更多概率论与数理统计的相关知识, 和我们一起加入网课学习吧! 网址:https://www.icourse163.org/course/USTB-1003768006 搜索:概率论与数理统计北京科技大学 |
|