我最近为什么看《统计学》相关的书呢? 在处理水滴成核结晶的模拟轨迹时,需要计算未结晶概率,涉及同一工况下一定数量独立初始构型算例的成核时间,以及到底要算多少个独立初始构型的算例才能合理地计算成核速率。在论文中讲到用jackknife technique对样本数据进行再抽样,在看jackknife technique的资料中,有很多基本概念不理解(本科阶段学习的概率论与数理统计,在没有实际运用场景下,遗忘地差不多了)。不能准确地理解jackknife technique再抽样方法,就不能判断我计算出来的结果对不对,所以需要补基础知识。另外,分子动力学模拟的理论基础是统计力学,这部分基础知识也要补。 目前在看的统计学书有欧姆漫画社的《漫画统计学》(对话式的图文说明很容易理解,一般是在等待电脑处理数据时看一下)、微信读书上的《统计学》第2版(主要是方便坐车且不休息时看看),都是挑感兴趣的部分看,不是从前言开始。 简单回顾统计学 第6章 抽样与抽样估计 6.1 抽样推断概述 6.2 抽样误差
。因为在抽样中全及指标的数值是不知道的,所以抽样实际误差是计算不了的。另外,抽样实际误差是所有可能出现的误差的一种,所以不能用抽样实际误差来概括所有可能出现的误差。 前面提到抽样平均误差是抽样指标的标准差,所以不同于一般形式的标准差(根据变量值与算数平均数的计算),抽样平均误差是根据抽样平均数与总体平均数计算的,它的公式如下: 第一个公式中的左侧表示平均数的抽样平均误差,右侧小x横表示抽样平均数,大X横表示总体平均数。 第二个公式中的左侧表示成数的抽样平均误差,右侧小p表示抽样成数,大P表示总体成数。 公式中的样本可能数目 跟每个样本的容量和抽样方法有关。当样本容量确定时,则样本可能数目就由抽样方法决定。 在实际抽样中,全及指标的数值是不知道的,并且不可能也不必把总体所有可能出现的样本都取出来。所以这个公式在实际中无法计算,仅有理论意义。 抽样平均误差的实际计算公式如何得到? 书中用这么一句话来说明抽样平均误差的实际计算公式“数理统计证明,抽样平均误差(抽样指标的标准差)与总体标准差之间存在着一定的数量关系,从而可推导出抽样平均误差的实际公式如下:看书过程中,遇到不理解的,且书中也没有更多解释的概念 离差是什么意思? ChatGPT:在统计学中,离差是一种用于衡量数据点或样本值与一些参考值之间的差异或距离的概念。离差通常用来衡量数据的离散程度或分散程度,或者表示一个数据点相对于某种基准值的偏离程度。 |
|
来自: taotao_2016 > 《概率》