从今天开始,我将陆续给大家分享有关统计学的相关内容。如有错误,劳烦各位指出,不胜感激。 这一篇文章,我打算先介绍统计学的几个概念,帮助大家更好的理解统计学,进而对它产生兴趣。 统计学到底是干嘛的?统计学,说到底,它是在跟数据打交道;也就是说,它是一门数据的科学。 总的来说,它是将数据搜集、整理、分析、得出结论的这么一个过程。 可以说,统计学的目的,就是从数据中发现规律,从而得出对应的结论。 不过需要注意的是,统计学并不是万能的。 举个例子,我们都知道,抽烟会使人得癌症的几率变大,这是通过统计得出的结论。 但如果你想知道抽烟为什么会引起癌症,那恐怕统计学就无能为力了,你需要去医学界寻找答案。 另外,统计学中使用的分析方法主要有两种。一种是描述性统计,一种是推断性统计。 描述性统计,顾名思义,是对当前数据的一种分析,包括汇总、图表等等数据方面的处理工作。 而推断性统计,主要是指如何从样本数据推断出总体特征的一种方式。 比如工厂生产了一批机器,你想测试这批机器的故障率。你并不需要一个一个去筛查,只需要通过合适的方法抽取几个样本,根据样本的数据从而估算总体机器的故障率。 统计学中的数据类型统计数据,根据其测量尺度的不同,主要可分为两大类:类别型数据和数值型数据。 1.类别型数据 顾名思义,该类数据主要是体现数据的类型的。 其中又可以分为两类,一类是分类数据,一类是顺序数据。 分类数据,就是表明事物的类别,但它是无序的。 比如性别分为“男”和“女”;学校有很多学院,如“土木学院”、“计算机学院”、“音乐学院”等等。 顺序数据,它也是说明事物的类别,只不过是有序的。 比如获得的奖牌有“金牌”、“银牌”、“铜牌”;产品的质量有“一等”、“二等”、“三等”,诸如此类,不胜枚举。 2.数值型数据 数值类的数据,主要是通过数字来表明事物的一些特征。 其中,也可以分为两类,一类是离散型数据,一类是连续型数据。 离散型数据,说明该数据是不连续的。比如生产的产品数量、学校每个班级的人数等。 连续型数据,表明数据是可连续的。比如“年龄”、“温度”、“时间”等等。 统计学中常用的几个专业术语1.参数 参数是用来衡量总体特征的一个数字度量,比如均值、方差等等。 需要注意的是,参数往往都是未知的,因为一般情况下我们并不知道总体数据的情况。 2.统计量 跟参数相对,它是用来衡量样本的一个度量,通常在前面加上“样本”二字,比如样本均值、样本方差等等。 因为样本是我们抽样得到的,因此它是已知的。我们就是要通过样本统计量来衡量总体的参数。 3.变量 变量也很好理解,是用来衡量事物的某种特征,它的取值就叫变量值。 跟我们之前介绍过的数据类型相对应,变量具体也可以分为四类,分别是:分类变量、顺序变量、离散型变量和连续型变量。 统计学的基本概念就介绍到这里了,好玩的统计学,你爱上它了吗? |
|
来自: taotao_2016 > 《概率》