描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法 统计学的基础概念 统计学本质是收集、处理、分析、解释数据,并从中得出结论的科学。 数据类型不同维度分为不同数据: 测量尺度:分类数据、顺序数据、数值型数据; 收集方法:观测数据、实验数据; 时间状况:截面数据、时间序列数据。 数据分析的方法可分为描述统计和推断统计。 数量变量分为: 离散——度量『可数事物』的多少,离散型变量则是通过计数方式取得的,即是对所要统计的对象进行计数(计量),增长量非固定的。比如人数,客户数,生产产品数。 连续——度量『不可数事物』的多少,连续型变量是一直叠加上去的,增长量可以划分为固定的单位。比如身高,体重,重量。 (这个世界到底是离散的还是连续的?) 分类变量如“行业”,其变量值可以为“零售业”、“旅游业”、“汽车制造业”; 顺序变量如“产品等级”,其变量值可以位“一等品”、“二等品”、“次品”。 分类变量与顺序变量均可称为定性变量、属性变量。 数据的描述——数值方法 度量值来自于总体与样本的统计量。 度量值分为单变量与双变量,统计方法有: 单变量——中心位置、变异程度、分布形态、相对位置; 双变量——线性关系 中心位置的度量方法 变异程度 分布形态 线性关系 探索数据分析 在excel 数据---“数据分析---描述统计 中能得到所有指标值。 数据的概括性度量 集中趋势:平均数(算数平均数、几何平均数、调和平均数、算术-几何平均数、平均数不等式)、众数、中位数等。 离散程度:全距、内距、平均差、标准误、离散系数等。 分布:偏态系数、峰度系数,反映数据偏离正态分布的程度。 具体如图总结: 数据的图表展示 图表应简洁、合理的表达统计目的,不应在图形的修饰上花费太多时间。在绘制图形时,应避免一切不必要的装饰,注重图形所要表达的信息,图形产生的视觉效果应与数据所体现的事物特征一致,不得歪曲数据。 图表一般定义与约束 统计表左右两边不封口,列标题之间在必要时可用竖线分开,而行标题通常不必用横线分开;表中数据一般是右对齐,有小数点时小数点对齐,小数点位数统一,对于没有数字的单元,一般用“—”表示,表中不应出现空白单元格。 总结 |
|