分享

万物归宗:分组的思路

 hercules028 2019-09-12

数据分析不仅要研究数据在数值上的大小性质,还要深入分析数据的内在属性。此时就需要借助分组的思路。分组是指将数据按照一定的标准划分为若干组,每一组数据都有一个共同的特点,而且组与组之间有着明显的差别。数据分组可以将大量、杂乱的数据按照一定的逻辑进行归类,便于数据组之间的对比,找出组与组之间的属性特征,以实现数据的深入分析。 

数据分组的思路有以下3 个关键点需要注意。

一、确定分组依据

数据分组的第一步是确定分组依据。同一份数据可以有多种分组方法,关键在于分组是否有实际意义、是否对分析有用。分组依据决定了数据分析的后期过程及结果。

分组依据要根据数据内容和数据分析的目的来进行,具体思路如下图所示。首先审视现有数据的内容包括哪几个方面,然后再结合分析目的确定分组依据。

二、确定组距与组数

当确定了分组依据后,就可以着手开始进行数据分组了。将一份数据分为几组,取决于组距与组数的设置。

组距是指一组数据中最大值与最小值的差值。根据各组数据的组距是否相等,又可以分为等距数组和异距数组。如下图所示,通常情况下都会将数据划分为等距数组,此时数据的组数=(所有数据中的最大值-所有数据中的最小值)/ 组距;特殊情况下,当数据分布不均匀,或者为了更好地归类数据时,可以将数据划分为异距数组。

三、按规划对数据分组

当确定好分组依据、组距和组数后,开始为数据分组。分组后,为了明确数据组的特征、不遗漏重点信息,可以将本组数据的组距值、最大值、最小值、平均值等数据标注上去。如下图所示,对商品销售数据进行分组后,标注出了每组数据的平均销售件数。

    

---------------------------------------------------------------------

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多