分享

论基础源数据整理的重要性

 L罗乐 2016-08-28

周三 · 技巧    关键词:数据整理


       各位曾做过统计分析的亲,有没有遇到过这么个让你痛心疾首、悔不当初的情况:劳心劳力花了老鼻子时间,终于从一堆凌乱的数据中统计出需要的结果,以为大功告成之际,突然发现,妈呀!基础数据,有!问!题!咋整?呵呵,从头,再来……(请自行配上刘欢老师那沉痛的曲调)T o T

       额滴个神啊……想shi的心都有了……这种崩溃的心情,相信经历过的亲都懂……

      为了避免悲剧重演,咱们今天就来理理怎么做好基础数据整理,争取一步到位!

      来,瞅瞅下面这组基础源数据都有哪些问题:




1完整性检查


       首先得瞅瞅数据量是否完整,否则回头加一个补检一个也是醉醉的……有全量应有信息表的亲,建议最好先两边相互vlookup下看是否完整对应,多的删少的补,量对上了才好下手~现演示如下,vlookup入门请参见文尾链接哦


       木有全量信息表可对照的,可以先简单整理下类型或名单列,拉个透视表看看类型或名单总数能否对上哈~


2唯一性检查


       总数对上了,还要注意是否有重复数据,可以通过countif函数、高级筛选(结果复制时选择不重复记录)等方法来去除,在此首推countif,简单演示下:

       说明下,高级筛选中,一定要两行信息完全一致才会被筛掉哦,下图右边就是直接筛选去除重复项后的结果啦:



3准确性检查


       准确性包括数据和公式两部分,数据检查包括格式、重要信息是否为空、是否符合有效性等,不合规则的,通通滴改掉!公式可以用公式错误检查来看看,详细知识点还是参见文尾链接哈~在此简单演示下有效性检查:




4其他碎碎念


       ▲ 避免空行:作为数据源,为了方便后续做统计分析,建议尽量避免在中间出现空行,空行对筛选、自动填充、公式、透视等操作都存在较大干扰哦

       ▲ 标题规整:各项在表头处都要有准确、唯一的标题,不要空、避免重复,空着会影响透视、重复或不清晰会导致后续分析易混淆,记性不好的亲这点尤其重要哟


学会了吗?那么,

用工整漂亮的源数据去征服统计分析和你的boss吧~



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多