周三 · 技巧 关键词:数据整理 各位曾做过统计分析的亲,有没有遇到过这么个让你痛心疾首、悔不当初的情况:劳心劳力花了老鼻子时间,终于从一堆凌乱的数据中统计出需要的结果,以为大功告成之际,突然发现,妈呀!基础数据,有!问!题!咋整?呵呵,从头,再来……(请自行配上刘欢老师那沉痛的曲调)T o T 额滴个神啊……想shi的心都有了……这种崩溃的心情,相信经历过的亲都懂…… 为了避免悲剧重演,咱们今天就来理理怎么做好基础数据整理,争取一步到位! 来,瞅瞅下面这组基础源数据都有哪些问题: 1完整性检查首先得瞅瞅数据量是否完整,否则回头加一个补检一个也是醉醉的……有全量应有信息表的亲,建议最好先两边相互vlookup下看是否完整对应,多的删少的补,量对上了才好下手~现演示如下,vlookup入门请参见文尾链接哦 木有全量信息表可对照的,可以先简单整理下类型或名单列,拉个透视表看看类型或名单总数能否对上哈~ 2唯一性检查总数对上了,还要注意是否有重复数据,可以通过countif函数、高级筛选(结果复制时选择不重复记录)等方法来去除,在此首推countif,简单演示下: 说明下,高级筛选中,一定要两行信息完全一致才会被筛掉哦,下图右边就是直接筛选去除重复项后的结果啦: 3准确性检查准确性包括数据和公式两部分,数据检查包括格式、重要信息是否为空、是否符合有效性等,不合规则的,通通滴改掉!公式可以用公式错误检查来看看,详细知识点还是参见文尾链接哈~在此简单演示下有效性检查: 4其他碎碎念▲ 避免空行:作为数据源,为了方便后续做统计分析,建议尽量避免在中间出现空行,空行对筛选、自动填充、公式、透视等操作都存在较大干扰哦 ▲ 标题规整:各项在表头处都要有准确、唯一的标题,不要空、避免重复,空着会影响透视、重复或不清晰会导致后续分析易混淆,记性不好的亲这点尤其重要哟 学会了吗?那么, 用工整漂亮的源数据去征服统计分析和你的boss吧~ |
|