分享

Excel数据分析篇:使用Power Query对数据进行分组快速统计所需数据

 每天学学Excel 2022-05-17 发布于福建

Excel中我们可以使用Power Query来对相应的数据进行分组,以便更好地对部分数据进一步统计和分析,当然我们可通过数据透视表来完成数据的汇总,但是在某些情况下数据透视表也并不是必要的操作。

例如在下面的Enrolments数据表格中,我们需要统计出当月进行培训的天数,更具体来说是在每个分公司下按照部门汇总培训时长。要想统计出此数据,我们可以在Power Query编辑器中完成。

点击“数据”选项卡下的“来自表格/区域”,进入Power Query编辑器;首先选择要分组的列,此例我们先选择的“Branch”列,再点击“主页”选项卡下的“分组依据”。

在“分组依据”对话框中,有两个选项:基本和高级,“基本”功能中仅提供单列数据的分组,而“高级”功能中则可添加多个分组。此例我们需要的是“高级”选项,并且添加另一分组依据“Department”。

添加好分组后,我们需要为新列命名,选择“操作”,即如何统计数据(此例我们选择的是“求和”),以及统计的“柱”(哪一列数据,此例为“Days”)。在“操作”中,这里有传统透视表中没有的一个方法“中值”,另一个需要注意的是“非重复行计数”,指的是若数据表中有两个重复的数据行,则不会重复进行统计。

所有的设置完成后,点击“确定”即可得到一个分组后的数据表格。

不过,返回的数据表格有一个问题(但Power Query并未将其作为错误),出现了两个Sydney-Sales,既然没有出错,说明其代表的应是不同的数据,当我们分别点击两个“Sales”进行查看时,可发现其中有一个“Sales”后面多了一个空格,当然在某些情况下也有可能是其他的符号导致的。

要解决以上问题,我们需要回到分组这一步骤的前一步,即“更改的类型”,选择“Department”列,因此列中有我们需要修改的数据值,再点击“替换值”。

在弹出的提示框中,我们点击“插入”,因为要插入替换值这一步骤。

在“替换值”对话框中,“要查找的值”我们输入一个空格(当前仅是猜测之前的数据多出一个空格),“替换为”中无需输入任何值。

点击“确定”后,我们再选择最后一步“分组的行”,但是以上操作并未解决问题。

故此,我们还是应该回到数据源本身,查找问题的根源,确定此字符为何。在这种情况下,我们通常也会大胆猜测它是另一种特殊的空格——不间断空格(non-breaking space),对此我们可以进行一些尝试。

点击“替换的值”的设置按钮,在其对话框中展开“高级选项”,勾选“使用特殊字符替换”,选择“不间断空格”。

再次回到“分组的行”这一步,可看到分组后的数据表格中不再有重复项,问题解决,说明原始数据中的问题是出现了不间断的空格字符。

最后我们在以上数据表格的基础上新增一列,计算出培训的费用,按照每天550的费用来统计:点击“添加列”选项卡下的“自定义列”,输入列名,在公式框的“=”后面,双击右侧的“Days Training”,后乘550即可。

点击“确定”后,即可新增一列显示相关的费用信息。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多