在处理数据尤其是包含大量列的表格时,数据加载过程中出现的错误可能会成为一个令人头疼的问题。不过Power BI 配合 Power Query 提供了一种强大的解决方案,可以有效地识别、隔离和报告这些错误,从而简化数据清理流程。 以下面这个订单表为例,当把它导入到PowerBI并加载到模型中,可以看到提示有错误,为什么会出现这个问题呢? ![]() 出现这种错误,一般是由于数据源不规范导致的,那么如何快速定位到错误具体在什么地方? 可以通过点击上述界面中的“查看错误”,进入PowerQuery中查看具体是哪些行存在错误。 ![]() 这个错误表的每一行至少都有一个单元格存在Error,点击Error可以看到错误原因,比如这个: ![]() 这一列是销售额,但是数据中带有文本单位“元”,无法直接转换为数值型,所以会报错。 知道了哪些行存在错误,如何解决呢? 如果这些错误行并不重要,可以直接删除掉所有的错误行,只需要点击该表左上角的得按钮,选择“删除错误”即可。 ![]() 不过大部分情况下,并不能直接删除,还是需要查找错误原因并修正错误数据的。 在错误表中,可以逐列查找Error单元格,通过提示来修正,不过这样效率太低了,我们可以在错误表中,选中第一列行号列,右键“逆透视其他列”: ![]() ![]() 就能将所有的错误单元格全部显示在一起了: ![]() 通过这个表,第一列是源数据的行号,第二列是源数据的列名,点击第三列的每个error可以查看错误原因,这样就非常方便的帮助我们定位错误,并进行相应的调整。 可以在源数据中对数据进行更改,也可以导入到PowerQuery之后,先不要转换数据类型,把错误的单元格数据替换成正确的格式后,再把字段转换成正确的数据类型。 数据表中的Error单元格解决完之后,不存在错误了,系统自动生成的错误表也会变成空表,不想要的话可以右键该表删除。 通过上述步骤,可以帮助我们快速识别、整理、修正不规范的数据,这种方法不仅提高了效率,还增强了用户对数据质量的掌控力,是处理复杂数据集时不可或缺的实用技巧。 |
|