今天说一下,数据中英文的大小写不一致的问题。 严格的说,这不算数据错误,甚至都不算不规范的数据。因为除了看上去有点奇怪外,我们通过函数或者数据透视表进行分析时,基本上它们都会被归为一类。下面是数据透视表的结果, 用函数统计也没问题, 这是因为Excel中绝大部分工具和函数都是大小写不敏感的。 但是,有一些例外,比如我们前面讲过的函数SUBSTITUTE,就是大小写敏感的, 在上图中,我们希望通过函数SUBSTITUTE将所有名称前有Tr的产品修改为"Product-Tr",我们期望的结果是, tropic → Product-Tropic Tropic → Product-Tropic 但是,由于SUBSTITUTE是大小写敏感的,所有第一条数据“tropic”并没有按照我们的期望得到正确的结果。 因此,尽管不一致的大小写并不影响分析结果,它们却有可能影响我们进行其他数据清洗操作的结果。我们最好还是将它们统一了。 三个函数 Excel中,有三个处理英文大小写的函数,分别是:
下面是几个例子:
UPPER函数的例子
PROPER函数的例子
怎么进行大小写的数据清洗工作 进行英文大小写的清洗工作很简单。首先插入一列: 然后在新加入的列中输入公式: 公式填充到最后, 复制,然后再B列选择性粘贴,粘贴为数值, 删掉添加的临时辅助列,得到结果, |
|