分享

用Excel做数据分析,简单粗暴超实用,十分钟就学会

 weixinxiang 2019-08-22

最近有个朋友找到我,说是想要转行做数据分析师,但是却不知道在数据分析的求职环境怎么样?而且自己什么工具都不会,python、R语言什么的也都是浅尝辄止,担心自己一转行就失业。

这也是很多想要转行数据分析的人的困惑,其实数据分析入门并不难,只要掌握了Excel数据分析的基础,基本上就已经拿到了数据分析的敲门砖,Excel既是基础也是关键,是迈向数据分析的第一步。

用Excel做数据分析,简单粗暴超实用,十分钟就学会

所以我就从网上爬了一些求职网站上关于数据分析岗位的情况,用Excel做一次完整又简单的数据分析实操,帮助大家能够尽快学会数据分析的基础。

一、提出问题

首先要明确这次数据分析的目的是什么?也就是为了解决什么问题?(提出的问题要能用很明确的指标和数字来衡量,切勿模棱两可)

提出问题:

1、在哪些城市找到数据分析师工作的机会比较大?

2、数据分析师的薪水如何?

3、根据工作经验的不同,薪酬是怎样变化的?

二、理解数据

接下来要理解表格中的各个字段(列名)表示什么意思:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

  • 城市:用于比较不同城市对数据分析师的需求如何

  • 职位所属:分析以后的工作岗位

  • 职位ID:表示职位的唯一表示,也就是每一行数据的唯一标识------用于去掉重复ID

  • 薪水:比较不同城市、和所属领域的薪水区别

  • 工作年限:从时间轴上对比薪资涨幅

三、数据清洗

数据清洗即数据预处理,目的是去掉无效、重复数据,以取得符合我们要求的数据。

数据清洗的基本步骤:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

1、选择子集

只选择对数据分析有意义的字段,无意义的字段选择隐藏,即隐藏不需要分析的列(尽量不删,保证数据的完整性)。这里隐藏公司ID和公司全名,保留职位ID和公司简称。

用Excel做数据分析,简单粗暴超实用,十分钟就学会

2、列名重命名

将不合适的列名更改为我们容易理解的形式。

3、删除重复值

对重复数据进行删除,这里我们对【职场ID】列进行删除重复值处理:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

4、缺失值处理

先检查数据是否存在缺失值,先查看完整数据列的计数:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

再选择其他列查看是否缺失数据:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

可以看出【城市】这一列缺失2条数据。

一般对缺失值的处理有4种方法,根据情况灵活使用:

  • 通过人工手动补全(缺失值较少,并且可以根据其他信息确定该值)

  • 删除缺失的数据(无法判断该位置填写何值,或者删除的数据对分析无大的影响

  • 用平均值代替缺失值

  • 用统计模型计算出的值去代替缺失值

这里对【城市】这一列的处理方法:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

由于缺失数据较少,这里选用人工手动补全,使用Ctrl Eneter快捷键,在不连续的单元格中同时输入同一个数据或公式时很好用:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

5、一致化处理

对数据进行统一的命名和处理。比如数据中的公司的所属领域是“企业服务,数据服务”,对该列数据进行拆分。

步骤如图:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

然后我们将薪水处理成【最低薪水】、【最高薪水】、【平均薪水】,用于存放清洗后的薪水数据,利用函数实现:

FIND函数的意思是查找一个字符串在另一个字符串中出现的起始位置,用FIND 函数查找分隔符【k】或者【-】。

用Excel做数据分析,简单粗暴超实用,十分钟就学会

FIND函数用来对原始数据中某个字符串进行定位,以确定其位置。FIND函数进行定位时,总是从指定位置开始,返回找到的第一个匹配字符串的位置,而不管其后是否还有相匹配的字符串。

LEFT函数(从左开始截取字符串),MID函数(从中间截取字符串),Len函数(计算字符串长度),函数具体用法可以在百度上查。

用Excel做数据分析,简单粗暴超实用,十分钟就学会

利用LEFT函数截取最低薪水:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

6、数据排序

我们对【平均薪水】这一列进行降序排序:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

7、异常值处理

使用数据透视表处理表格:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

此时发现【职位名称】中有职位不属于数据分析:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

这些异常值需要去掉,应返回原表重新筛查。

步骤:

  • 在原表【职位名称】列后插入新的列命名为“数据分析职位名称”;

  • 在下方空白单元格插入函数=IF(COUNT(FIND({'数据运营','数据分析','分析师'},L2)),'是','否');

  • 双击单元格右下方进行自动填充;

用Excel做数据分析,简单粗暴超实用,十分钟就学会

  • 使用筛选功能,选择“是”,过滤掉异常值。

用Excel做数据分析,简单粗暴超实用,十分钟就学会

四、构建模型及数据可视化

1、在哪些城市找到数据分析师工作的机会比较大?

以城市为行标签,工作年限要求为列标签,数据透视分析不同城市对不同年限的数据分析师的需求情况。

步骤:全选--选项卡,数据透视图----将数据透视表字段中的【城市】拖入到行,将【工作年限要求】拖入到列,再将【城市】拖入到值中:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

再点选表格中左上角行标签---其他排序选项---降序排序--计数项:城市

用Excel做数据分析,简单粗暴超实用,十分钟就学会

最后将数值按列汇总的百分比显示数据:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

将值按行汇总百分比显示数据:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

结论:从数据透视表可以看出,在北京数据分析的岗位最多,往后是上海、深圳、杭州、广州;按工作年限要求来看,3-5年的需求量最大,其次是1-3年,这说明数据分析对年轻人需求将更多。

2、数据分析师的薪水如何?

首先,安装EXCEL 的分析工具库功能:选项卡,文件--选项---加载项---管理,选择 EXCEL 加载项---转到---勾选 分析工具库---确定。

用Excel做数据分析,简单粗暴超实用,十分钟就学会

操作步骤如下图:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

以城市为行标签,平均薪水为列标签,数据透视表分析城市与平均薪水的关系:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

结论:从上面数据透视结果可以看出,深圳的数据分析师平均薪水最高,其次是北京,上海,杭州。

3、根据工作经验的不同,薪酬是怎样变化的?

以工作年限要求行标签,平均薪水为列标签,数据透视分析工作年限与平均薪水的关系:

用Excel做数据分析,简单粗暴超实用,十分钟就学会

用Excel做数据分析,简单粗暴超实用,十分钟就学会

结论:从上面数据透视结果可以看出,随着工作经验的增长,数据分析师的薪酬也在不断增加。

总结:

综合上面三个数据透视结果,我们可以得到以下分析结论:

  • 数据分析这一岗位,有大量的工作机会集中在北上广深以及新一线城市,如果将来去这些城市找工作,可以提高求职成功的条件概率。

  • 从待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。

  • 数据分析是个年轻的职业方向,大量的工作经验需求集中在1-5年。

  • 对于数据分析师来说,5年似乎是个瓶颈期,如果在5年之内没有提升自己的能力,大概以后的竞争压力会比较大。

  • 随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多