分享

数据大神的修炼手册——这10点要求你必须做到!

 geoallan 2018-10-14

数据大神的修炼手册——这10点要求你必须做到!

麦肯锡全球研究所(McKinsey Global Institute)最近进行的一项研究显示,对于大数据以及数据科学行业来说,缺乏获取大数据的人才是一个关键挑战。报告预测,到2018年,美国将有大约500万个工作岗位需要数据分析技能,而这些岗位中的大多数预计只能通过训练或再训练来填补。对于什么是数据科学,什么不是数据科学,学者和业内人士之间存在着很多争论。因此,在我们进一步深入之前,让我们先来了解一下数据科学的概念。

什么是数据科学?

数据科学是商业分析领域更深层次的发展,它结合了计算机科学、建模、统计、分析和数学的方法以及实践来推动商业增长/发展。数据科学涉及到利用自动化的方法来分析大量的数据,以便从中获得见解。

这是一项研究,涉及到研究信息从哪里来,它代表什么,以及如何在创建商业战略时将其转化为一种有价值的资源进行利用。

数据大神的修炼手册——这10点要求你必须做到!

什么样的人才称得上数据科学家?

数据科学家是具有技术专家特征和科学家好奇心的新一代分析数据专家。他们有解决复杂问题的技能,怀有一颗研究的心态去探索需要解决的问题。

数据科学家是时代的标志。他们是数据分析领域所有行业的驱动力。他们一半是数学家,一半是计算机科学家,一半是探险家。由于他们可以跨越商业和技术领域,因此极受众多公司的欢迎,且薪酬丰厚。不幸的是,数据科学家的短缺是大多数商业部门面临的一个严重挑战。这使得(现有的)数据科学家更有价值,也是最受猎头青睐的专业人士。

数据科学家的基本技能要求是什么?

许多数据科学家在职业生涯早期就担任过统计学家或数据分析师。但随着大数据的发展和繁荣,围绕数据分析的角色也在不断演变。要成为一名数据科学家,你除了需要具备商业思维(而非经济学思维)的能力之外,还要擅长统计和具备分析才能。

正如我们前面提到的,数据科学借鉴的专业有统计学、数学、经济学、运筹学和计算机科学。因此,如果你想成为一名熟练的数据科学家,你应该学习其中的一部分或其中的一个,你应该能够设计实验并验证你的假设。

数据大神的修炼手册——这10点要求你必须做到!

成为数据科学家的步骤:

的确,为投身数据科学做准备是一个明智的决定。然而,要想把'21世纪最性感的工作'做好并不是一件容易的事情。你可能会面临许多的挫折,但这些挫折会让你更快的成长。

数据科学为技术领域提供了大量有高薪酬的工作机会,这些工作机会让那些热爱实验和创造人可以大显身手。现在我将引导你一步一步成为一名优秀的数据科学家。

1.提高应用数学和统计学的技能:

尽管预计大多数数据科学家将拥有数据分析师或统计学家的背景,因为许多人来自商业或经济学等领域。如果你来自非技术领域,学习应用数学和统计学是你学习数据科学之前必须要准备的能力。如果你已经是一名分析师或统计学家,那就复习一下你的技能。

2.掌握机器学习:

机器学习是数据科学的重要组成部分。它指的是处理数据建模的方法。机器学习是利用算法来预测和发现数据中的模式。成为一名数据科学家需要熟悉机器学习工具和技术,如k近邻算法、随机森林、集成方法等。

3.学会代码:

无论你从事何种类型的业务或在某公司担任要职,作为一名数据科学家,你都应该了解一种统计编程语言,比如R、Python或SAS,以及一种查询语言,比如SQL。

4.了解分布式数据库:

作为一名专业的数据科学家,你几乎总是使用数据库来存储数据。对MySQL、Postgres、MongoDB、Cassandra等数据库有扎实的了解是你在数据科学家的职业生涯中脱颖而出的必要条件(https://www./)。

5.掌握多元微积分和线性代数:

你可能想知道,当ski-learn和R已经可以拿来就用的时候,为什么数据科学家还需要了解多变量微积分和线性代数。因为这些是数据科学使用机器学习技术的基础。在面试中,你可能会被问到一些基本的多元微积分或线性代数问题,因为它们可以帮助面试官判断你在数据科学方面的资质。

6.认识数据清理:

数据清理是在进行数据分析之前,手工清理混乱的数据集,使之成为一种方便的形式过程。在企业中收集的数据通常很混乱,而且很难处理。因此,数据科学家,尤其是小公司的数据科学家,经常被要求在他们可以使用它来获得有价值的资料之前先清理数据。

数据大神的修炼手册——这10点要求你必须做到!

7.数据可视化和报告:

把数据可视化并做出相关的报告文件是数据科学家角色中非常重要的一部分,因为它可以帮助其他人,特别是决策者根据你得出的数据资讯来作出决策进而推动业务增长。熟悉D3.js、Tableau、chart.js、Raw等数据可视化工具对数据科学家非常有用。然而,数据科学家不仅应该熟悉数据可视化工具,还应该熟悉相关数据编码和通信信息背后的原理和实践。

8.大数据技能提升:

了解Hadoop、MapReduce、Apache Spark、Hive、Pig等大数据技术对数据科学家的职业生涯是一个很大的加分。大多数数据科学家使用的大型数据集不能在一台机器上运行,并且需要分布式数据处理。

9.大量的实践经验:

作为一名数据科学家,磨练技能的最好方法是实践。开始实习或参加技能训练营是非常不错的选择。如果你已经有分析师的经验,开始工作吧。

10.认识数据:

当你决定成为一名数据科学家的时候,你应该开始像数据科学家一样思考。因为公司寻求的是依托数据解决问题的人。在你面试过程中,你可能会面对这样的测试:让你在某种情况下,根据现有的数据作出决策,让公司盈利。从根本上说,数据科学家是一种极其强大和罕见的多种特征的组合。他/她是分析师、交流者、数据黑客和知识丰富的顾问的混合体。

找工作是一个非常艰难的过程。找到一个可以发挥你所长的公司,就像公司在市场中找到自己的定位一样重要。因此,如果你发现自己很难学会这些技能,可以参加在线课程或参加虚拟课堂(LVC)进行训练。

数据大神的修炼手册——这10点要求你必须做到!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多