分享

从零开始学数据分析,什么程度可以找工作?

 pgl147258 2016-07-10

【黄宝臣的回答(488票)】:

基本答一下吧,但是不是很准确,只了解大致情况(杭州),带有某种行业自黑。

1. 第一阶段(一般岗位叫数据专员)

基本学会excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统公司的数据专员已经可以做了

2. 第二阶段(数据专员~数据分析师)

这一阶段要会SQL,懂业务,加上第一阶段的那些东西。大多数传统公司和互联网小运营、产品团队够用了。

3. 第三阶段(数据分析师)

统计学熟练(回归、假设检验、时间序列、简单蒙特卡罗),可视化,PPT和excel一定要溜。这些技术就够了,能应付大多数传统公司业务和互联网业务。

4. 第四阶段(分裂)

    • 数据分析师(数据科学家)、BI等:这部分一般是精进统计学,熟悉业务,机器学习会使用(调参+选模型+优化),取数、ETL、可视化啥的都是基本姿态。
    • 可视化工程师:这部分国内比较少,其实偏重前端,会high charts,d3.js, echarts.js。技术发展路线可以独立,不在这四阶段,可能前端转行更好。
    • ETL工程师:顾名思义,做ETL的。
    • 大数据工程师:熟悉大数据技术,hadoop系二代。
    • 数据工程师(一部分和数据挖掘工程师重合):机器学习精通级别(往往是几种,不用担心不是全部,和数据分析师侧重点不同,更需要了解组合模型,理论基础),会组合模型形成数据产品;计算机基本知识(包括linux知识、软件工程等);各类数据库(RDBMS、NoSQL(4大类))
    • 数据挖掘:和上基本相同。
    • 爬虫工程师:顾名思义,最好http协议、tcp/ip协议熟悉。技术发展路线可以独立,不在这四阶段

发现回答的有点文不对题额,不过大致是所有从底层数据工作者往上发展的基本路径。往数据发展的基本学习路径可以概括为以下内容:

1. EXCEL、PPT(必须精通)

数据工作者的基本姿态,话说本人技术并不是很好,但是起码会操作;要会大胆秀自己,和业务部门交流需求,展示分析结果。技术上回VBA和数据透视就到顶了。

2. 数据库类(必须学)

初级只要会RDBMS就行了,看公司用哪个,用哪个学哪个。没进公司就学MySQL吧。

NoSQL可以在之后和统计学啥的一起学。基本的NoSQL血MongoDB和Redis(缓存,严格意义上不算数据库),然后(选学)可以了解各类NoSQL,基于图的数据库Neo4j,基于Column的数据库BigTable,基于key-value的数据库redis/cassendra,基于collection的数据库MongoDB。

3. 统计学(必须学)

如果要学统计学,重要概念是会描述性统计、假设检验、贝叶斯、极大似然法、回归(特别是广义线性回归)、主成分分析。这些个用的比较多。也有学时间序列、bootstrap、非参之类的,这个看自己的意愿。

其他数学知识:线性代数常用(是很多后面的基础),微积分不常用,动力系统、傅里叶分析看自己想进的行业了。

4. 机器学习(数据分析师要求会选、用、调)

常用的是几个线性分类器、聚类、回归、随机森林、贝叶斯;不常用的也稍微了解一下;深度学习视情况学习。

5. 大数据(选学,有公司要求的话会用即可,不要求会搭环境)

hadoop基础,包括hdfs、map-reduce、hive之类;后面接触spark和storm再说了。

6. 文本类(选学,有公司要求的话会用即可)

这部分不熟,基本要知道次感化、分词、情感分析啥的。

7. 工具类

语言:非大数据类R、Python最多(比较geek的也有用julia的,不差钱和某些公司要求的用SAS、Matlab);大数据可能还会用到scala和java。

可视化(选学):tableau、http://plot.ly、d3.js、echarts.js,R里面的ggplot、ggvis,Python里的bokeh、matplotlib、seaborn都不错

数据库语言:看你自己用啥学啥

其他框架、类库(选学):爬虫(requests、beautifulsoup、scrapy),日志分析(常见elk)

【罗宾的回答(8票)】:

我工作5年,一直在互联网公司做和数据相关的工作,

接触过各种数据分析师,数据专员,etl工程师,数据挖掘,数据科学家,数据运营,数据产品。看了其他人的答案,我觉得更偏向数据开发,或者数据挖掘,我来说下一般招聘网站里要求的数据分析师的情况吧。

对数据分析师的要求和数据分析师所隶属的部门相关,数据分析师一般存在于三类部门:

一是隶属于负责某一条产品线的业务部门,部门只有一个数据分析师,也可能叫数据专员,部门内的其他人是运营、产品,数据分析师的日常工作就是给领导或同事出各种数据报表,偶尔出个报告,只要熟练掌握excel和ppt即可,数据来自bi系统,或者提需求给技术部或数据部提取数据。统计学的知识用不上,因为你的领导和同事完全不懂,他们就是想看某个数据,需要你给出数据来证明他们产品改进或运营的效果,他们会根据经验来理解这些数据。这类数据分析师的工作比较机械重复,但对自己所属的产品线非常熟悉,适合刚毕业的。

二是隶属于数据部门,有的也叫数据中心(或者装B的大数据中心),数据分析师也可能叫数据运营,需要熟练掌握sql,了解数据库的知识,有的也需要会python,每天大部分工作是写sql帮业务提数,还有就是帮业务梳理逻辑,把数据需求落实进bi系统或宽表里。

三是隶属于业务部门里独立的数据组,整个组由多个数据分析师组成,所需的技能和行业相关,一般电商之类的熟练掌握excel、sql、spss就够了,如果是金融行业,那就得会sass。工作是制作各种报表,监控业务情况,也会有专项分析报告,主要是向大领导汇报。

其实现在大部分互联网公司的数据建设都不健全,尤其是流量数据,但出于安全性的考虑又不用第三方数据分析系统,所以无论你是哪个部门的数据分析师,大部分的工作都是在获取和加工数据,做数据报表。对工具的掌握决定了你获取和加工数据的效率和层次,比如你只会用bi导数,用excel处理数据,在遇到bi没有的数据,或者涉及几十万数据量的时候,你就只能写邮件提需求了。

但也不是说掌握了各种技术和工具就能当个好的数据分析师,好的数据分析师必须是要非常熟悉并理解业务的,因为你要是不懂业务,你连需要取什么数都不知道!

现在还有一个岗位和数据相关,叫数据科学家,很像其他回答里说的那种懂各种算法,或者高阶的数据分析师,但这类数据人员基本不是从低阶数据分析师进化来的,而是本来就是计算机相关专业的硕士或博士。同样的还有数据挖掘工程师。

如果想走技术路线,或者所谓大数据方向,最好去公司专门的数据部,起码可以接触到更多的数据和技术。如果在业务部门做数据分析师,虽然门槛低好入行,但没有机会和空间,做的时间再久也是导数做报表,发展不大。

【天道仇情卍的回答(6票)】:

学完123就可以了吧。

【今晚打老虎的回答(1票)】:

上面的黄,说的很好了。我补充一丢丢。只是从开发上来讲,最好是会Java,因为方便看Hadoop的源码。多线程必须很熟练,因为mr基本都是,写mr其实不难,类似于在做填空。

Linux常用命令必须熟练。

最好有关系型数据库的基础,这样学noSQL比较容易。个人认为大数据其实不是很难,但是特别繁琐,因为它要学的东西太多了,没有人都会,也没有人只会一点。但是比起之前搞Oracle的RAC感觉还是容易了一些

【kilo的回答(0票)】:

对于学习大数据这件事情考虑了很久,既然选择这一行就要坚持到底,有没有去过普开数据的同学们,请教一下经验。

【黑车司机的回答(0票)】:

找一家公司做实习生

原文地址:知乎

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多