分享

Data Scientist、Data Analyst、Data Engineer 的区别是什么?

 pgl147258 2015-04-20

【知乎用户的回答(38票)】:

首先,不同的位置在不同公司里的意思和工作内容有可能迥异,所以这里只说一下行业共识的部分,不代表你看到什么 title 就能一定得到我所说的这种内容。

Data Analyst: non-technical position,基本要求是别人(data engineer)把 data 整理好了给你,你的主要工作是根据 business users 的要求做 reports,写总结,等等。

Database Engineer: technical position,分工不同工作内容不同,分有 database architect(曾经 @Rio 说不知道有这个 title,不过我好多朋友就是做这个的,理论上是 database engineer 的最高级别,类似 principle engineer 是 software engineer 里的最高级别那种),databasedeveloper, database administrator。具体工作分工也没那么明确,不过具体到个人一般会有喜好,就像 software engineer 会有自己喜欢的编程语言之类的分工。

Data Scientist: misnomer(在有的公司是 non-techinical 在有的公司是 technical,你看看还能更混乱不)。一般我直接理解成一些人给自己工作乱加花边的行为(骄傲地身为其中一员)。有很多公司的 data scientist 做成了类似 analyst,有的公司跟 software engineer 差不多,反正很多时候,因为 data analysis 这个行当本质上还只是刚刚开始,大众的误解多过理解,大众的期待多过现实,反正你经常看见的是,只要工作里跟 data 沾了边又有那么点四不像性质(话说 start-up 里完全不四不像的位置还真不多),基本上都会有些奇奇怪怪的人顶着 data scientist 的帽子跑来跑去。

我个人心目中的 data scientist,对数据这件事有自己的理解,把获取、掌握和解码数据做成商业运作里非常重要的一个环节。工作内容呢,就是一条作业链,右端接口是跟 execs 交流数据里得来的商业智能(BI 也是个 misnomer,不过我觉得它本质上其实是 make sense 的,就是经常被人跟 analyst 混为一谈),左端接口是 big data architecture——不管 open source 还是 closed——简言之,就是从获取数据到对数据的最终消费全部包括。所以 data science 不是一个 job title,而是一个 team。

【卢树言的回答(2票)】:

现在忙到爆真的没时间细讲...

这里有本书 http://www.amazon.com/Developing-Analytic-Talent-Becoming-Scientist/dp/1118810082/ref=sr_1_2?ie=UTF8&qid=1401403258&sr=8-2&keywords=Data+science+analytic+skill

开头就有一节专门讲这三个职业的区别,分别需要的不同的技能。

真的有兴趣可以找来看。不管评价好不好,看到新知识总是重要的。

【HuangRyan的回答(1票)】:

Data Scientist、Data Analyst、Data Engineer 的工作对象都是Data(这真是句废话,哇咔)

Data Enginner 所做的一切都为了Data Management,具体内容包括数据模型、数据架构、数据标准、元数据、主数据、数据治理、数据管控等等,Data Enginner的目标是把数据整好,存储成本低,查询效率高,至于怎么使用这些数据不是他们关心的范畴。

Data Analyst所做的一切都是为了回答问题。这些问题可能来自业务部门,也可能来自各级管理人员,有些问题就是想知道某些具体数字,也有些问题是开放式的探索问题,例如为什么这个月销量下降等等。Data Analyst在Data Enginner提供的数据基础之上进行探索分析,如统计分析或机器学习等,目的是找到问题的正确答案。

Data Scientist是一个自Hi型的忽悠理念。什么是Scientist?按维基百科的定义,Scientist广义上指使用系统化的活动来发现新知识的人,狭义的定义指使用科学方法做研究的人。现在业界所谓的Data Scientist是数据应用领域的混合体,他无所不能,他要拥有相关领域的各种技能,哪有需要就往那里搬,能独立承担从数据处理、分析探索到实践应用直至最终产生业务价值全流程服务的全能超人,听起来很高大上,不过和科学不太搭边,叫科学家有点勉强了。

【知乎用户的回答(0票)】:

实际上混着用的,没有什么明确的分野。不过如果你是analyst,那么你基本就和engineering不沾边了

【ExtendedRange的回答(0票)】:

Data Scientists vs. Data Engineers

原文地址:知乎

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多