【知乎用户的回答(38票)】: 首先,不同的位置在不同公司里的意思和工作内容有可能迥异,所以这里只说一下行业共识的部分,不代表你看到什么 title 就能一定得到我所说的这种内容。 Data Analyst: non-technical position,基本要求是别人(data engineer)把 data 整理好了给你,你的主要工作是根据 business users 的要求做 reports,写总结,等等。 Database Engineer: technical position,分工不同工作内容不同,分有 database architect(曾经 @Rio 说不知道有这个 title,不过我好多朋友就是做这个的,理论上是 database engineer 的最高级别,类似 principle engineer 是 software engineer 里的最高级别那种),databasedeveloper, database administrator。具体工作分工也没那么明确,不过具体到个人一般会有喜好,就像 software engineer 会有自己喜欢的编程语言之类的分工。 Data Scientist: misnomer(在有的公司是 non-techinical 在有的公司是 technical,你看看还能更混乱不)。一般我直接理解成一些人给自己工作乱加花边的行为(骄傲地身为其中一员)。有很多公司的 data scientist 做成了类似 analyst,有的公司跟 software engineer 差不多,反正很多时候,因为 data analysis 这个行当本质上还只是刚刚开始,大众的误解多过理解,大众的期待多过现实,反正你经常看见的是,只要工作里跟 data 沾了边又有那么点四不像性质(话说 start-up 里完全不四不像的位置还真不多),基本上都会有些奇奇怪怪的人顶着 data scientist 的帽子跑来跑去。 我个人心目中的 data scientist,对数据这件事有自己的理解,把获取、掌握和解码数据做成商业运作里非常重要的一个环节。工作内容呢,就是一条作业链,右端接口是跟 execs 交流数据里得来的商业智能(BI 也是个 misnomer,不过我觉得它本质上其实是 make sense 的,就是经常被人跟 analyst 混为一谈),左端接口是 big data architecture——不管 open source 还是 closed——简言之,就是从获取数据到对数据的最终消费全部包括。所以 data science 不是一个 job title,而是一个 team。 【卢树言的回答(2票)】: 现在忙到爆真的没时间细讲... 开头就有一节专门讲这三个职业的区别,分别需要的不同的技能。 真的有兴趣可以找来看。不管评价好不好,看到新知识总是重要的。 【HuangRyan的回答(1票)】: Data Scientist、Data Analyst、Data Engineer 的工作对象都是Data(这真是句废话,哇咔) Data Enginner 所做的一切都为了Data Management,具体内容包括数据模型、数据架构、数据标准、元数据、主数据、数据治理、数据管控等等,Data Enginner的目标是把数据整好,存储成本低,查询效率高,至于怎么使用这些数据不是他们关心的范畴。 Data Analyst所做的一切都是为了回答问题。这些问题可能来自业务部门,也可能来自各级管理人员,有些问题就是想知道某些具体数字,也有些问题是开放式的探索问题,例如为什么这个月销量下降等等。Data Analyst在Data Enginner提供的数据基础之上进行探索分析,如统计分析或机器学习等,目的是找到问题的正确答案。 Data Scientist是一个自Hi型的忽悠理念。什么是Scientist?按维基百科的定义,Scientist广义上指使用系统化的活动来发现新知识的人,狭义的定义指使用科学方法做研究的人。现在业界所谓的Data Scientist是数据应用领域的混合体,他无所不能,他要拥有相关领域的各种技能,哪有需要就往那里搬,能独立承担从数据处理、分析探索到实践应用直至最终产生业务价值全流程服务的全能超人,听起来很高大上,不过和科学不太搭边,叫科学家有点勉强了。 【知乎用户的回答(0票)】: 实际上混着用的,没有什么明确的分野。不过如果你是analyst,那么你基本就和engineering不沾边了 【ExtendedRange的回答(0票)】: Data Scientists vs. Data Engineers 原文地址:知乎 |
|