本文转载自公众号:商业数据分析,作者:数小妹 任何从事数据分析行业的人,都至少要精通一两个数据分析软件。大家熟知的软件有Excel、SPSS、R、Python、SQL、Tableau、SAS、Power BI等。数据新人最大困惑之一是这么多软件到底该学哪个! 答案是:不一定。因为每家公司采用的技术路线不一样,导致员工个人需要精通的技术也大有不同。比如使用Tableau的公司一般不会再使用Power BI,因此员工也就只能深入研究Tableau,而非Power BI。同理,使用Python的公司一般不会使用R,使用SAS的公司一般不会使用SPSS。总之,你所在公司采用的技术栈,很大程度上决定了你的技术栈。
但在所有技术中有两个例外,无论你在什么样的公司做数据,这两个工具都是必备的技能——:Excel和SQL。我们随手从拉勾网找到三个数据相关岗位要求,无一例外都要求掌握Excel和SQL。 美团点评数据分析师岗 今日头条数据分析师 摩拜单车BI数据分析师 下面我们就为大家讲讲到底什么是SQL。 SQL是什么,不是什么 SQL是一种数据库查询语言 SQL是Structured Query Language的缩写,中文叫结构化查询语言。很多人误以为SQL和Python、R、JAVA一样是一门高深的、面向专业人员的编程语言,这是巨大的误解。SQL是一种特殊目的(短小精湛)的编程语言,专门用于查询、更新和管理数据。 SQL和Python等程序语言的重大区别是SQL语言是告诉计算机你想从原始数据中得到什么样结果的一段声明,而不是告诉计算机如何得到结果的算法/逻辑,因此极大降低了语法的复杂性。仔细回忆一下,绝大部分情况下我们对数据的操作无外乎: 1.增加数据(insert); 2.删除数据(delete); 3.修改数据(update); 4.按指定条件过滤数据(where); 5.按指定维度对数据进行加减乘除(group by)。 举个例子,假设我们的数据库中有一张叫“书籍信息”的表(类似于Excel的一个sheet页),表中存储了书名、作者、价格等基本信息。我们希望查询《SQL必知必会》的作者和价格,SQL代码:
上面代码中select、from和where是SQL固定语法,select用于从表中选出你想要的列,from用于决定从哪张表中找,where则是数据的筛选条件。 再比如,查询价格最高的书,SQL代码:
上面的代码中MAX用于计算“价格”字段的最大值,group by用于指定聚合字段,输出结果是价格最高的书目清单。 SQL不是数据库 很多小白误以为SQL是数据库,实际则不然。SQL仅仅是通用的数据库查询语言,MySQL、Oracel、SQL Server才是真正企业部署的数据库(数据库还有其它厂商)。 事实上,自1987年起,SQL便成为数据库的国际标准,各家数据库产品都使用SQL作为共同的数据存取语言和标准的接口,使不同数据库系统之间的互操作有了共同的基础。虽然各家都对SQL规范作了编改和扩充,但对于数据分析师而言,只是部分语法和实现细节不一致而已,并不会严重影响数据分析工作。 我们才是数据库,SQL是我们共同的语言 SQL究竟能做什么? 数据预处理 SQL是在数据库中运行的语言,在运行效率和通用性上都好于第三方软件,是数据预处理最常用的语言之一。 继续之前的例子,我们希望在查询结果中增加作者的性别和年龄,此时需要关联一张存储了作者信息的表,SQL代码:
上面的代码中join用于对多张表进行关联(类似于Excel中的vlookup),on则指定了两张表用于关联的共同字段。 有时我们希望将查询结果保存起来,以便未来继续使用,此时就可以将查询结果保存为一张表(Table)或虚拟化的视图(View),前者是数据库中存有数据的实实在在的一张表,后者则只是你编写的查询语句,数据是子在你使用视图的时候才会实时查询生成。视图的优点是可以保证数据永远是最新的,缺点是查询速度慢,这很容易理解。
上面的代码中create view ... as用于创建一个名叫“书籍和作者信息”的视图,以保存查询结果。未来我们只需要写下面的SQL代码即可,是不是非常便捷?
看到SQL代码和功能如此简单,有些人可能会怀疑SQL的能力是不是仅限于查查数、做做表关联,当然不是! 简单的“机器学习” SQL自诞生起已经超过30年,和新潮的机器学习比起来,有种廉波老矣的感觉。但Celestine Omin在《SQL足以解决你的问题,别动不动就是机器学习》一文中则展示了从实用主义的角度,SQL如何轻松搞定“机器学习”——代价远比采用ML/AI要低。
你还会怀疑SQL的能力吗?你能想多远,SQL就能走多远。 课程介绍 本课程由10年以上工作经验的数据仓库专家亲力打造,用一个零售企业数据库贯穿全课程,通过50多个实用案例,一步一步引导你理解数据库的运行机制、SQL的核心语法,以及如何和数据库成为朋友。 你能获得什么? 学员完成所有案例和毕业项目之后,将具有使用SQL独立进行数据处理、汇总分析的能力,能够通过初中级商业分析师的SQL笔试。 总之,在实战和面试中必知必会的SQL技能,这里都有! 适合人群
(无需编程基础,即学即用) 课程安排 价格:¥1080,早鸟:¥780(2月22日前报名有效) 8小时现场课程 录播提供 2周在线问答 毕业项目指导 结业证书 时间:3月10日,9:00-18:00,现场小班授课(课后提供全程录像) 地点:
报名方式 扫码进入活动行报名,请填写完整准确的报名信息,审核通过后付款即为报名成功。 北京报名二维码 上海报名二维码 课程大纲 一、初识数据库
二、SQL基础语法
三、数据分析函数
四、多表关联查询
五、子查询
六、SQL Tips
七、数据分析案例实战
八、数据库专家工作经验分享 毕业项目 在给定时间内,完成30道SQL实战面试题。 讲师介绍 梁蓓蓓,10年数据仓库工作经验,曾获2014年阿里巴巴数据科学家大赛“最强营销分析师”头衔,热爱数据,热爱可视化。曾在COSCO、eBay等企业从事BI相关工作,目前从事数据产品相关工作。 助教 Forrest,专注数据领域6年,BI团队负责人,持有Tableau QA认证、微软数据科学认证,精通Tableau和数据可视化,译著《深入浅出数据科学》。 玩数据,从商业数据分析开始 提供数据行业 |
|