本人准备市场营销研究生毕业,以前有学过sql,也懂一丢丢sas,现在想往数据分析的方向转,长期想偏data science,目前准备学习下python和R,另外也想再补补统计的知识,我知道coursera,udemy,edx这些平台,但是课程类型太多了~~~~大家有上过的吗??求各位大神推荐下(希望能把课名列出来哈)。另外如果你有学习方案推荐,也想一睹为快哈!我大概有一年时间去准备~~ 先射射各位了!!:) 在我看来, Data Science/Analytics 大致需要掌握以下几方面的技能: 1. SQL, 数据库相关的技能 这个是所有从事数据分析的第一步:获取数据,而绝大部分的数据储存在数据库中,所以SQL的技能很关键,事实上也是以后也会占用你工作的大部分时间。 SQL不难,但是想要快速熟练的掌握光靠背几个 select, from, where, group by 是远远不够的,最好的联系方法是能一边写一边看得出的结果,从而搞清楚每条语句实际在背后对数据做了什么操作,逻辑是什么。 SQL也是数据分析面试时重点考察的方面,Google, Facebook, Uber, Slack等等这些大的科技公司都会去着重考察,不需要你会很fancy的命令语句,但是会让你利用简单的命令语句去实现很复杂的逻辑关系, 这方面的资源比较入门级的有 SQLZOO 和 W3 School的SQL部分,这两个相对来说好快速上手,而且都是我前面说的可以让你一边写SQL一边看你query出来的结果, 这样会让你对命令语句具体对数据本身做了什么。 https:/// https://www./sql/ 进阶的资源有微软在edx上的一门MOOC:Querying with Transact-SQL, 这门课也适用于初学者,不过学习的时间要长一些,因为内容会讲的深一些(比如window function 和 table expression) https://www./course/querying-transact-sql-microsoft-dat201x-7 2. 统计的基本原理 大部分传统的机器学习的算法来自于统计学,而且统计学的知识也被大量的用在了数据探索阶段(Explanatory Data Analysis) 和工作中各种各样的Statistical Testing上面 这方面就是传统的统计知识,尽量选一些名牌大学的通俗易懂的基础统计课即可。 3. Data Science/Machine Learning Modeling 这块的课程最多,但也最难选,因为很多课程要么太注重理论,需要有很好的数学基础才能理解,要么就是相对来说太过简单,下面是我觉得蛮好的课程,兼顾了理论深度,理解难度和实践程度。 Udemy: Python for Data Science and Machine Learning Bootcamp https://www./python-for-data-science-and-machine-learningbootcamp/ 这门课的特点是讲解很清晰,信息量很大,讲师既讲了Python编程也讲了些ML的算法知识,不过相对来说不是很深。 Edx: Analytic Edge https://www./course/analytics-edge-mitx-15-071x-3 如果你是个对理论数学化的东西不大感兴趣,只注重怎么把ML的算法应用在实际中,那这门课是很好的入门课。 这门来自MIT的神课介绍每个算法时都是通过一个相应的现实中真实应用的案例来讲的,而且讲的通俗易懂,全部课程的语言为,也很容易上手 Udacity: Intro to Machine Learning https://www./course/intro-to-machine-learning–ud120 这门课是Google X 实验室的创始人 Sebastian Thrun (同时也是Udacity的创始人)讲授的,全面的涵盖了主流ML的算法,中间每讲一个新的算法,都会穿插了很多小练习帮助你巩固新学到的知识,而且Sebastian作为业界大牛,对ML的讲解也很清晰直白易懂。 Stanford Online: Statistical Learning http://online./course/statistical-learning-self-paced 如果你想探究ML算法背后的数学理论基础,那这门来自斯坦福的神课就是你的不二选择,虽然课程的数学理论涉及较多,但是只要跟着两位教授(两位大牛,其中一位发明了大名鼎鼎的LASSO Regression)一步步来,还是比较容易懂的,本课程也采用了较易上手的R作为编程语言 以上这些都是Data Science/Analytics 的入门课,欢迎各位大牛继续补充! 当然还有很有名的coursea上的JHU的data science系列,我在这里就不多描述了。 希望能帮到你! Bobby |
|