数据挖掘最常用的语言是R语言和Python。 如果专精于做数据挖掘的话,两个都可以,如果还有做其他的话,比如网络爬虫或将研究转化为生产的话,推荐学Python。 在数据挖掘领域 ,python有很大的优势。除了语言灵活简单之外,数据挖掘相关的库丰富强大也是一个非常重要的原因。而且现在很多数据挖掘数据的工具,都会提供python接口。 大公司的数据挖掘,很多也用的是python。 除了数据挖掘分析之外,python在其他领域 ,例如爬虫 ,后台等地方,也有很多强大的轮子可以使用,几乎是万能语言。 (摘自简书,作者visiontry) 通过实战案例掌握Python数据挖掘分析的思路及算法则是最高效的学习方法: Python数据挖掘、 机器学习算法案例 培训时间 2017年5月27-30日 (四天) 培训地点 北京市海淀区厂洼街3号丹龙大厦 培训费用 现场班:4200元 / 3600元 (仅限全日制本科生及硕士研究生优惠价);食宿自理 远程班:3600元 / 3000元 (仅限全日制本科生及硕士研究生优惠价) 讲师介绍 Gino,早年获得名校数学与计算机专业学士和统计学专业硕士,近20年来一直进行着数据分析的理论和实践,数学、统计和计算机功底强悍。为人低调谦和,讲课富于激情和感染力。 他在高校担任过数学、计算机和统计学老师,也曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,在实践中攻克统计建模和数据分析难题无数,数据处理与分析科学精准,在实际应用中取得良好的预期效果。 他至今培训了来自高校、研究所、国外和各行各业的上千名学员,每一次培训都好评如潮。来自学术和业界的学员均在培训中受益颇多。
课程目标 通过开发若干个实际项目和案例(这些项目和案例几乎覆盖了企业中全部的数据挖掘和机器学习模型),让学员: 1. 熟悉Python的基本结构与语法与数据类型,模块;熟悉函数,类设计,包的使用; 2. 了解异常处理与多线程; 3. 能开发出一些实际的应用项目; 4. 能胜任Python的数据挖掘和机器学习工作。
课程特色 抛弃传统的知识、项目和实际案例分开讲解,直接引入设计好的实战项目和案例,带领大家循序渐进地开发出来。 在项目和案例开发过程中,引出问题,引入知识,进而运用知识解决问题。 通过实战案例把知识点都串起来,每个知识点都能找到一个真实的应用场景。这样就开创了在实战中学习、在学习中实战的新模式,既激活了枯燥的知识讲解,又熟悉了项目开发,一举两得。
课程大纲 第1天:数据整理(含numpy和pandas) 使用numpy及其数组整理数据(切片、产生随机数、复制、广播、排序等) pandas数据结构:Series pandas数据结构:Dataframe 数据索引和选择的各种方法 数据的分组、分割、合并、变形 缺失值数据和时间序列数据的处理 数据去重、去离群值和脏值 用Python进行统计分析
第2/3/4天:Python案例分析大全(但不局限于) 1. 文本挖掘原理和案例:数据可视化的各种方式 2. 预测分析核心算法:Python图片结构和分析(图片的k-means聚类分析) 3. 机器学习经典算法:图片的识别和分类:PCA建模 4. Python概率统计:二维手写数字识别(KNN方法) 5. 数据可视化:推荐系统的构建(最近邻方法、协同过滤) 6. Python经典金融分析:垃圾短信或邮件的识别与分类(Logistic对文本的分类) 7. Python量化投资:新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐) 8. 算法和模型的优化:人脸识别 9. 模型精度评估和提升:朴素贝叶斯决策 10. 特征选取的方法:酒的品质分类预测 11. 最佳k-means分类数:机器学习的格点搜索和参数寻优 12. 交叉验证(CV):惩罚线性回归分类器 13. 不平衡数据处理:使用支持向量机识别和分类 14. XGBoost:时间序列预测案例 15. 贝叶斯分析;机器集成学习算法案例 16. 逼近和最优化:Python随机模拟案例 17. 概率图模型:Python金融分析案例 18. 马尔科夫&蒙特卡罗:使用Python进行量化投资案例
优惠 现场班老学员9折优惠;
报名流程 |
|