共 159 篇文章
显示摘要每页显示  条
数据分析人员必须掌握的一些sql语句。
聚类算法实践(3)——PCCA、SOM、Affinity Propagation.PCCA是除了Chameleon算法外,对样品2聚类结果最好的一个算法。PCCA可以自动判定cluster数目,而且也能得到非凸型的cluster,还可以适用于概率转移矩阵的聚类,看上去确实是一个性能比较好的聚类算法。3)AP算法不能直接知道聚类的数目,它不仅不能判定合适的聚类数目,甚至在聚类完成前...
聚类算法实践(2)——谱聚类、Chameleon聚类。5、根据每个数据点的k维空间坐标,使用K-means或者其它聚类算法在k维空间对数据进行聚类。从算法的第4、5步就可以看出,谱聚类的本质实际上就类似于PCA,先将数据点投影到一个更能反映数据特征的空间,然后再用其它办法进行聚类。聚类结果。因为算法最后还是使用了K-means进行聚类,所以我们可以...
聚类算法实践(1)——层次、K.层次聚类最大的优点,就是它一次性地得到了整个聚类的过程,只要得到了上面那样的聚类树,想要分多少个cluster都可以直接根据树结构来得到结果,改变cluster数目不需要再次计算数据点的归属。K-means算法相比起上面提到的层次聚类,还有一个很大的不同,那就是它需要数据点的坐标,因为它必须要求取平均,而层次...
R语言学习由浅入深路线图。本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等。该书介绍了各种时间序列分析的经典方法及实现各种经典方法的R代码,该书有中文版。时间序列分析中有一大块儿是关于金融时间序列分析的。这本书适合有时间序列分析基础和金融基础的人来看,因为书中关于时间序列分析的...
数据挖掘工程师面试指南。2、关于数据挖掘项目。这是最为重要且耗时的面试阶段,询问候选人最近接手的数据挖掘项目的情况和处理方式。他一开始是如何描述这个项目的项目持续了多长时间这个项目的关键问题是什么问题是如何得到解决的在数据挖掘项目中最为困难的阶段是什么最有趣的阶段又是什么在他眼里,客户是怎么样的团队的其他成员又是如何表...
“Tableau确实很有用、很容易上手,它反应速度很快……比其他我们用过的BI工具快。而且,想省钱的话,用Tableau吧!”----中国东方航空集团公司 网络运营部 高级执行官 James PU “我们每三天要处理18TB的数据。大数据量带来了机会,同时对BI产品提出了挑战。Tableau协助我们很快的完成分析。顾客上eBay的网站买东西,做选择,我们能马上...
从2011年年底,我开始思考怎么从“用数据”转变为“养数据”(即数据运营转变为运营数据),这一段时间我特别为收集什么样的数据而烦恼(moredata,moreproblem)。而且,我也曾经想做一个特别大的适合多数人使用的数据应用出来(虚火上升),可是后来发现这在数据应用的起步阶段几乎是不可能的,一是找到可以解决大部分人需求的数据应用不容易...
【编者按】BI=DW+数据挖掘+业务分析+社会学?BI三部曲:管数据、看数据、源数据。BI有三种放法:技术部、业务部和独立部门。BI的工作=20%数据平台+30%数据支持+50%数据应用。
既然是基于用户细分,首先明确用户的细分规则,这里举例3类细分:流失用户与留存用户、新用户与老用户、单次购买用户和二次购买用户,基于这3类细分,对每个分类的用户购买商品进行比较分析,明确哪些商品更加符合用户的预期。当然,要区分流失用户和留存用户,首先必须对用户流失有一个明确的定义,关于流失用户的定义可以参考博客之前的文章...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部