长夏宫主的图书馆

她的首页她的馆藏她的动态馆友反馈关于她分享对话

长夏宫主

文章		关注		粉丝		访问		贡献

关注

粉丝

访问

贡献

她的首页

她的馆藏

她的动态

馆友反馈

关于她

共 159 篇文章

显示摘要

每页显示

条

数据分析人员必须掌握的一些sql语句

数据分析人员必须掌握的一些sql语句。

阅264 转11 评0 公众公开 13-10-27 18:42

聚类算法实践（3）——PCCA、SOM、Affinity Propagation

聚类算法实践（3）——PCCA、SOM、Affinity Propagation.PCCA是除了Chameleon算法外，对样品2聚类结果最好的一个算法。PCCA可以自动判定cluster数目，而且也能得到非凸型的cluster，还可以适用于概率转移矩阵的聚类，看上去确实是一个性能比较好的聚类算法。3）AP算法不能直接知道聚类的数目，它不仅不能判定合适的聚类数目，甚至在聚类完成前...

阅636 转11 评0 公众公开 13-10-27 17:51

聚类算法实践（2）——谱聚类、Chameleon聚类

聚类算法实践（2）——谱聚类、Chameleon聚类。5、根据每个数据点的k维空间坐标，使用K-means或者其它聚类算法在k维空间对数据进行聚类。从算法的第4、5步就可以看出，谱聚类的本质实际上就类似于PCA，先将数据点投影到一个更能反映数据特征的空间，然后再用其它办法进行聚类。聚类结果。因为算法最后还是使用了K-means进行聚类，所以我们可以...

阅666 转11 评0 公众公开 13-10-27 17:51

聚类算法实践（1）——层次、K

聚类算法实践（1）——层次、K.层次聚类最大的优点，就是它一次性地得到了整个聚类的过程，只要得到了上面那样的聚类树，想要分多少个cluster都可以直接根据树结构来得到结果，改变cluster数目不需要再次计算数据点的归属。K-means算法相比起上面提到的层次聚类，还有一个很大的不同，那就是它需要数据点的坐标，因为它必须要求取平均，而层次...

阅317 转10 评0 公众公开 13-10-27 17:50

R语言学习由浅入深路线图

R语言学习由浅入深路线图。本文分为6个部分，分别介绍初级入门，高级入门，绘图与可视化，计量经济学，时间序列分析，金融等。该书介绍了各种时间序列分析的经典方法及实现各种经典方法的R代码，该书有中文版。时间序列分析中有一大块儿是关于金融时间序列分析的。这本书适合有时间序列分析基础和金融基础的人来看，因为书中关于时间序列分析的...

阅98 转5 评0 公众公开 13-10-27 14:43

数据挖掘工程师面试指南

数据挖掘工程师面试指南。2、关于数据挖掘项目。这是最为重要且耗时的面试阶段，询问候选人最近接手的数据挖掘项目的情况和处理方式。他一开始是如何描述这个项目的项目持续了多长时间这个项目的关键问题是什么问题是如何得到解决的在数据挖掘项目中最为困难的阶段是什么最有趣的阶段又是什么在他眼里，客户是怎么样的团队的其他成员又是如何表...

阅378 转8 评0 公众公开 13-10-27 14:36

Tableau中文版北京发布会即将召开诚挚欢迎您的到来博易智讯（北京）信息技术有限公司商务智能水晶易表数据挖掘市场研究

“Tableau确实很有用、很容易上手，它反应速度很快……比其他我们用过的BI工具快。而且，想省钱的话，用Tableau吧！”----中国东方航空集团公司网络运营部高级执行官 James PU “我们每三天要处理18TB的数据。大数据量带来了机会，同时对BI产品提出了挑战。Tableau协助我们很快的完成分析。顾客上eBay的网站买东西，做选择，我们能马上...

阅542 转1 评0 公众公开 13-10-27 14:01

车品觉：数据是未来的原材料

从2011年年底，我开始思考怎么从“用数据”转变为“养数据”（即数据运营转变为运营数据），这一段时间我特别为收集什么样的数据而烦恼（moredata,moreproblem）。而且，我也曾经想做一个特别大的适合多数人使用的数据应用出来（虚火上升），可是后来发现这在数据应用的起步阶段几乎是不可能的，一是找到可以解决大部分人需求的数据应用不容易...

阅59 转4 评0 公众公开 13-10-27 13:02

看图说话：关于BI那点事儿

【编者按】BI=DW+数据挖掘+业务分析+社会学？BI三部曲：管数据、看数据、源数据。BI有三种放法：技术部、业务部和独立部门。BI的工作=20%数据平台+30%数据支持+50%数据应用。

阅103 转1 评0 公众公开 13-10-27 12:33

基于用户细分的比较分析 ? 网站数据分析

既然是基于用户细分，首先明确用户的细分规则，这里举例3类细分：流失用户与留存用户、新用户与老用户、单次购买用户和二次购买用户，基于这3类细分，对每个分类的用户购买商品进行比较分析，明确哪些商品更加符合用户的预期。当然，要区分流失用户和留存用户，首先必须对用户流失有一个明确的定义，关于流失用户的定义可以参考博客之前的文章...

阅92 转3 评0 公众公开 13-10-27 12:24

他的文章
他的书籍

筛选

不限类型

网文

撰写

文档

不限 Word PPT Excel RTF PDF TXT

思维导图

相册

音乐

视频

显示摘要不显示摘要

每页10条每页30条每页50条

返回
顶部