分享

DBSCAN算法实现(r语言)

 脑系科数据科学 2018-11-16

DBSCAN(Density-BasedSpatial Clustering of Applications with Noise),一种基于密度的聚类方法,即找到被低密度区域分离的稠密区域,要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于某一给定阈值。

Some points

一、两个参数。

1,距离参数(Eps)

2,邻域内点最少个数(MinPts)

二、根据基于中心的密度进行点分类。

密度的基于中心的方法使得点分为三类:

1,核心点。稠密区域内部的点。该点以Eps为半径的区域内点的个数不少于MinPts(包括自身)。

2,边界点。稠密区边缘上的点,不是核心点,但在某个或多个核心点邻域内。

3,噪声点。稀疏区域中的点,既非核心点也非边界点。

4,密度可达。如果点p在核心点q的Eps邻域内,则称p是从q出发可以直接密度可达。如果存在点链p1,p2, …, pn,p1=q,pn=p,pi+1是从pi直接密度可达,则称点p是从q关于r和M密度可达的,密度可达是单向的。

算法流程

从某点出发,将密度可达的点聚为一类,不断进行区域扩张,直至所有点都被访问。








R语言实现

在R中实现DBSCAN聚类,可以使用fpc包中的dbscan()函数。在下面的例子中,我们使用factoextra包中的数据集multishapes进行演示。






















































































































    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多