DBSCAN算法实现（r语言）

脑系科数据科学 2018-11-16

展开全文

DBSCAN（Density-BasedSpatial Clustering of Applications with Noise），一种基于密度的聚类方法，即找到被低密度区域分离的稠密区域，要求聚类空间中的一定区域内所包含对象（点或其他空间对象）的数目不小于某一给定阈值。

Some points

一、两个参数。

1，距离参数（Eps）

2，邻域内点最少个数（MinPts）

二、根据基于中心的密度进行点分类。

密度的基于中心的方法使得点分为三类：

1，核心点。稠密区域内部的点。该点以Eps为半径的区域内点的个数不少于MinPts（包括自身）。

2，边界点。稠密区边缘上的点，不是核心点，但在某个或多个核心点邻域内。

3，噪声点。稀疏区域中的点，既非核心点也非边界点。

4，密度可达。如果点p在核心点q的Eps邻域内，则称p是从q出发可以直接密度可达。如果存在点链p1,p2, …, pn，p1=q，pn=p，pi+1是从pi直接密度可达，则称点p是从q关于r和M密度可达的，密度可达是单向的。

从某点出发，将密度可达的点聚为一类，不断进行区域扩张，直至所有点都被访问。

在R中实现DBSCAN聚类，可以使用fpc包中的dbscan()函数。在下面的例子中，我们使用factoextra包中的数据集multishapes进行演示。

。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：脑系科数据科学 > 《数据科学》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

脑系科数据科学

科学领域优质作者

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换