【原】聚类分析（Cluster Analysis）在护理研究中的应用浅析

Nursing小班长 2020-08-08

展开全文

古语有云“物以类聚，人以群分”。聚类分析（Cluster Analysis）是将未知现象进行归类的多元统计方法，主要是用来对研究的事物分类或做探索性的研究。简单来说，聚类分析就是找出特征相似的类别，研究其规律性，以便为以后的决策提供参考性。

聚类分析根据所聚类对象的类型分为两种类型：①R型聚类：对n个指标（变量或variable）归类，又称为指标聚类分析（index-cluster-analysis）。②Q型聚类：对n个观察对象（样品或case）归类，又称为样品聚类分析(samples-cluster-analysis)。

举个例子：比如我们现在有很多客户的商品购买信息，以及他们的个人信息，那么如何利用购买信息+个人信息来进行聚类呢？我们应该先明确我们的研究目的，或者我们在意的是什么？

如果我们最在意的是客户怎么花钱，以及购物特征，那就应该完全排除客户的个人信息（如年龄性别家庭住址），仅使用购买相关的数据进行聚类。这样的聚类结果才是完全由购买情况所驱动的，而不会受到用户个人信息的影响。相反，如果我们用个人信息，如性别、年龄进行聚类，那么结果会被这些变量所影响，而变成了对性别和年龄的聚类。

这里说一下系统聚类的思路和步骤，如下:

1.将每个变量(样品)各视为一类.

2.将相似系数最大(距离最小)的两类合并新类, 计算新类与其他类的类间相似系数.

指标(变量)间的相似系数计算:

①变量为计量数据相关系数(r) ：

②变量为计数数据(等级或两分类)---列连系数(C) ：

3.重复第2步过程,直到全部合并为一类.

4.结果：得到聚类的树状图。

有没有聚类分析在护理研究中的例子？

Nursing Research: July/August 2018 - Volume 67 - Issue 4 - p 331–340在线发表了“A Holistic Clustering Methodology for Liver TransplantationSurvival”，研究开发了一种新颖的方法来解决异质性和高维的肝移植人群特征在一项研究中对生存的预测。

方法是：在2008年至2014年期间，对344名接受肝移植的成年患者进行了回顾性队列研究。可预测的因素是合并症的严重程度和其他不理想的健康状态被分为11个身体系统，移植的主要原因，人口因素/环境因素，以及最终肝脏疾病的模型。逻辑回归用于计算严重程度的分数，分级聚类，用加权欧几里得距离进行聚类，对集群进行特征化的回归，以及Kaplan–Meier analysis的分析，以比较整个集群的生存情况。结果：第1组包括有更严重的循环问题的病人。集群2代表老年患者的原发性疾病更为严重，而第3组则包含最健康的患者。集群4和5分别代表肌肉骨骼（如疼痛）和内分泌问题（如营养不良）的患者。在统计学上，不同群体之间的死亡率有显著的差异（p<.001）。

通过这个例子也可以发现，护理科研中方法和研究目的同样很重要。如果想真正的做好护理科研，统计学必不可少（每学会一种方法都可以尝试去套一下自己的课题，看是否能够学有所用）。如有统计学方面的学习需求，可关注本公众号，进入公众号-艾德课堂，去搜一下《不一样的医学统计学》，通俗易懂的白话讲解，或许能给你带来不一样的学习体验。试听如下：