在上次的《生存分析之不满足风险比例假定的竞争风险模型:STATA还是R,总有一款适合你》推送后,有留言问生存分析竞争风险模型用SPSS怎么实现? SPSS虽然还没有提供竞争风险模型的分析过程,但是SPSS可以安装很多其他程序的插件,比如R、Python,竞争风险模型就可以通过安装插件COMPRISK来实现,安装成功后就可以直接使用相应的图形用户界面(GUI)了。在安装这些SPSS的R插件前需要先安装R_Essentials_Statistics,当然如果以前安装过就不用重复安装了。这些插件可以通过Extension Hub(Extensiobs>>Extension Hub…)进行查找和安装,但遗憾的是这个链接打开的几率很小,笔者建议直接通过网站下载插件并在当地安装。(1)SPSS的R插件下载:R_Essentials_Statistics和COMPRISKhttps://github.com/IBMPredictiveAnalytics 这个网站中存在很多的功能插件,感兴趣的可以下载安装。(2)下载并安装SPSS版本对应的R软件。在下载R_Essentials_Statistics的时候可以查看版本对应关系,比如SPSS25对应的是R3.3,SPPS26是R3.5,SPSS27和Statistics Subscription都是R3.6等。R各版本下载:https://cran./bin/windows/base/old/。下载完毕后进行R的安装。 (3)设置R3.5目录:扩展>>R3.5配置,确定R3.5.0的目录。(4)安装插件。安装下载好的R_Essentials_Statistics和COMPRISK,安装过程如下:安装COMPRISK的时候可能会有些卡,耐心等一会就好。安装成功后你可以在菜单[Analyze>>Survival>>Competing Risks Regression]中找到这个过程啦。这个竞争分析的对话框界面(图形用户界面,GUI)背后依赖的是R的程序包cmprsk。如果在首次使用时显示缺少程序包cmprsk不能运行,可以打开安装好的R,在命令提示符后面直接输入:install.packages("cmprsk") 下载时使用默认的镜像即可,然后等待程序包自动安装完毕就可关闭R了。示例同《生存分析之不满足风险比例假定的竞争风险模型:STATA还是R,总有一款适合你》。 假设本例满足风险比例假定,竞争风险模型分析如下: Analyze>>Survival>>Competing Risks Regression 总结表中显示时间变量、状态变量、时间函数、组变量、失效事件编码、删失编码、缺失值处理方式、收敛与否、最大迭代次数、有效个案数、缺失个案数、伪似然对数值、伪似然值比检验、对数似然的自由度。其中时间函数是时依协变量中时间的表达形式,当前结果实际没有进行对时间变量进行变换,也没有按时依协变量的设置,此处不应该有链接函数,所以此处应该是一个显示Bug;组变量指的是分层变量。 系数表输出了最重要的结果。结果显示在校正其他因素的作用后,加入干细胞移植有助于降低多发性骨髓瘤患者的癌症死亡率。不过表下方的“Failure code:0”有误,本例失效事件编码应该为2。 stage不满足风险比例假定,将stage作为分层变量。【3】时依协变量 时变协变量和时间变量可以构建时依协变量,从而进行时依系数法建模或者分段模型。但此处的用户界面没有处理好,常用的取对数、不做变换等处理并没有出现,更重要的是有些选项对时变协变量的处理并不合适结果也不正确。 ①在该GUI中,变量在选入时变协变量框后,就不能再出现在固定协变量框中了,显然这是一个不恰当的处理。即使时变协变量与时间变量一起构建了时依协变量,时变协变量也应该可以出现在固定协变量中。不过这个问题并不难处理,只需要把时变协变量完全复制一下形成一个新变量就可以解决;②时间变量函数中的None也是按照Quadratic来处理的,这显然也是一个错误。而且笔者检验了一下,发现对话框中Quadratic的只有二次项处理,并没有一次项,按照正常的分析,一个有二次项的模型会同时有一次项,就像一个完整的二次项方程是y=x2+x+a一样,而不是y=x2+a;③Time threshold:可以构建分段函数,不过需要按照第①步的办法复制一个新变量。如果时变协变量是连续变量和二分类变量,笔者检验了一下是没问题的;但对多分类的处理方式却很奇怪,是将K个水平的多分类变量分成K-1个哑变量,每个哑变量独立的按照一个变量来处理,这样会导致一个K分类变量会有K-1个时依协变量。我们假设gender不满足PH假定,分界点以1000天为分界点建立分段函数及结果如下(首先复制变量gender,新变量名称为sex。两者数据完全一样,只是变量名称不同):总体而言,这个GUI可以用于的竞争风险模型的分析,也可用于不满足PH假定时的竞争风险分层模型、分段模型,但分段模型仅限于时变协变量是二分类变量和连续变量。不建议用于时依系数法和时变协变量是多分类变量的分段竞争风险模型。如果可能还是直接使用R进行操作更好,命令其实并不难,可参见《生存分析之不满足风险比例假定的竞争风险模型:STATA还是R,总有一款适合你》。当然笔者也希望GUI的创建者尽快修正这些Bug,以方便更多的用户。
|