搜索

分享

QQ空间 QQ好友新浪微博微信

实操：通过SEER数据库发一篇SCI系列（七）

大壮歌 2019-09-08

展开全文

本周发现比特币突破9万啦，这就是一个很小的圈子，不过“区块链”、“比特币”字眼逐渐开始进入人们的视野，人们也许会好奇这是什么东西，也许从来都是不屑一顾，真的很少有人去真正了解并实践。

通过过去9个月的每周定投，我也是拥有一枚比特币的人了，如果我能一直持有20年，将会是怎样一个画面？

有时感觉人生好艰苦，尤其是在自己年轻的时候，总是向往着财富自由、心灵自由。但如果站在20年后回看现在的自己，会不会感激现在的自己虽然日子过得很苦逼，但至少还是个有信仰、有追求的人。

年轻时至少为一件事付出过深情，这才是最有意义的。

不说了不说了，还是老老实实写我的SEER文章吧，虽然很苦，但是也要假装很幸福嘛。

本周学习收获是进一步熟悉了R语言，以及一些简单的操作。还有就是利用R来进行PSM（propensity score matching）倾向评分匹配。

在回顾性研究中，常常出现实验组与对照组基线不齐，容易产生选择偏移，导致数据分析结果可靠性不佳。而倾向评分匹配，它能剔除掉两个组基线差异较大的病例，剩下的进行1:1匹配，从而将两组基线数据匹配整齐。

本人硕士毕业论文也就是套用这个方法，当时用的是SPSS来操作的，但是SPSS本身并不自带PSM功能，必须自己安装相应的软件（R软件、SPSS R插件、PS matching插件），网评难度系数5颗星！渣渣我光是这个安装过程就花了三个多月时间。

R语言的出现，就没有那么麻烦了，只需两个安装包及几个程序命令就可以搞定，不得不说，想要更快更高效，还是得花更多时间去学习高大上的东西。

关于R及R studio的下载在系列二中已介绍过，这里不再实操。接下来重点操作的是关于PSM的R studio实操。

实操：利用R studio来做PSM

1.打开R studio软件，导入处理后的EXCEL数据表。

2.安装PSM程序包：install-输入“matchit”-install-再在matchit框框☑️，表示程序包已安装好。

3.附上我的数据库

命令：attach（肺癌数据处理xlsx）

4.赋值分组变量，例如研究肿瘤远处转移与非远处转移中，两组病例的基线比较，此时需要赋值Mstage变量（注：这个变量只能用0或1表示,否则程序会报错），并执行matchit的语句，进行PSM计算。

命令：Mstage=as.factor(Mstage)

m.out=matchit(Mstage~Tstage+Nstage+gender,data =肺癌数据处理xlsx,method='nearest',ratio=1)

5.将结果输出到新的data，我们可以看到数据处理前是20791例，匹配之后还剩下13154例。

命令：m.data1<-match.data(m.out)

6.输出结果到EXCEL表格，将EXCEL后缀改为“csv”数据才能完整看到，最后可以进一步行数据统计学分析。

命令：write.table(m.data1,'lungcancer1.csv',sep=',')

搞定这六步，利用R语言就可以完成PSM就成功啦，听起来就很牛逼。但我还是有点疑惑，就是关于卡钳的取值，R语言似乎没有，这似乎不太合理，我有时间问问牛人。

自己写了这么多，基本的套路我大概都掌握了，是不是应该尝试考虑下我的第一篇SCI题目方向了？

清晨毒鸡汤来一碗：你唯一的对手，就是昨天的自己。

早安，各位！

END

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：大壮歌 > 《SEER》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

大壮歌

关注对话

TA的最新馆藏

淋巴瘤国际预后评分(IPI)
[转] 张力教授：中国非小细胞肺癌原创临床研究|2023 CSCO指南会
[转] 中国考古博物馆-三层宅兹中国（多图杀猫）
[转] Plus深读 | IDH突变在肿瘤中的生物学作用和治疗潜力
[转] 如何看懂基因检测报告之肿瘤突变负荷（TMB）？
胸腺瘤或胸腺癌根治性放疗及靶区勾画

喜欢该文的人也喜欢更多

热门阅读换一换