本周发现比特币突破9万啦,这就是一个很小的圈子,不过“区块链”、“比特币”字眼逐渐开始进入人们的视野,人们也许会好奇这是什么东西,也许从来都是不屑一顾,真的很少有人去真正了解并实践。 通过过去9个月的每周定投,我也是拥有一枚比特币的人了,如果我能一直持有20年,将会是怎样一个画面? 有时感觉人生好艰苦,尤其是在自己年轻的时候,总是向往着财富自由、心灵自由。但如果站在20年后回看现在的自己,会不会感激现在的自己虽然日子过得很苦逼,但至少还是个有信仰、有追求的人。 年轻时至少为一件事付出过深情,这才是最有意义的。 不说了不说了,还是老老实实写我的SEER文章吧,虽然很苦,但是也要假装很幸福嘛。 本周学习收获是进一步熟悉了R语言,以及一些简单的操作。还有就是利用R来进行PSM(propensity score matching)倾向评分匹配。 在回顾性研究中,常常出现实验组与对照组基线不齐,容易产生选择偏移,导致数据分析结果可靠性不佳。而倾向评分匹配,它能剔除掉两个组基线差异较大的病例,剩下的进行1:1匹配,从而将两组基线数据匹配整齐。 本人硕士毕业论文也就是套用这个方法,当时用的是SPSS来操作的,但是SPSS本身并不自带PSM功能,必须自己安装相应的软件(R软件、SPSS R插件、PS matching插件),网评难度系数5颗星!渣渣我光是这个安装过程就花了三个多月时间。 R语言的出现,就没有那么麻烦了,只需两个安装包及几个程序命令就可以搞定,不得不说,想要更快更高效,还是得花更多时间去学习高大上的东西。 关于R及R studio的下载在系列二中已介绍过,这里不再实操。接下来重点操作的是关于PSM的R studio实操。 实操:利用R studio来做PSM 1.打开R studio软件,导入处理后的EXCEL数据表。 2.安装PSM程序包:install-输入“matchit”-install-再在matchit框框☑️,表示程序包已安装好。 3.附上我的数据库 命令:attach(肺癌数据处理xlsx) 4.赋值分组变量,例如研究肿瘤远处转移与非远处转移中,两组病例的基线比较,此时需要赋值Mstage变量(注:这个变量只能用0或1表示,否则程序会报错),并执行matchit的语句,进行PSM计算。 命令:Mstage=as.factor(Mstage) m.out=matchit(Mstage~Tstage+Nstage+gender,data =肺癌数据处理xlsx,method='nearest',ratio=1) 5.将结果输出到新的data,我们可以看到数据处理前是20791例,匹配之后还剩下13154例。 命令:m.data1<-match.data(m.out) 6.输出结果到EXCEL表格,将EXCEL后缀改为“csv”数据才能完整看到,最后可以进一步行数据统计学分析。 命令:write.table(m.data1,'lungcancer1.csv',sep=',') 搞定这六步,利用R语言就可以完成PSM就成功啦,听起来就很牛逼。但我还是有点疑惑,就是关于卡钳的取值,R语言似乎没有,这似乎不太合理,我有时间问问牛人。 自己写了这么多,基本的套路我大概都掌握了,是不是应该尝试考虑下我的第一篇SCI题目方向了? 清晨毒鸡汤来一碗:你唯一的对手,就是昨天的自己。 早安,各位! END |
|