挖掘机技术哪家强?不做实验写文章……啊就好棒棒! 好吧好吧,不做广告了,不是为了让你们真的都去灌那些不用做实验的文章哈。其实挖掘出了数据,也可以作为一个课题的开始,只要经过后期的验证,也是不错的哦,起码能省一些前期的经费。 好了,上次用GEO简单挖掘了一些芯片,但是关键的问题并没有讲。什么关键问题呢?呃,就是如何筛选芯片。 这个确实让人头大的,比如我要选肿瘤的芯片,我只会这样: 嗯,结果有五十七万个……我要怎么选芯片啊!其实也不难,点击这个Advanced,开始高级搜索: 点击后就能进入到高级搜索界面,进入之后,就可以按照关键词属性来进行搜索了: 我们要筛选芯片需要的准则是: 1)搜索相关疾病(这基本是废话) 2)有样本类型(尽量都是同一水平的,比如RNA或者蛋白芯片) 3)有样本属性(尽量都是相同的属性的,比如都是组织样本,或者都是细胞系样本) 4)芯片类型(当然都应该都是RNA芯片,或者都是lncRNA芯片,否则没法取交集是吧) 5)最后做关键的,样本量不能太少(你一个芯片就一两个样本,并没有什么卵用吧) 于是,我们的搜索关键词就变成了: 但是!样本量怎么办!要怎么样选样本量啊!其实在Advanced搜索里,是有样本数量的: 可是这里面不能用“<”“>”“=”这样的运算符来筛选的,所以要么全选,要么就要换另一种方式。 这就需要用到GEO的Filter了,没错,不光是PubMed有FilTer,其实GEO也有它的Filter,点击Manage Filter: 点击“Create custom Filter”,把我给你们的筛选数值bia进去,嗯,这是100-1024个样本的滤器,所以就命名1024哈: 保存后,记得激活打钩哈!别再跟我说为啥不能用了。 然后,我们的芯片搜索,就变成了: 可以直接看到,含有样本量从100个到1024个的芯片有31个了,接着就在这里面找你要的东西吧。 李莫愁博士:是不是觉得很神奇?要不自己试试看吧,哦,对了,还没给你们这个筛选的滤器是吧?回复“GEO的样本筛选”就给你吧,把里面的文本复制粘贴进去就好了。今天就先策到这里吧。 |
|
来自: MitchellHe > 《待分类》