基因表达调控系列问题汇总(持续更新) - 知乎

测试4321233 2020-11-23

展开全文

前言

整理这个专题的缘由，是在朋友圈看到的求助信息。于是我想把我之前了解或者是做过的一些东西整理一下。

Q1: 哪个TF（转录因子）调控了我的基因集？

假设你有一个genelist:

Gene1
Gene2
Gene3
Gene4
...

这个genelist可以有很多来源，可以是RNASeq的差异基因，也可以是其他的，等等。你很好奇这个genelist是被哪些TF调控的，有三个方法。

A1: cistrome-LISA
原文答案参考来源：https://mp.weixin.qq.com/s/DI8fxtKSuZ_LemxhFznSDg
LISA网址：http://lisa./

听说LISA的时候，我还没毕业，以旁听生身份参加了一次亚洲冷泉港会议，一位来自同济的Ph.D. Student做poster展示。如今发表在GB上，以cistrome db为基础，进行的预测，可以说可信度较高。
这个方法原文答案已经很详细了，我就不当搬运工了。

A2: TF富集分析
LISA没出之前，用Y叔的clusterprofiler的enricher做的，TF的数据是从TRRUST（https://www./trrust/）下载的。懂点生信的人可以用这个方法。网上也有类似的教程。clusterprofiler的enricher应用广泛，可以但不局限于GO/KEGG（有专门的function），以及上面提到的TF。只要你有用于富集分析的背景数据。不懂编程请看A3。

A3: TRRUST的2.Find key regulators for query genes
TRRUST（https://www./trrust/）

以上，仅作参考。

Q2: 我想看我的TF调控了哪些gene?

A：查看转录因子数据库
这个举一个列子，Q1提到的TRRUST数据库，只支持human和mouse。Search界面输入TF name即可，Download提供所有TF的下载链接。

Q3: 有没有生物分子互作数据库？

A：接触过一个，BioGRID(The Biological General Repository for Interaction Datasets)
BioGRID网址：https:///
记录蛋白与基因的互作信息。可以通过By Identifier 和 By Publication。

Q4: 我有一个genelist，想知道它们的功能以及其他一些注释信息

A1: metascape
网址：http:///

Express Analysis 和 Custom Analysis区别在于你的gene有没有表达谱数据，有的话可以做Express Analysis。没有就 Custom Analysis，选一下物种。然后跳转到如下界面：

选择Annotation后：

勾选想要的信息，点一下Apply

然后点击Analysis Report Page:

根据需要下载Excel表格或是ppt，或是zip压缩文件。

A2: DAVID
没能打开，先空着吧。不是很推荐这个。
成功打开了。网址：https://david./

我不得不吐槽这网址的风格真的是丑瞎眼睛啊。
看最左边的框框，可以看到网站支持的四个功能，Functional Annotation, Gene Functional Classification, Gene ID Conversion, Gene Name Batch Viewer。
总体来说，体验太差。

GO分析使用教程：
Step1: 进入Functional Annotation界面
Step2：在Upload处粘贴genelist，选择GeneID的类型，常见的有ENSEMBL_GENE_ID和ENTREZ_GENE_ID，再选择是Gene List, 然后Submit。