分享

OmicShare Forum 专业的生物信息学论坛

 新用户29976297 2019-12-09

http://www./class/Home/Index/singlev?id=2

问1:转录因子指的是蛋白质?
答:是的。



问2:这种图用什么软件可以画出来?

答:MEME、weblogo都可以。
如果想要得到更好看的图片,可以试试LATEX



问3:转录因子怎么预测靶基因?
答:转录因子结合到什么区域具有保守性的,如果已经知道转录因子结合的序列是什么特点,可以在基因上游2K区域找这段序列,如果可以找到,那么这段序列就是潜在的能够被该转录因子结合。



问4:转录因子怎么找启动子序列?
答:首先,启动子序列没有很严格的定义,通常认为定义基因上游2K左右为潜在的启动子区,而到底转录因子结合到什么区域,要具体做靶基因预测。



问5:怎么知道是序列是转录因子?
答:使用序列在转录因子数据库进行blast 比对。



问6:请问JASPAR能分析细菌的转录因子么?
答:JASPAR数据库是由开发的转录因子结合位点(TFBS)数据库 链接:http://jaspar.binf./
对于JASPAR数据库,包括脊椎动物,线虫纲,昆虫,植物,真菌,TF结构分类。



问7:JASPAR结果 strand 有正有负怎么取舍?
答:为什么要取舍呢,转录的时候,其实两条链都可以转录的。


问8:请问用什么方法可以在寻找已知蛋白的结合蛋白时,假阳性最小?是blast比对吗?
答:是的。蛋白与蛋白的相互作用应该是PPI的相互作用。



问9:PPI的结果是预测的吗?可信度多高?
答:是预测的,可信度问题无法很好定义,所以后续要做酵母双杂交或免疫共沉淀实验验证;预测是无法解决问题的,只是给我们提供一些筛选结果,缩小验证范围。



问10:转录因子找到的靶基因的启动子结合位点,是不是我们研究基因的启动子?
答:不一定,预测的结果还是需要验证实验来证实。而且一个转录因子可能有多个靶基因启动子结合位点。



问11:如果一个基因序列没有2000bp,会有启动子区吗?
答:这里可能混淆了两个概念,通常说的启动子序列2K不算在基因序列里面。而基因序列通常是从转录起始位点开始算的;启动子序列是从转录起始位点上游开始算的,但同时这也是一种经验性、保守的说法,也有可能一些转录因子的启动子序列不是2K,或者是更远的基因上游部分,2K通常囊括了大部分的启动子序列。



问12:在RNA-seq的差异表达的list里面有几个TF,有没有比较好的方式把TF的target形成的网络搞出来?
答: RNA-seq结果可以2个有用信息。
第一,如果TF在jasper数据库已经有人报道了有这个model,那么就可以利用靶基因预测的方法去找TF的target基因。


第二,如果你的RNA-seq样本比较多,比如10个、8个,那么TF的target基因可能是很多的, 这时需要过滤一下。可以计算潜在target与TF表达的相关系数,如果存在潜在的正相关,就可以判定可能是被调控的。这样过滤完,一个TF剩下的target可能就几十个。接下来,把结果导入到cytoscape里面进行可视化,那么调控网络就可以做出来了。



问13:请问一下在细菌里,已知一段启动子序列,怎么寻找可以与之结合的潜在转录因子呢?
答:在JASPAR数据库里面,将报道过的该启动子序列把他拿出来,包含的motif,全部预测一遍,就可以找到转录因子。



问14:组蛋白修饰的启动子区域有没有特定的序列?
答:没有特定的序列。因为组蛋白修饰染色体的某个状态,他是没有特定的规律的,比如H3K4三甲基化,他有时是可以转化成一甲基化的,或者不甲基化,或者乙酰化。这是说规律是可以调整的,所以组蛋白修饰更多是一个表观调控的一部分,他并没有非要什么样的序列来说被修饰的。



问15:为什么启动子区一定要三甲基化呢?

答:这是因为三甲基化染色质的结构是不一样的,但因为染色体结构不一样,意味着空间结构不一样;打个比方,一个转录复合物结合到的区域就相当于一个停车位一样的,所以组蛋白修饰状态不一样,它的复合物结合不上去。所以如果是一甲基化的,复合物结合不上去,自然就不可能是一个转录因子结合位点。
所以三甲基化这个信息是比较准确判断这个是否是个转录因子结合位点的非常可靠的一个参考信息。


备注:第10页更新了相对打分的解释,纠正了之前公式的错误。


问16:增强子结合区域是1甲基化,但是增强子也属于TF,那么3甲基化也不是肯定的么?

答:增强子未必是转录因子结合区域,比如enhancer RNA,结合的蛋白类型更转录因子结合的区域还是有区别的,两者是不一样的。


问17:正义链和反义链是什么意思?启动子区域在不同链怎么找?

答:比如人类基因组里面,正义链已经被人为定义好了,某一条链是正链,某一条即为反链。那具体到基因的话,我们知道RNA的转录是单链转录的,转录有可能转录正义链也有可能转录反义链,所以启动子肯定是跟你的转录链在同一条链的。所以启动子不可能在反义链上,这里的得反义链是DNA的反义链,但你的转录本就在反义链上所以启动子区域通常跟你的转录连在同一条链上。


问18:正向转录和反向转录找启动子区域有什么不同呢?
答:没有什么不同。


问19:染色体的正负链,跟 DNA模板的正负链不一样吗?
答:正向的话,位于我们染色体位置信息中数字比较小减去2K;反向的话,在染色体位置信息中数字比较大的加上2K。
问:可以举个例子吗?
答:转录因子是结合启动子区域,起始转录;而小RNA一般是靶向拮抗转录本的表达。


问20:预测某个基因的启动子序列,应该使用正义链的序列(与mRNA一致)吧?
答:是的。


问21:转录因子为什么允许错配呢?
答:转录因子结合规律类似于microRNA跟靶基因的结合。就是说这些结合本身有一种互补配对能量的问题,就是吉布斯自由能。如果一个转录因子蛋白的某些序列,因为蛋白序列有某些特性,就是说跟正靶向结合时候,他的结合能力是下降的。在任何一个转录因子,他可能一两个模型,可能允许错配2个地方, 有可能错配3个地方,这些模型允许错配,我们就来统计这些基因存在哪些错位位点,所以,我们就可以把转录因子的结合模型总结出来。
你再给一条序列,那么可以根据这个完美模型来判定这个错配会导致能量下降多少,如果能量为100%的话,我们认为能量讲到80%的时候就能结合了,但这80%也是人为定的标准,比如你觉得80%太严了,你可以降到70%也许是OK的。但这也是一种经验性的标准。


问22:promo网站输入启动子序列,就会显示能够结合的位点以及相应的转录因子,跟JASPAR网站方法什么区别?
答:建议看下promo网站的方法学文章,无论是什么数据库,大部分转录因子预测的都是用这种方法的。可能方法有优化但不会相差太多。


问23:我用人的序列去比对另一物种的基因组,然后用genewise去预测ORF,得到的预测结果中发现同一条人的query序列对应上了另一物种多个scaffold,但是score值不同,这些score值怎么处理?
答:比对劫到多个地方这种情况是正常的,比如如果基因存在基因家族,然后一个基因也不一定在基因组上就一个拷贝,所以就能比对到多个scaffold,所以导致score不同。


问24:转录因子和小RNA的作用方式有什么区别?他们都是起到调控作用?
答:转录因子是一个转录前调控,决定了这个基因能否被转录;小RNA是一种转录后调控,他的转录已经翻译出来的,但是来阻止他翻译成蛋白,比如可以利用小RNA来结合,或使RNA降解。所以转录因子是一个转录前调控,小RNA是一种转录后调控是否翻译成蛋白,这是两者的根本区别。


问25:TFBS模型构建有什么意义?
答:目前TFBS大部分实验来源于ChIP 及传统的凝胶迁移实验等,凝胶迁移实验以前传统做法是获得一个转录因子,就在体外将转录因子与DNA打碎结合,结合后跑电泳看看哪些DNA是跟转录因子蛋白一起迁移的,然后把一起迁移的DNA拿出来去测序,当然可能会测个百八十条,这些序列都是不一样的,但是这些序列虽然不一样,但肯定都有转录因子的结合位点。所以就需要把这些结合规律找出来。比如可以统计每个区域剪辑的频率,建立转录因子这样一个模型。

模型构建有什么好处呢?如果后面再获得一个基因,想看它到底能不能跟转录因子结合,你就可以在基因的上游去找到有没有符合这个模型的序列,如果有这样序列,那么就可以判断可以与转录因子结合。

引申一点,我们测出来的区域二三百长,但实际上结合区域只有4-10个bp,一般通过序列分析软件比如MEME,找出最保守的区域。找出来以后再通过统计,把最保守的区域可视化,画成序列logo等这样的图片。


问26:TF的结合能力的不同,也可视为一种表达调控吗?
答:结合能力只是结合的一部分,还要涉及到很多因素,如转录因子的表达量。表达量越高,调控的强度越大,还有转录因子的调控受到很多伴侣分子、其他跟它共调控的转录因子的作用。所以,转录调控不是单一由结合能力来决定的,还有其他一些干扰。TF本身也不是单独发挥作用的,还有分子伴侣等的协助过程,这就是属于一种共调控的过程。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多