分享

什么情况下我们可以修改基因名字

 健明 2023-05-13 发布于广东

《生信菜鸟团》的其中一个专栏作者专注于解析各个文献里面的figure1,尤其是那些使用了tcga等公共数据资源的, 很容易重新下载数据并且自己走一遍差异分析或者生存分析来验证。

但是最近刷到了2022的文章:《Long noncoding RNA TLNC1 promotes  the growth and metastasis of liver cancer  via inhibition of p53 signaling》,蛮有意思的,它落脚点是 lncRNA的基因,名字是TLNC1,在肝癌里面从数据角度来看是一个“典型”的致癌基因,因为在癌症里面高表达量,而且表达量越高的病人预后越差。

但是菜鸟团小伙伴在复现的时候发现压根就没有这个 TLNC1,谷歌检索不到。。。。

这就让我们非常开心,大家都懂的。。。

但是,在开始干它之前,我还是怕影响口碑,就亲自看了看这个文章并且搜索了一下, 发现其实这个基因TLNC1是作者自己改名了,而且文章里面也写清楚了:

In this study, we identified an oncogenic lncRNA, termed as TLNC1 (tumorigenic long noncoding RNA on chromosome 1p13), that was highly expressed in liver cancer tissues. TLNC1 was previously known as linc01134, which has been demonstrated to promote the progression and metastasis, as well as confer oxaliplatin resistance in hepatocellular carcinoma (HCC) by several recent studies

所以现在官方名字仍然是:https://www./cgi-bin/carddisp.pl?gene=LINC01134

Aliases for LINC01134 Gene
GeneCards Symbol: LINC01134 
Long Intergenic Non-Protein Coding RNA 1134 (HGNC, NCBI Entrez Gene, Ensembl)
TLNC1 (HGNC, NCBI Entrez Gene, Ensembl)
Tumorigenic Long Noncoding RNA On Chromosome 1p13 (HGNC, NCBI Entrez Gene)
NONHSAG000199.2 (NONCODE)
HSALNG0000361 (LncBook)
LINC01134 (LNCipedia)

这乌龙啊,差一点就准备炮轰它了,但是让我好奇怪,什么情况小我们可以修改基因名字呢?因为它是lncRNA所以理论上属于一小撮人的狂欢,主流科学家是不会看它的。在小众领域确实是可以自己修改基因名字吗?

名字有多么重要呢?比如我chatGPT查 了一下:B7-H1(B7 homolog 1)是PD-L1的另一个名称。在早期的研究中,PD-L1被命名为B7-H1,以突显其与其他B7家族成员(如CD80和CD86)的相关性。随着研究的深入,人们逐渐认识到B7-H1和PD-L1是同一蛋白,因此这两个名称可以互换使用。B7-H1或PD-L1作为PD1的配体蛋白,通过与PD1结合,调节T细胞活化和免疫应答,对免疫耐受性和免疫自我调节起着重要作用。尽管B7-H1这个名称在早期的研究中使用较多,但目前更常见的称呼是PD-L1(Programmed death-ligand 1),以与其他免疫检查点蛋白(如PD-L2)区分开来,并与PD1的命名一致。

B7-H1是大名鼎鼎的陈列平给的名字,1999年陈列平教授发现了B7-H1分子的存在(也就是日后大名鼎鼎的PD-L1)。

但是PD1(Programmed cell death protein 1)是一个重要的免疫检查点蛋白,也被称为CD279。它在调节免疫系统中的免疫耐受性和自身免疫反应中起着关键作用。PD-L1(Programmed death-ligand 1)是PD1的配体蛋白,也被称为CD274。它在免疫调节中起着重要的作用。

这些名字是否让你晕头转向呢?

学徒作业

既然知道了上面提到的文章里面的TLNC1就是linc01134,我们就去TCGA的肝癌数据集里面看看它是否有表达量差异和生存意义吧。

gene='LINC01134'
proj='TCGA-LIHC'
plot_gene_in_cancer(exp,gene)
sur_by_gene(exp,proj,gene)

自己写两个函数,一个绘制箱线图,一个画生存分析图。(任意基因在任意癌症都应该是一秒钟出图)

在癌症里面高表达量

而且表达量越高的病人预后越差,如下所示:

表达量越高的病人预后越差

另外,前面提到的从数据角度来看是一个“典型”的致癌基因,实际上我们在:癌基因一定在肿瘤部位高表达吗 我们针对每个癌症都在各种内部做了肿瘤组织和正常对照的差异表达量分析,然后在癌基因都是肿瘤的风险因子吗 我们针对每个癌症的全部基因批量了做了单基因的cox分析。有很多基因并不一定是符合我们的传统认知。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多