分享

🧐 Excel | 基因名都被Excel篡改了怎么办呢!?~(附3种解决方案)

 微笑如酒 2023-07-23 发布于广东
1写在前面
今天和大家分享一下在做表达矩阵处理时尝尝会遇到的一个问题,但又经常被忽视,就是Excel会修改你的基因名。😷
无数大佬在这里都踩过坑,这些普遍的问题已经被写成了paper左右滑动):👇

问题还是比较严重的,说不定你的目的基因就是这些被改掉名字的基因哦。🤒
我们讲讲怎么处理这些问题吧。🥳
2示例数据
这里我准备了一个excel表格,为被篡改过后的名,大家可以看到都变成了日期。😷
3方法一
这里我们用到一个之前发表过的工具,Escape Excelgithub的地址在这里:👇
https://github.com/pstew/escape_excel

Win的用户可以下载安装插件,Mac的用户可以下载App安装。😗
这里我只介绍一下Mac了哦,这里直接把文件拖进去就可以了,非常简单!~🥳
4方法二
再提供一个在线网站,上传后等待转换即可,也是很方便的,地址在这里:👇
https://reamlit.app/

经过简单的操作后,就可以得到正确的Gene name了,自己下载吧!~🥰
5方法三
最后介绍的是使用R包的方式来解决这个问题,HGNChelper😜
5.1 用到的包

Plain Text
复制
rm(list = ls()) library(tidyverse) library(HGNChelper)

5.2 读入基因列表
因为这个包只支持人类小鼠的基因转换,这里我们就只建立两个genes列表了哦。😋

Plain Text
复制
human <- c('FN1', 'TP53', 'UNKNOWNGENE','7-Sep', '9/7', '1-Mar', 'Oct4', '4-Oct', 'OCT4-PG4', 'C19ORF71', 'C19orf71') human


Plain Text
复制
mouse <- c('1-Feb', 'Pzp', 'A2m') mouse

5.3 转换错误的基因名
1️⃣ 人类基因

Plain Text
复制
checkGeneSymbols(human)

2️⃣ 小鼠基因

Plain Text
复制
checkGeneSymbols(mouse, species='mouse')
6如何引用
1️⃣ Welsh EA, Stewart PA, Kuenzi BM, Eschrich JA. Escape Excel: A tool for preventing gene symbol and accession conversion errors. PLoS One. 2017;12(9):e0185207. Published 2017 Sep 27. doi:10.1371/journal.pone.0185207
2️⃣ Koh CWT, Ooi JSG, Joly GLC, Chan KR. Gene Updater: a web tool that autocorrects and updates for Excel misidentified gene names. Sci Rep. 2022;12(1):12743. Published 2022 Jul 26. doi:10.1038/s41598-022-17104-3
3️⃣ Oh S, Abdelnabi J, Al-Dulaimi R et al. HGNChelper: identification and correction of invalid gene symbols for human and mouse [version 1; peer review: 2 approved, 1 approved with reservations]. F1000Research 2020, 9:1493 (https:///10.12688/f1000research.28033.1)

最后祝大家早日不卷!~


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多