1写在前面 今天和大家分享一下在做表达矩阵处理时尝尝会遇到的一个问题,但又经常被忽视,就是 Excel 会修改你的基因名。😷无数大佬在这里都踩过坑,这些普遍的问题已经被写成了 paper (左右滑动 ):👇![]() ![]() ![]() 问题还是比较严重的,说不定你的目的基因就是这些被改掉名字的基因哦。🤒 我们讲讲怎么处理这些问题吧。🥳 2示例数据 这里我准备了一个 excel 表格,为被篡改过后的名,大家可以看到都变成了日期。😷![]() 3方法一 这里我们用到一个之前发表过的工具, Escape Excel ,github 的地址在这里:👇https://github.com/pstew/escape_excel ![]() Win 的用户可以下载安装插件,Mac 的用户可以下载App 安装。😗这里我只介绍一下 Mac 了哦,这里直接把文件拖进去就可以了,非常简单!~🥳![]() 4方法二 再提供一个在线网站,上传后等待转换即可,也是很方便的,地址在这里:👇 https://reamlit.app/ ![]() 经过简单的操作后,就可以得到正确的 Gene name 了,自己下载吧!~🥰![]() 5方法三 最后介绍的是使用 R包 的方式来解决这个问题,HGNChelper 。😜5.1 用到的包 Plain Text 复制 rm(list = ls())
library(tidyverse)
library(HGNChelper) 5.2 读入基因列表 因为这个包只支持 人类 和小鼠 的基因转换,这里我们就只建立两个genes 列表了哦。😋Plain Text 复制
![]() Plain Text 复制 mouse <- c('1-Feb', 'Pzp', 'A2m')
mouse ![]() 5.3 转换错误的基因名 1️⃣ 人类基因 Plain Text 复制
![]() 2️⃣ 小鼠基因 Plain Text 复制 checkGeneSymbols(mouse, species='mouse') ![]() 6如何引用 1️⃣ Welsh EA, Stewart PA, Kuenzi BM, Eschrich JA. Escape Excel: A tool for preventing gene symbol and accession conversion errors. PLoS One. 2017;12(9):e0185207. Published 2017 Sep 27. doi:10.1371/journal.pone.0185207 2️⃣ Koh CWT, Ooi JSG, Joly GLC, Chan KR. Gene Updater: a web tool that autocorrects and updates for Excel misidentified gene names. Sci Rep. 2022;12(1):12743. Published 2022 Jul 26. doi:10.1038/s41598-022-17104-3 3️⃣ Oh S, Abdelnabi J, Al-Dulaimi R et al. HGNChelper: identification and correction of invalid gene symbols for human and mouse [version 1; peer review: 2 approved, 1 approved with reservations]. F1000Research 2020, 9:1493 (https:///10.12688/f1000research.28033.1) ![]() 最后祝大家早日不卷!~ |
|