一、软件下载安装 1.从https://github.com/rreybeyb/DeepM6ASeq网址下载DeepM6ASeq安装包,之后解压安装包。
下面简要描述data,demo_test和result文件夹内容:
– test.fa: 这个文件用于测试脚本 – expected results: – predout.tsv: 预测结果文件 – sal.out: 显著图结果文件 – sal_heatmap: 可视化显著图
– trained_models: 存储人,鼠和斑马鱼训练完成的模型。 – tomtom: TOMTOM将训练得到的motif与已知motif比对的结果。 – RSAT: 存储训练得到的motif簇。 2. 安装DeepM6ASeq的依赖包。首先确定自己的python是python 3.x版本的。接下来安装numpy, pytorch以及 scikit_learn。笔者推荐利用miniconda创建虚拟环境安装这些依赖包,下面是笔者安装时利用的命令。 conda create -n py3.7 python=3.7 -y conda activate py3.7 conda install numpy conda install pytorch pip install scikit_learn pip install Bio conda install r-ggplot2 -y conda install r-data.table -y
二、软件使用 1.第一个功能是训练模型。 命令: python main_train.py -m model_type -pos_fa pos_fa -neg_fa neg_fa -od out_dir
参数:
2. 第二个功能:预测序列是否含有m6A位点。 命令: python main_test.py -m model_type -infa input_fa -md model_dir -outfn out_fn
参数介绍:
3. 第三个功能:画m6A序列显著图 命令: python saliency_map.py -m model_type -infa input_fa -md model_dir -outfn out_fn Rscript saliency_heatmap.R saliency_map_out pdf_name
参数介绍:
注意:saliency_map.py脚本用来得到给定序列的显著图,结果的可视化是利用saliency_heatmap.R脚本实现。
4. 结果评估 针对预测结果评估,作者分别给出了哺乳动物,人,鼠和斑马鱼的阈值,分为中等,高,很高这三个等级,分别对应模型特异性为90%,95%,99%。
|
|