分享

使用python得到TCGA表格

 萌小芊 2018-02-21



我们首先先点击表格右上角的JSON下载为JSON格式(假设保存的为data.json格式),打开可以发现其数据与表格上的数据是有差别的,我们用如下代码进行处理:


1234567891011121314151617181920212223
#-*-coding:utf-8-*-# author:kangsgoimport jsonmodel={}#解码jsonwith open('data.json','r',encoding='utf-8') as json_file:model=json.load(json_file)#写入到data.csv文件中f=open('data.csv','w')count=0for i in model:a=[]for j in i['consequence']:a.append(j['transcript']['aa_change'])a=list(set(a))f.write(i['genomic_dna_change']+';'+i['ssm_id']+';'+i['mutation_subtype']+';' +str(len(a))+'/567'+';'+str(len(i['consequence']))+'/10188')f.write('n')count += 1f.close()


将会得到data.csv的csv文件,可以用excel等工具进一步处理分析。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多