家好,我是飞哥。 数据分析界育种知识最好、育种界编程最扎实、段子讲得最好的数据分析师,所以:编程+数据分析+育种,就是我的日常工作了。 电脑是研究生时学习的编程,之前没有接触过,计算机登记证书是一个没有,生物统计当年差点没及格,高数和线代还可以但是基本忘完了。就这样,经过金山打字半个月的训练,学会了盲打,研究生三年还是入门了生物信息的大门。 看一下我研究生的日常:(玉米地授粉往事序),数据分析+大田育种,实验是不可能做的,去实验室就是帮助大家装枪头。 上面这张照片是2015年元旦,海南玉米育种基地刚浇过水,那时上午已经有花粉散粉,二话不说,赤脚下地授粉。中间小李师傅帮我照相,因为我要发朋友圈纪念一下,还赋诗如下:“15有啥了不起,空间更新多如蚁,看我玉米地授粉,风和日丽元旦里”。那时的我,还未毕业,对未来充满憧憬,活力四射。 工作几年,边工作边学习,哪里不会学哪里,也积累了一些知识,接触的物种中有:玉米小麦水稻、猪鸡牛羊、林木水产,用到的模型从方差分析到线性模型,从混线模型到广义模型,从GWAS到GS,基本都是R语言+Python+Linux。 有些小伙伴,问我如何入门数据分析? 我的经验是,学习,从来不拘泥于形式,植物的不看动物的书籍?动物的不看林木的论文?林木的不理水产的成果,对我而言不存在的,因为物种是属于应用层,背后模型是类似的,学此可以懂彼。比如,学习GWAS我发现人类的知识更系统,于是学起来诸如多基因得分、孟德尔随机化也毫无违和感(统计遗传学:第八章,基因型数据质控)。 其实网络上的数据分析师都是从Excel到Python,然后到机器学习。而农业这一块,混合线性模型是绕不过去的槛,所以这里总结一下我的技能。 算不上技能树,只能算是花花草草: 1, 生物统计相关数据分析汇总统计分析
方差分析
回归分析
相关性分析及通径分析
主成分分析及聚类分析
混合线性模型
2, 作物数据分析
3, 动物、水产数据分析
4,群体遗传分析
5,GWAS分析和QTL定位
6,基因组选择分析
|
|