分享

夏枯草的转录组测序与次生代谢产物生物合成相关基因的挖掘

 生物_医药_科研 2019-03-26

 要:目的  获得夏枯草转录组信息,探索夏枯草次生代谢产物生物合成的分子基础。方法  利用Illumina HiSeq 2000高通量测序技术对夏枯草果穗、茎和叶等部位进行转录组测序,经Trinity软件组装后获得Unigene,并进行系统的生物信息学分析。结果  共获得77 863Unigene,平均长度为716.72 nt。通过与NRSwiss-ProtCOG7个公共数据库进行BLAST比对,共有41 367Unigene获得注释,注释率为53.13%。在KEGG数据库中,有1 406Unigene被注释到次生代谢产物合成。通过对转录组数据深入挖掘发现,参与夏枯草三萜类骨架合成的Unigene共有60个,参与酚酸类合成的Unigene共有24个,参与次生代谢后修饰的Unigene共有259个,参与其他次生代谢合成的Unigene共有118个。结论  夏枯草转录组数据为探索夏枯草次生代谢产物的生物合成机制提供了重要的资源,也为利用代谢工程增加夏枯草中重要次生代谢产物含量提供了基础信息。

夏枯草Prunella vulgaris L.为唇形科夏枯草属多年生草本植物,以成熟果穗入药,具有清热明目、消肿散结的功效。夏枯草含有丰富的三萜类、酚酸类、黄酮类等多种次生代谢成分,因其具有抗肿瘤、抗炎、护肝等多种生物活性而广泛地运用于临床[1]。同时,夏枯草也是卫计委公布的药食两用中药,由于其使用的安全性和有效性一直以来都是凉茶类饮料的主要原材料之一。目前对夏枯草的研究主要集中在化学成分[2]、药理活性[3]、质量评价[4]和规范化种植技术[5-6],而对夏枯草活性次生代谢成分分子生物合成相关基因发掘和利用却鲜有报道,仅汝梅[7]、许锋等[8]克隆了夏枯草迷迭香酸生物合成途径中迷迭香酸合成酶、酪氨酸氨基转移酶、苯丙氨酸解氨酶等相关基因。

转录组学是研究基因转录及其调控规律的一门学科,其反映了生物组织基因组信息和外部特征的动态联系,可以在整体水平上高效地发掘特定生理功能、生源途径相关的已知或未知的功能基因,对研究特定生物学过程和植物次生代谢途径具有重要意义[9]。第2代测序技术(NGS)是常用的转录组学研究方法之一,其可以同时对百万级别的条数进行同时测序,又称为高通量测序技术。高通量测序技术在植物次生代谢途径研究、生物体发育等研究领域发挥着重要的作用。随着测序成本的不断下降和测序通量的不断提升,目前许多重要的药用植物,如丹参[10]、人参[11]、地黄[12]、山茱萸[13]等均已经完成了转录组测序分析,积累了一批与药用次生代谢产物合成调控相关的基因。本研究利用Illumina Hiseq 2000对夏枯草果穗、茎和叶进行了转录组测序,以期获得与其有效成分合成相关的基因信息,为进一步挖掘与克隆夏枯草新的功能基因奠定基础。

1  材料与方法

1.1  材料

本研究所用夏枯草采自河南省确山县夏枯草GAP种植基地,并经河南中医药大学董诚明教授鉴定为唇形科植物夏枯草Prunella vulgarisL.。采集新鲜夏枯草叶片、果穗和茎,用水清洗干净后,滤纸吸干水分,置液氮中速冻后,放−80 超低温冰箱保存。

1.2  RNA提取与检测

RNA使用植物RNA提取试剂盒(康为世纪生物科技有限公司,北京)提取,利用Agilent2100核酸蛋白检测仪(AgilentSanta Clara,美国)检测所有样品RNA的纯度和浓度。

1.3  RNA文库构建与质控

文库的构建与测序在北京百迈客生物科技有限公司完成,具体步骤参照朱畇昊等[13]的方法。文库构建完成后,分别使用Qubit2.0Agilent 2100对文库的浓度和插入片段大小进行检测,使用Q-PCR方法对文库的有效浓度进行准确定量,以保证文库质量。样品库检合格后,用HiSeq2500进行高通量测序,测序读长为PE125

1.4  转录组数据组装

为了使各样品中表达丰度较低的转录本组装得更完整,夏枯草3种不同组织测序样品采用合并组装,从而间接增加测序深度,使转录结果更完整,同时也有利于后续的数据分析。对原始数据进行滤过处理,去除接头、不确定碱基、低质量的序列和冗余序列。使用Trinity拼接干净读序得到重叠群(Contigs)。在所有的转录本中,取最长的Contig作为该转录本的转录本(Unigene)。

1.5  功能注释

使用BLAST软件将Unigene序列与NRSwiss-ProtGOCOGKOGKEGG数据库比对,预测完Unigene的氨基酸序列之后使用HMMER软件与Pfam数据库比对,获得Unigene的注释信息。

2  结果与分析

2.1  测序与组装结果统计

经过测序从夏枯草果穗、茎、叶3个样本中共获得19.16Gb clean data,各样本的Q30碱基比均在92.78%及以上。说明测序结果准确度较高,可以用于后续分析。利用Trinity软件对3个夏枯草样品的测序数据进行合并组装。结果显示组装后共得到7 830 894Contigs序列,平均长度为45.17 nt,其中200300 nt序列占总Contigs序列数的99.22%,其分布特征符合Illumina测序的预期结果(表1),可为后续的数据组装提供原始数据。测序数据组装共得到185 478transcript77 863Unigene;其中长度在1 kb以上的Unigene15 443条,这些基因可作为后续实验研究的重要对象;序列长度集中于2002 000 ntUnigene平均长度为716.72 nt。大于2 000 nt 的序列占总Unigene序列的8.09%

2.2  基因功能注释

通过选择BLAST参数E值不大于1×10−5HMMER参数E值不大于1×10−10,最终共有41 367Unigene获得注释,注释率为53.13%。其中有13 081个(16.80%Unigene注释到COG数据库中;21 563个(27.69%Unigene注释到GO数据库中;8 882个(21.47%Unigene注释到KEGG数据库中;21 531个(11.41%Unigene注释到KOG数据库中;24 412个(31.35%Unigene注释到Pfam数据库中;25 797个(33.13%Unigene注释到Swiss-Prot数据库中;41 079个(52.76%Unigene注释到Nr数据库中。由于夏枯草缺乏属基因组、EST和蛋白质序列等信息,仍有36496个(53.13%Unigene不能被已有数据库注释(表2)。

2.3  GO功能分类

在本研究中,共有21 563Unigene27.69%得到了GO注释(图1)。涉及分子功能的Unigene32 806条,其中具有催化活性(catalytic activity)和结合(binding)的Unigene数量最多;与细胞组成相关的Unigene17791条,其中细胞组分7638 720条;与生物学过程相关的Unigene40 702条,其中代谢过程、细胞过程和单生物过程Unigene 数量最多,分别有15 10112 11310465条。

2.4  COGKOG分类

在本研究中,共有13 081UnigeneCOG数据库具有同源性,这些Unigene对应COG数据库的25个功能类别(表3)。其中一般功能预测注释结果最多,有3 426Unigene;其次是复制、重组和修复,有1 586条;细胞运动和核结构中的Unigene数量最少,分别有16条和3条,没有发现胞外结构类基因;有691Unigene被注释到次生代谢产物合成、转运和代谢中。

KOG注释中,共有21 531Unigene获得了注释,得到了25个分类,其中一般功能预测注释结果最多,有4 367Unigene;其次是翻译后修饰、蛋白质转换、伴侣蛋白信号,有2 359Unigene;细胞运动和核结构所占Unigene最少,分别只有9条和81条;其中有1 203Unigene被注释到次生代谢生物合成、转运和分解中。

2.5  KEGG注释

KEGG的注释结果描绘了8 882Unigene所归属的119条代谢通路,有2 969Unigene被注释到代谢途径(metabolic pathways),1 406Unigene被注释到次生代谢产物合成(biosynthesis ofsecondary metabolites),另外咖啡因代谢、油菜素生物合成、硫甙生物合成、其他类型O型聚糖生物合成、甜菜红碱生物合成和亚油酸代谢途径的基因最少,分别有443221条。

2.6  夏枯草次生代谢生物合成途径相关酶的鉴定

2.6.1  三萜类  夏枯草是我国常用的中药材,其富含的三萜类、有机酸类、苯丙素类、黄酮类等多种类型的次生代谢产物可能是其发挥药理作用的物质基础[3]。夏枯草中含有丰富的三萜类化合物,其中熊果酸和齐墩果酸的含量较高。植物中三萜类物质的生物合成的前体是由甲羟戊酸途径(MVA)和甲基赤藓糖醇磷酸化途径(MEP)共同合成的异戊烯二磷酸(IPP)或其异构体3,3-二甲基稀丙基焦磷酸(DMAPP[14]。在夏枯草转录组数据中,共发现38Unigene可能编码MVA途径中乙酰辅酶A酰基转移酶(AACT)、羟甲基戊二酰辅酶A合酶(HMGS)、3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR)等6种酶,22Unigene可能编码MEP途径中的1-脱氧-D-木酮糖-5-磷酸合酶(DXS)、1-脱氧-D-木酮糖-5-磷酸还原异构酶(DXR)等7种酶。

香叶基二磷酸、法尼基二磷酸、鲨烯、2,3-环氧鲨烯是三萜骨架生物合成中的一系列不同C5单元组成的中间体[15]。催化上述中间体产生所需的酶,在夏枯草的转录组数据中均找到了编码相应酶的候选基因,其中包括1个香叶基二磷酸合酶(GPPS)、4个法尼基二磷酸合酶(FPP)、4个鲨烯合酶(SS)、10个鲨烯环氧酶(SQE)、6β-香树脂合成酶(β-AS)等。

2.6.2  酚酸类 迷迭香酸具有抗病毒、抗炎、抗抑郁活性等药理活性,是夏枯草中的有效成分之一[4]也是《中国药典》2015年版中夏枯草药材的质控指标。另外,迷迭香酸也是许多其他次生代谢物的前体物质,在夏枯草植物次生代谢网络中具有重要的作用。植物中迷迭香酸的生物合成途径已经基本清晰,苯丙素代谢途径和酪氨酸代谢途径共同参与了迷迭香酸的合成和调控[16]。在夏枯草转录组数据中,共注释得到24Unigene可能编码迷迭香酸的生物合成途径的7种关键酶,其中包括8个苯丙氨酸解氨酶(PAL)、3个肉桂酸-4-羟化酶(C4H)、94-香豆素辅酶A连接酶(4CL)、4个酪氨酸氨基转移酶(TAT5个对苯基丙酮酸还原酶(HPPR)和2个迷迭香酸合成酶(RAS)。

2.6.3  次生代谢后修饰酶  次生代谢产物骨架形成后需要经过母核的氧化、糖基化等后修饰的反应才能形成结构各异的成分,这些后修饰反应也使次生代谢产物的种类和结构更加多样。细胞色素P450cytochromeP450CYP450)主要参与次生代谢产物的氧化反应,糖基转移酶(glycosyltransferasesGT)催化糖基转移反应,两者在次生代谢产物的后修饰中起着重要的作用[17]。通过搜索夏枯草转录组数据在Swiss-Prot数据库的注释结果,共找到259Unigene被注释为CYP450118Unigene被注释为UGT

2.6.4  其他次生代谢产物  夏枯草中还含有黄酮类、苯丙素类、香豆素类、多糖类等化合物和内源性激素等生长调节物质,根据KEGG代谢通路分析结果,有15条代谢通路中534Unigene可能参与夏枯草其他次生代谢途径。其中苯丙素类生物合成途径所占比例最大,共有110Unigene被映射到该途径,甜菜红素和硫代葡萄糖苷生物合成途径所占比例最小,分别仅有2条、3Unigene

2.7  转录因子分析

转录因子可激活或抑制植物次生代谢产物生物合成途径中功能基因的表达,从而有效调控次生代谢产物合成积累。根据基因序列比对到Pfam数据库,参照各种转录因子的隐马氏模型文件,利用HMMER 3.0 软件对夏枯草转录组数据进行搜索。结果显示夏枯草转录组数据预测共有1 449Unigene被注释为转录因子,分属于60种转录因子类型。最多的转录因子类型是MYB类(158个),约占10.90%;其次是AP2/ERF类(共113个),约占7.8%;锌指蛋白C2H2类(97个),约占6.7%GRAS类(96个),约占6.63%bHLH类(84个),约占5.8%WRKY类(85个),约占5.87%NAC类(69个),约占4.76%bZIP类(56个),约占3.86%

3  讨论

夏枯草作为著名的药食两用中药材,次生代谢产物的安全性和复杂性是其能够被广泛应用的物质基础然而由于夏枯草富含的三萜类、酚酸类等次生代谢产物的生物合成途径极其复杂[1,3],因此对夏枯草次生代谢生物合成调控相关功能基因的挖掘仍处于较低的水平。目前,药用植物次生代谢合成生物学研究的进展较为缓慢,主要是由于对药用植物次生代谢生物合成途径调控网络的了解较少,功能基因的克隆、表达及功能分析仍较为滞后。近年来,基于高通量测序的转录组学技术发展迅速,也为药用植物次生代谢生物合成调控基因信息发掘提供了前所未有的机遇[18]。夏枯草三萜是其次生代谢产物的重要组成部分,而其含量和组分又主要取决于生物合成关键酶以及在细胞中的表达水平。在夏枯草转录组的KEGG注释中,共筛选到60个参与三萜合成上游部分基因,分属于MVAMEP途径的各个环节。在夏枯草酚酸类的生物合成过程中,苯丙素代谢途径和酪氨酸代谢途径共同参与了迷迭香酸的合成和调控,通过对夏枯草转录组数据的搜索,共得到24Unigene可能编码迷迭香酸的生物合成途径的7种关键酶。

次生代谢产物合成下游环节还包括母核的结构修饰以及糖基化等步骤,细胞色素(P450)和糖基转移酶(UGTs)分别是这些关键步骤的催化酶。P450s通过氧化反应(如羟基、酮基、羧基和双键等不饱和基团)在不同类型次生代谢产物母核的不同位置和不同数量进行结构修饰[19],极大地提高了所生成次生代谢产物结构的多样性、生物活性。UGT催化糖基单元到修饰过的次生代谢产物母核上,形成苷类化合物,而使其具有水溶性[20]。植物体内P450基因类及UGT基因家族数据庞大、功能十分复杂,因此对其功能的研究不够透彻而难以准确鉴定,在基于同源性上寻找专属反应的调控基因上仍是不小的难题,鉴定和验证这些基因需要做的工作还有很多。本研究通过对夏枯草进行转录组测序,极大的丰富了夏枯草的基因资源,为更深入的研究夏枯草次生代谢合成及调控提供基础数据,也有望推动夏枯草次生代谢相关基因的研究。

参考文献(略) 

来  源:朱畇昊,张梦佳,李  璐,赵  乐,董诚明. 夏枯草的转录组测序与次生代谢产物生物合成相关基因的挖掘 [J]. 中草药, 2019, 50(5):1220-1226.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多