分享

膜蛋白原核表达的基因序列优化

 萝卜涨价了 2018-07-26

膜蛋白在生物体的许多生命活动中起着非常重要的作用,如细胞的增殖和分化、能量转换、信号转导及物质运输等。目前有大约 60% 的药物作用靶点是膜蛋白[1]。关于膜蛋白结构的研究对探究疾病的发病机理和有效治疗有着重要意义,也是当前的研究热点之一。研究膜蛋白结构的技术包括 X 射线衍射、核磁共振波谱、电子显微镜、原子力显微镜、红外光谱和圆二色谱等。其中 X 射线衍射和核磁共振波谱技术是对膜蛋白三维结构进行研究的主要方法。尤其利用固体核磁共振技术(Solid state NMR)可在接近膜蛋白的天然环境的磷脂双分子层中研究膜蛋白的三维结构信息和动力学特征,在膜蛋白结构研究领域具有独特的优势和广阔的发展前景[2,3]。采用固体核磁共振研究膜蛋白的结构与功能,需要制备大量的同位素富集的膜蛋白样品,重组表达就成为了获取膜蛋白样品的重要手段。常用于重组膜蛋白的表达系统有真核表达系统、原核表达系统和近些年来发展的无细胞表达系统。其中以大肠杆菌(E.coli)为代表的原核表达系统因为操作简单、成本相对低廉、遗传背景清楚、方便同位素标记,以及有大量可利用的表达载体和宿主菌株等原因,是目前获取重组膜蛋白的最主要途径。对于一些膜蛋白而言,采用增加蛋白可溶性或者促使蛋白形成包涵体的标签进行融合表达,是很好的增加蛋白产量的办法,但是目前还没有普遍有效的融合标签可用于所有膜蛋白的超量表达[4-6]。因此,如何提高蛋白表达量一直是膜蛋白三维结构研究过程中首先需要解决的问题。本文归纳了近些年来基因序列优化在膜蛋白原核表达技术研究上的最新进展,并从稀有密码子的优化、mRNA 的稳定性与翻译起始、mRNA 与核糖体行为、翻译的效率与膜蛋白的折叠 4 个方面对基因序列影响膜蛋白表达的优化因素进行了总结,旨在对原核系统中膜蛋白的超量表达提供一些思路和参考。

1膜蛋白基因序列特点

基因的碱基序列上携带的遗传信息,不仅决定了所合成肽链的氨基酸组成和顺序,还会影响基因的转录和翻译过程,这些遗传信息是决定蛋白质丰度的主要原因[7]。膜蛋白通常含有一个或几个疏水性很强的跨膜片段,其组成以疏水性氨基酸残基为主[8]。编码疏水性氨基酸的密码子中,其尿嘧啶含量要明显高于亲水性氨基酸的密码子[9],与可溶蛋白相比膜蛋白在基因组转录中处于明显劣势[10,11],这种碱基特异性是可能原因之一。此外,在膜蛋白基因序列上还存在影响蛋白折叠和插入的信号,它们对膜蛋白的结构和功能的保持至关重要。对多药耐药基因的研究发现,同义密码子的替换会影响其产物 P-糖蛋白折叠和插入膜的时机,从而使 P-糖蛋白底物特异性发生改变[12]。在啤酒酵母膜蛋白的跨膜区后第 45 个密码子及第 75 个密码子左右经常会出现一些翻译暂停信号,由于翻译过程中核糖体通道正好可以容纳 30-72 个氨基酸,这些信号可能与新合成的跨膜区的折叠有关因此,对于外源膜蛋白在原核表达系统中出现的表达水平低、可溶性差、易错误折叠和聚集的现象[4,15],在具体实践中结合表达宿主对目的基因进行碱基序列优化是促使膜蛋白高效,且正确表达的一项十分常用的解决手段[4,16,17]。

2膜蛋白基因序列的优化分析

蛋白的表达是遗传信息从基因的 DNA 序列经过转录、翻译和肽链折叠而形成蛋白质等一系列的过程。因此膜蛋白基因序列的优化会涉及到 mRNA 的转录水平、翻译的效率以及翻译过程中肽链的折叠等等多个方面。下面将从稀有密码子优化、mRNA的稳定性与翻译起始、mRNA 与核糖体行为、翻译的效率与膜蛋白的折叠四个方面进行介绍。

2.1 稀有密码子的优化

除甲硫氨酸和色氨酸之外,其他的氨基酸至少对应两个密码子。不同物种之间对密码子的偏好有明显差异,使用频率低的密码子被称为稀有密码子[18,19]。大量研究表明,稀有密码子的存在会影响膜蛋白的最终表达水平,因此异源表达的膜蛋白通常要在基因序列上对密码子进行优化[9,17,20-22]。许多膜蛋白,如秀丽隐杆线虫氯离子通道蛋白(Caen-orhabditis elegans GluCl ion channel)、人类细胞色素P4504F11(Human cytochrome P450 4F11)、G 蛋 白偶联受体(G-protein-coupled receptor)等,经过密码避免或减轻稀有密码子造成的不良影响[20,30]。

值得一提的是,大肠杆菌在不同的培养基中对密码子的偏好性可能会发生变化,比如 2012 年, Weissman 课题组发现丝氨酸密码子在 LB 培养基和含葡萄糖的富营养培养基中表现有很大差异[31]。但到目前为止,这种关于培养基成分对大肠杆菌密码子偏好性影响的研究并不多见。

2.2 mRNA的稳定性与翻译起始

mRNA 的降解是影响膜蛋白基因高效表达的重要因素。mRNA 的降解与其自身的碱基序列有很大关联,一个碱基的突变就可能会使 mRNA 稳定性出现巨大变化,从而导致膜蛋白的最终表达水平大受影响。以大肠杆菌 OmpA 蛋白和人体多巴胺 D2 型受体(DRD2)为例:当 OmpA 基因 5' 端的密码子被一些不常用的同义密码子取代后,mRNA 的半衰期缩短了 4 倍,mRNA 水平和最终的蛋白产量都降低了 10 倍[32];至于 DRD2 基因,当第 957 位的胞嘧啶(C)被胸腺嘧啶(T)替换后,mRNA 的半衰期从 8 h 降至 4 h,蛋白产量也下降到了原来的50%,但是同时将第 1101 碱基突变为腺嘌呤(A)后,mRNA 稳定性和蛋白表达水平又恢复正常[33]。 mRNA 的降解还可能与其第 20-45 个密码子的裸露有密切关联,在这一段序列前面或后面加一些低翻译速率的密码子分别可以缩短或延长 mRNA 的半衰期,原因可能是核糖体在这段序列上更长时间的停留和包裹可以保护 mRNA 免于被降解[34]。

在mRNA 起始密码子附近的 -4-+37 位碱基处避免形成稳定的二级结构对于蛋白的表达非常重要,这正是核糖体在翻译起始的部位[35]。mRNA 5' 端临近翻译起始部位疏松的二级结构有利于核糖体亚基的快速识别和重组,提高翻译的起始效率[7]。高效的翻译起始和延伸,一方面加快了肽链的合成速率;另一方面,由于核糖体迅速的结合在一定程度上抑制了 mRNA 自身的降解,使转录出来的 mRNA保持一个比较高的水平[7]。在有些条件下,mRNA 5' 端二级结构的优化甚至比全局的密码子优化对膜蛋白基因的表达影响更为明显[17,20,35]。如对人体神经细胞突触回蛋白和大肠杆菌 FtsH 蛋白的研究发现,膜蛋白的表达水平与其 N 端氨基酸密码子选择子优化后在大肠杆菌中得到了良好的表达[22-25]。除此之外,稀有密码子的出现在有些情况下还会造成点突变甚至移码突变,从而表达出序列错误的多肽。如有些情况下稀有密码子 AGA 编码的精氨酸(Arg)会被错误翻译成赖氨酸(Lys)[26],串联的稀有密码子如 AGG-AGG、AGA-AGA 及 3 个连续的 CGG 可能会造成阅读框的改变[27,28],终止密码子 UGA 被翻译成色氨酸(Trp)造成通读而产生后续的冗余序列[29]。因此,应该避免在膜蛋白的基因序列中含有大量稀有密码子,对此最直接的办法是对基因序列中的密码子进行优化,目前有 Codon Usage Analyzer、 Graphical Codon Usage Analyzer 等许多在线程序或网站可以利用。另一种解决方式是采用带有稀有密码子额外拷贝的表达菌株,如已经商业化的 BL21 Codon Plus 或 Rosetta 菌株,这在一定程度上也可以不同而导致的 mRNA 5' 端的二级结构变化有着很大关系[20,36]。事实上,很多高表达基因为了使 mRNA 5' 端保持有利于翻译起始的二级结构而不得不在密码子偏好性上作出妥协[37-39]。因此,运用聚合酶链式反应(PCR)等技术对基因序列的 5' 端进行改造或者添加一些碱基降低翻译起始部位 mRNA 二级结构的稳定性,是使膜蛋白获得高效表达的一个有效手段[17,40]。

2.3 mRNA与核糖体行为

膜蛋白基因序列的优化还需要考虑到核糖体诱捕和类似核糖体结合序列(SD 序列)等影响核糖体行为的因素。在蛋白质的合成过程中,一条 mRNA 通常会同时结合多个核糖体,每个核糖体合成一条肽链,它们的相对独立并同时进行使得翻译过程十分高效。但是,mRNA 上密码子的使用不仅影响到核糖体在某个位置的移动速率,还会关系到相邻核糖体之间的距离,在整体翻译速率非常快的情况下,后面有一个翻译速率慢的密码子有可能引起核糖体的碰撞和形成队列,这通常会使这些核糖体被诱捕而长时间不能移动,从而影响了翻译的效率,因此在序列优化时需要防止翻译过程中核糖体的碰撞和队列来节省翻译的时间[41]。另外,膜蛋白基因中类似核糖体结合序列(SD 序列)的结构也是一个不能忽略的因素。一方面,类 SD 序列的存在可能会使核糖体在该位置上被长时间扣押而导致翻译停滞,极大地降低肽链延伸速率甚至造成蛋白合成提前终止;另一方面,原核表达是转录和翻译的耦合,终止密码子附近的类 SD 序列导致核糖体在翻译即将结束时移动减速,使其不会影响到终止子茎环结构的折叠从而确保转录的正常终止[31]。

2.4 翻译的效率与膜蛋白的折叠

膜蛋白基因携带的遗传信息还会调节翻译的肽链的折叠、复合物的形成及膜蛋白的插入等[12,42]。适时的翻译速率的减缓对膜蛋白在大肠杆菌中正确表达是非常重要的,慢的翻译速率可以让超量表达的膜蛋白更好地折叠、定位并保真[43]。如对蛋白家族数据库(Pfam)的统计显示,许多与膜相关的蛋白质都有很长的稀有密码子簇,这些稀有密码子簇大都在前 130 个氨基酸残基内,并且在靠近 N 端的区域稀有密码子的数量会大幅攀升。在基因表达的过程中,稀有密码子簇引起的翻译的减速或暂停,有利于初始合成的肽链在核糖体通道里形成所需的α螺旋结构。离开核糖体后,α 螺旋上的疏水残基与水环境相互作用,快速地重新排列形成更为复杂的结构,所以存在于膜蛋白结构域之间的稀有密码子簇的一个作用可能就是通过形成多个翻译暂停,对蛋白结构进行分步包装,使蛋白正确地折叠和定位。因此在基因编码区设置适当的翻译暂停位点对于膜蛋白结构的正确形成,如跨膜螺旋的折叠,有很好的促进作用[42]。

3总结

我们从稀有密码子的优化、mRNA 的稳定性与翻译起始、mRNA 与核糖体行为、翻译的效率与膜蛋白的折叠 4 个方面对基因序列上影响膜蛋白表达的优化因素进行了总结,并列举了一些优化方案和成功实例。基因的序列优化工作是膜蛋白原核表达的重要开端,在实际操作过程中多个因素之间经常会相互影响,必要的时候可能需要作出一定程度的妥协才能得到最优的序列,一段合适的基因序列可以让后面的表达纯化工作达到事半功倍的效果。目前对于 mRNA 降解、翻译暂停和膜蛋白折叠等过程的认识还不够充分,所以膜蛋白基因序列的优化也还需要未来更多工作的支持。膜蛋白的表达本身是多个过程的综合考量,除了本文所讲的基因序列优化外,后续的表达载体、融合标签以及宿主菌的选择、培养条件的优化等也是膜蛋白高效表达时应该认真考虑和设计的工作。 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多