分享

【Plant Biotech J】通过CRISPR/Cas9靶向诱变TaDCL4、TaDCL5和TaRDR6诱导小麦雄性不育

 赛思基因 2023-01-10 发布于山东

文章信息

题目:CRISPR/Cas9-targeted mutagenesis of TaDCL4, TaDCL5 and TaRDR6 induces male sterility in common wheat

刊名:Plant Biotechnology Journal

作者:Yulian Li, Genying Li et al.

单位:Shandong Academy of Agricultural Sciences

日期:04 January 2023

01

摘要

阶段性小干扰RNA(phasiRNA)对植物花药发育,尤其是雄性不育非常重要。PhasiRNA的生物发生依赖于基因样RNA聚合酶6(RDR6)、DICERLIKE 4(DCL4)或DCL5转化为21或24核苷酸(nt)双链小RNA。

在这里,我们使用CRISPR/Cas9系统生成了DCL4、DCL5和RDR6的突变体,并研究了它们对植物生殖发育和小麦phasiRNA产生的影响。我们发现RDR6突变在从种子萌发开始的整个植物发育过程中造成严重后果,dcl4突变体在完全雄性不育的情况下生长较弱,而dcl5植物发育正常但雄性不育。相应地,DCL4和DCL5分别指定了21 nt和24 nt phasiRNA的生物发生,而RDR6对两者都有贡献。三个关键基因在小麦中的进化不同,多倍体化后TaDCL5-A/B变得不起作用,TaRDR6-A丢失。

此外,我们发现通过phasiRNA鉴定的PHAS基因(phasiRNA前体)在多倍体小麦的亚基因组中快速分化。尽管在禾本科植物的PhasiRNA中没有发现相似性,但它们的靶点被富集,具有相似的生物学功能。鉴于phasiRNA通路在配子体发育中的重要作用,对关键基因功能的遗传解剖可能有助于产生适合杂交小麦育种的雄性不育系。

02

技术路线



The Cas9-sgRNA expression vectors were constructed



Detection of the targeted genome editing events



SEM observation



Expression analysis by Real-time qRT-PCR



Bioinformatics analysis of strand-specific RNA-seq, small RNA sequencing data and degradome data



PhasiRNA prediction



Length measurement and number estimation of fiber cell



The Cas9-sgRNA expression vectors were constructed as previously described

03

主要结果

3.1 小麦phasiRNA生物合成的关键基因

在其他草中已知的用于产生21 nt和24 nt phasiRNA的关键基因分别是DCL4和DCL5,它们切割RDR6产生的双链PHAS RNA。作为六倍体,小麦具有DCL4和DCL5的三个拷贝(同源性),而RDR6只有两个同源性(TaRDR6-B和TaRDR6-D)(图1a,图S1)。尽管如此,A基因组供体授予了RDR6基因,表明六倍体中的A同源性可能在六倍体化后丢失。这些基因的蛋白质序列在多倍体及其后代的亚基因组中是保守的(图S1-S2)。TaRDR6显示出与TaDCL4相似的表达模式,可在营养和生殖阶段检测到,在后一阶段的表达水平更高(图S3a-3b)。

然而,TaDCL5仅在生殖阶段的组织中检测到,例如幼穗和花药,其中D同源性在三个亚基因组中具有最高的表达水平(图S3c)。qRT-PCR分析表明,TaDCL4和TaRDR6在0.2毫米花药中表达最高,而TaDCL5在0.8和1.0毫米花药中的表达最高(图1b),表明它们在小麦花药发育中的不同作用。

图1
(a) TaDCL4、TaDCL5和TaRDR6基因的基因结构及其靶向所有同源染色体的sgRNA。
(b) 这三个基因在不同花药长度的幼穗中的表达水平。
(c) CRISPR/Cas9。PAM位点用下划线表示,并用橙色表示;数字表示序列的读取;d、 删除;i、 插入。
(d) WT及其突变体的幼穗中三个基因的表达水平。
(e) dcl5、dcl4和rdr6突变体中每个亚基因组(A、B和D)的突变率。

3.2 通过基因组编辑创建dcl4、dcl5和rdr6突变体

在TaDCL4的DEAD/DEAH盒解旋酶、TaDCL5的PAZ结构域和TaRDR6的RNA依赖性RNA聚合酶结构域设计了三个靶向其同源性保守结构域的单引导RNA(sgRNA)(图1a)。

使用根癌农杆菌介导的方法将CRISPR/Cas9构建体转化到小麦中,并通过Hi-TOM测序确认阳性植物。总共,TaDCL4、TaDCL5和TaRDR6的基因组水平分别突变了19、5和9株T0植物(图1c和表S1-S3)。然而,突变的植物含有可育的纯合基因型,如dcl4-17的aabbdd或rdr6-13的bbdd。这些植物的3-bp缺失或其整数倍(表S2-S3),可能对蛋白质结构影响相对较小。因此,在这项研究中,我们定义了仅由早期终止密码子或移码突变组成的突变。

然后,我们选择了突变比例较高的T0植物(dcl4-17、dcl4-31、dcl5-4和rdr6-13)来繁殖其后代(表S1-S3)。在T1或T2代,三个基因的突变体显示雄性不育,其基因表达水平远低于WT(图1d和表S1-S3)。在进一步研究中使用的所有突变体都具有MS表型。创建这些突变体的详细信息显示在支持材料和方法中。dcl5-4的T0植株完全雄性不育,必须与野生型Fielder杂交以保持杂合种子。(表S1和图1c)。dcl5中的MS表型仅在chr1D中突变率至少为70%时发生(图1e)。这表明chr1A和chr1D在六聚体化后可能失去功能。相反,只有当TaDCL4和TaRDR6的每个同源性被编辑为每个同源性中至少70%或75%的突变时,才会出现突变表型,如MS(图1e和表S2-S3)。否则,没有观察到明显的表型,表明这两个基因介导的途径在某种程度上是多余的。dcl4雄性不育突变体可通过自交遗传。对于一些rdr6突变体,大约一半的分蘖是雄性不育的,因此也可以通过自交繁殖。

图2:WT、dcl4、dcl5和rdr6突变体中花药(a和c)、穗状花序(b)和植物表型(d)的表型。白色箭头表示不育的分蘖。(e) WT、dcl4、dcl5和rdr6成熟花粉粒的I2-KI染色(左图)。

3.3 dcl4、dcl5和rdr6突变体的表型

对于三种基因的严重突变体,花药是受影响最大的器官,与野生型(3.2 mm)相比,dcl4、dcl5和rdr6植物的花药分别短2.1、2.4和2.3 mm(图2a、c和图S4)。dcl4突变体的穗和小穗也更短或更小(图2b),此外,dcl4突变株中的少数小穗仅包含一对空颖片,没有三个小花药花(图S5a)。

rdr6中植物的分蘖、穗和高度与野生型相似,只有一半的分蘖表现为MS(图2d和图S5c)。对于大多数rdr6突变体,穗和小穗表现与WT相似(图2b),而一些穗具有异常的小穗,没有花药,外稃变薄和芒状。除花药形态外,rdr6突变体表现出更广泛的影响和严重的表型,如更多的分蘖、矮化和难以发芽或进入生殖期的植物(图S5b-5c和表S4),表明TaRDR6的功能对小麦的多个发育过程至关重要。dcl5突变体在所有分蘖中表现为完全雄性不育,而这些植株在分蘖、穗和高度上与WT相似(图2a-2d和图S5d)。

3.4 dcl4、dcl5和rdr6突变体的育性

进一步的研究表明,当用I2-KI染色时,突变体没有可育的花粉粒,并且在形态上缩小。扫描电子显微镜(SEM)还显示突变体花粉壁褶皱、不规则或收缩(图2e)。细胞学观察表明,dcl4和rdr6突变体的有缺陷的减数分裂细胞在减数分裂至四分体发育过程中逐渐开始解体,而在dcl5突变体中仅观察到不完整的绒毡层(图S6)。相应地,在dcl4和rdr6花药中观察到较少的花粉粒,但dcl5花药中的花粉数量与WT相似(图2e和图S6)。这些数据表明了这些基因在花粉发育过程中的不同功能域。

3.5 dcl4、dcl5和rdr6 MS突变体的减数分裂和小孢子发育

然后,我们观察了dcl4和rdr6的花粉母细胞(PMCs)的发育,发现它们可以完成减数分裂过程(图3)。然而,dcl4植物表现出大量染色体滞后的PMC,从而产生畸形的二分体、三分体和四分体,导致不同的染色体倍性,从而导致小孢子畸形(图S7)。在rdr6突变体中,只有少数PMC显示出具有多个细胞核的滞后染色体(图S8)。由于存在粘连的小孢子,观察到一些较大的花粉粒。当萌发孔出现时,dcl5的小孢子发生变形(图3),此外,约4~6%的小孢子产生两个萌发孔(图3和表S5)。这些观察表明,TaDCL4或TaRDR6参与减数分裂,而TaDCL5参与小孢子发育

图3 在PMC中,通过用dcl4、dcl5和rdr6的WT和MS突变体的改良卡品红色染色来进行减数分裂

3.6 生殖阶段phasiRNA的生物发生依赖于TaDCL4、TaDCL5和TaRDR6

为了研究TaDCL4、TaDCL5和TaRDR6在PhasiRNA生物发生中的作用,我们对18个来自野生型花药原基(AM)和四分体期(TS)花药组织的小RNA文库以及3个具有两个或三个生物复制的基因编辑突变体进行了测序。AM文库中总共鉴定了630个21-PHAS基因座,TS文库中鉴定了3376个,其中两个阶段都发现了可比较的24-PHAS基因(AM与TS,1072与1364)(图4a和数据S1-S2)。尽管如此,AM时仅有17%(185)的24-PHAS与TS时重叠,而21-PHAS中有近40%(246)在TS时再次出现(图4b)。

在dcl4突变体中,无论是AM还是TS,都没有发现21-PHAS基因座,而24-PHAS的数量在两个阶段都保持着与野生型相似的比例(AM与TS,1016与1573)(数据S3-S4),这表明在AM和TS阶段,21 nt phasiRNA的生物发生在很大程度上依赖于TaDCL4。

在dcl5突变体的TS阶段,24 nt PHAS完全减少,而21 nt PHAS保持与野生型相似(图4c和数据S5),表明24 nt phasiRNA的生物发生完全依赖于TaDCL5。RDR6的突变导致21-PHAS和24-PHAS的显著减少(图4a和数据S6-S7),与其他物种中报道的其在phasiRNA生物发生过程中双链RNA产生中的作用一致。

有趣的是,野生型的发育阶段之间或野生型与三个突变体之间很少有PHAS基因座重叠,表明phasiRNA的时间和空间表达特异性(图4c)。与之前的报告一致,我们发现21-PHAS中90%以上被miR2118靶向,TargetFinder得分≤8,而24-PHAS中27.21%至71.83%被miR2275靶向(图4d-4e)。此外,30.66至91.97%的24个PHA也被sRNA tae_and1靶向(表S6)。降解组数据证实,21-PHAS和24-PHAS可分别被miR2118、miR2275和tae_and1切割(图4e)

图4
(a) 在AM/TSWT、AM/TSDc4、AM/TSrdr6和TSdcl5中预测的21-和24-PHAS基因座。
(b) AMWT和TSWT之间重叠的21-和24-PHAS位点。
(c) AM/Tsdc4、AM/TSrdr6和TSdcl5中重叠的21-和24-PHAS位点。(d)WT和dcl4、dcl5和rdr6突变体中miR2118和miR2275或tae_cand1靶向的21个和24个PHAS基因座中21个nt和24个nt phasiRNA的密度。(e)通过降解数据验证了miR2118、miR2275和tae_cand1对PHAS基因座的切割。
(f)通过降解数据和5'-RACE,基因体中21个nt phasiRNA(包括编码区、3'UTR和5'UTR区)和lncRNA引导的经验证的切割靶位点。

3.7 PhasiRNA靶向编码和非编码RNA

尽管存在PHAS基因座,但仅在野生型(AM和TS,或AMw t和TSwt)和dcl5突变体(TSdcl5)的TS中大量鉴定出reads>50且TargetFinder评分≤4的phasiRNA,分别有480、619和2226个21 nt phasiRNA靶向2485、13024和10703个编码基因转录本。总共有509、675、311和309个高自信24-nt phasiRNA分别针对AMwt、AMdcl4、TSwt和TSdcl4中的575、310、619和675个编码基因转录本。

此外,通过链特异性转录组测序,从WT和dcl4植物的TS期花药中共鉴定出2450002个长非编码RNA(lncRNA)。平均而言,559个21 nt phasiRNA靶向16981个lncRNA,而1250个24 nt phasiRNAs靶向AMwt中的5535个lncRNAs。在TSwt中,平均有1214个21-nt phasiRNA靶向38890个lncRNA。换句话说,一个21 nt phasiRNA靶向AM和TS中的约30 lncRNA,而一个24 nt phasiRNAs仅靶向3~4 lncRNA(表S7)。

大量的phasiRNA靶向转座子元件(TE),约70%来自lncRNA的21 nt phasiRNA靶标,约60%来自24 nt phasiRNAs(表S7和图S9),表明phaisRNA也可能通过影响染色质结构参与基因组稳定性。

为了研究phasiRNA的作用模式,我们使用类别≤1且P值<0.05的CleaveLand程序进行了降解测序和靶位点预测。在野生型中,发现TSwt和TSdcl5中分别有343和439个21nt phasiRNA与位于384和502个潜在靶基因mRNA的断裂点对齐(数据S8-S11)。相比之下,TSwt和TSdcl4中分别有105个和38个24 nt phasiRNA与117个和43个编码靶转录本对齐(图4f,数据S8-S11)。此外,有141个21 nt phasiRNA和32个24 nt phasiRNAs分别被验证为靶向162和34个lncRNA。然后,我们通过快速扩增被21 nt phasiRNA切割的lncRNA TCONS_02748198的5'cDNA末端(5'-RACE)来验证这种切割(图4f)。

这些数据表明,切割是phasiRNA对靶转录物作用的主要模式之一。

图5
AMWT中21 nt(a)和24 nt phasiRNA(b)靶的富集GO(c-d)该分布靶向参与生育调节的21nt(c)和24nt(d)phasiRNA的基因。
(e) WT和dcl4或dcl5突变体之间的phasiRNA靶向的花药发育基因的表达水平。RPKM、转录组数据中的基因表达水平。

3.8 PhasiRNA广泛参与减数分裂、绒毡层和小孢子发育

GO富集分析表明,21个nt phasiRNA的靶点富集了基本生物学过程的功能,如蛋白质修饰、碳水化合物生物合成和ncRNA代谢,以及生殖过程的调节(图5a,数据S12-S13)。特别是,丰富了与减数分裂进程相关的GO术语,如微管运动和成核以及染色质修饰,如组蛋白修饰(图5a、图S10a-S10b和数据S12-S13)。

对于24个nt phasiRNA靶点,GO富集包括细胞壁组织和修饰、端粒组织和维持、磷脂酰丝氨酸生物合成和代谢过程以及甾醇代谢过程(图5b、图S11和数据S14)。阳离子稳态、细胞通讯调节和信号通路的功能也得到了富集(图5b,数据S14),表明它们在花药发育中的潜在作用。

为了更准确地描述phasiRNAs在小孢子发生过程中的功能,我们将其与与水稻花粉壁发育(PWD)和雄性不育基因同源的小麦基因进行了比对。如图5c-5d和表S8所示,phasiRNA靶向参与花粉内膜、黄嘌呤和外壁发育、绒毡层分化、孢粉素代谢发育和PWD几乎所有步骤的基因转录物。

为了确认phasiRNA对其靶标的调节,我们进行了转录组测序,以验证突变体和WT中phasiRNA靶向的花药发育基因的表达水平变化。在表S8中列出的245个基因中,我们发现dcl4突变体中有68个差异表达基因(DEG)(表S9)。其中62例上调,6例下调。因此,dcl4突变体导致比WT中更多的基因上调。为了进一步验证这些DEG,我们选择了八个上调的DEG进行qRT-PCR,并发现所有这些DEG都持续显著上调(图5e)。

因此,转录组数据和qRT-PCR结果都证实了phasiRNA确实在花药发育过程中调节了它们的靶点。

3.9 禾本中phasiRNA及其靶标的进化

如上所示,phasiRNA的生物发生机制及其作用模式在草中是保守的。为了进一步了解phasiRNA是否也保守,我们通过BLASTN程序比较了小麦和水稻中的phasiRNA及其靶标,e值截止值<1e-20。

小麦中约1.47%(43/2930)21-PHAS和4.99%(88/1736)24-PHAS基因座可与水稻基因组匹配,表明物种间PHAS基因的同源性较低。尽管如此,phasiRNA的靶基因似乎在某种程度上是保守的。AMWT、TSWT和TSdc l5中的484、2474和2048个靶基因可以分别与水稻中的234、698和605个靶基因匹配(数据S15-S17)。这21个靶向同源基因的nt phasiRNA的总体相似性低于50%。

因此,尽管21个nt phasiRNA的相似性很低,但小麦和水稻之间存在共同的靶标。这可能是由于小麦和水稻中的phasiRNA具有各自特定的靶位点(图S12)。例如,phasiRNA靶向水稻的UTR区域,而小麦中的phasiRNA则靶向同源基因的cds区域。这些数据表明phasiRNA和/或其靶标的高度多样性。

3.10 多倍体小麦PHAS基因的分化

为了研究小麦三个亚基因组中PHAS基因的差异,我们将所有PHAS基因座合并到一个数据集中,得到2924个21nt(21-PHAS)和1736个24nt(24-PHAS)非冗余PHAS基因。将这些PHAS基因座与具有80%同一性和80%长度的严格标准的基因组进行比对,我们发现只有一小部分PHAS基因(21-PHAS为2.6%,24-PHAS为1.7%)在其他亚基因组中具有额外的同源性,显著少于蛋白质编码基因,其中56%的基因是所有亚基因组中的三个同源性。换言之,81.22%的21-PHAS和86.52%的24-PHAS是单基因,显著高于编码基因,即25.97%(图6a-6b)。

小麦PHAS基因座在每条染色体上的绘图显示其在端粒区域的优先分布,这与蛋白质编码基因相似(图6c-6d和图S13-S14)。有趣的是,4A和4D染色体上的大多数PHAS基因座都集中在长臂端粒上,这表明这两条染色体上可能发生了某种缺失。

为了研究小麦PHAS基因的进化,我们将它们映射到了乌拉尔图(T.urartu,AA)、双子叶小麦(T.dicocoides,AABB)和陶氏山羊草(Aegilops tauschii,DD)的基因组中。来自六倍体小麦subA、subB和subD的21-PHAS基因具有80%的同源性和80%的匹配长度,分别有63.03%、60.42%和91.26%能够在具有AA、BB祖先或DD基因组的后代中找到同源基因。四倍体小麦中PHAS基因的比例更高,subA和subB中21-PHAS的比例分别为87.82%和85.89%,与AABB基因组中的比例一致。在24-PHAS中发现了类似的模式(图6e)。

此外,每个亚基因组中与相应祖细胞匹配的PHAS比例与其分化时间呈负相关,R2=0.684,P值=3.16e-3(图6f),表明小麦属物种中PHAS基因座的动态演变。为了检查PHAS同源性是否同时被相同的phasiRNA靶向,我们研究了21个nt phasiRNA的切割位点。在图5b中,生殖、减数分裂、微管基和染色质过程的基因按GO分类,共鉴定出63个三联体、26个双联体和14个单联体(图6g)。对于三联体基因,51.67%的基因在所有三种同源性中都保持着切割位点,而相似百分比(56.52%)的双链体都具有携带同源性的切割位点。

因此,在六倍体小麦中,大约一半(50%)的PHAS基因已经分化并失去了它们的目标位点,这表明PHAS基因在多倍体小麦中的快速进化。

图6。21-(a)或24-PHAS(b)与编码基因之间三联体、双联体和单联体的百分比比较。21-(c)和24-PHAS基因座(d)在染色体上的分布。(e) 每个亚基因组中21-PHAS和24-PHAS的百分比映射到其祖基因组。(f) 每个亚基因组从其祖细胞分化的时间与映射到AA、subB到B、subA/B到AB、subD到D的亚A中PHAS的百分比之间的相关性。图7。PHAS在三个亚基因组中的多样性(面板顶部);通过TaDCL4或TaDCL5和TaRDR6(盘的中间)生产21nt或24nt phasiRNA的过程;它们对六倍体小麦花粉发育的潜在调控机制;以及它们在草中的进化(外侧窗格中的左侧和右侧)。

04

结论

PhasiRNA广泛参与雄性配子体发育,并严格依赖于TaDCL4、TaDCL5和TaRDR6。工作揭示了phasiRNA生物发生的基因及其前体和靶基因的功能。

这些发现为小麦配子体发育提供了重要的见解,并可能有助于选择最佳基因来生产雄性不育系,以及在这种主食植物中建立新的杂交小麦育种策略。

05

原文获取

原文链接:

https://onlinelibrary./doi/10.1111/pbi.14000

PDF获取:

https://www./h-nd-144.html

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多