据估计,50%~70%的被子植物在其进化过程中至少经历过1次多倍化过程(Masterson,1994)。许多重要的作物为异源多倍体(allopolyploid),如小麦、燕麦、棉花、咖啡等,或同源多倍体(autopolyploid),如紫花苜蓿、马铃薯等(Osborn et al., 2003)。其他一些作物,如玉米(Gaut and Doebley,1997)、大豆(Shoemaker et al.,1996)、甘蓝(Lagercrantz and Lydiate,1996)等虽为二倍体(diploid),但其祖先在进化中也经历了多倍化过程。全基因组测序后发现小基因组模式植物拟南芥也发生过多倍化过程(Blanc et al.,2000)。最近的研究表明,水稻基因组在禾谷类作物分化之前同样存在全基因组加倍事件(Tian et al.,2005)。被子植物中多倍化过程的普遍发生再次肯定了许多二倍体显花植物实际上是古老的多倍体(Blanc and Wolfe,2004a),这充分表明多倍体化过程在植物进化和物种形成中普遍具有重要性。由于受到“杂合性”和“多倍性”所带来的基因组冲击(genomic shock),新形成的基因组会作出一系列的反应,在早期发生广泛的基因组构成和基因表达水平的变化,如染色体重组(chromosome recombination)、亲本序列的消除(sequence elimination)、基因沉默(gene Silencing)、同源异型转换(homeotiC transformation)等。这些变化直接关系到新形成的异源多倍体物种的稳定和进化。
在植物异源多倍体形成的早期普遍发生着快速的基因沉默,这一现象在多倍体的进化过程中是可以遗传的。在对拟南芥人工异源四倍体(Comai et al.,2000)、天然异源四倍体Arabidopsis suecica (Lee and Chen,2001)以及小麦和棉花人工异源多倍体的研究中都发现了亲本基因的沉默现象,其中小麦中基因沉默最早可发生于基因组加倍前的种间 F1 代 (Kashkush et al.,2002;Adams et al.,2004)。对小麦新合成的异源六倍体和天然异源六倍体的比较研究发现,同一基因具有相同的沉默模式(He et al.,2003)。然而在拟南芥人工异源四倍体中,基因沉默现象在世代间也存在一定的不稳定性,一个在 F2 代沉默的类似转座子的基因在 F3 代又重新表达。虽然多数研究表明基因沉默是在早期世代快速发生的,但对沉默发生的具体时间(基因组加倍前或加倍后)尚缺乏充分认识,这一点还有待于进一步的研究。
基因沉默在异源多倍化过程中普遍发生,但相对于植物中的基因数目而言,显然是一个小概率事件。拟南芥人工异源四倍体中(Comai et al.,2000),大约有0.4%的基因发生沉默,而在拟南芥天然异源四倍体中(Lee and Chen,2001),约有2.5%的基因发生沉默。这种基因沉默发生频率的差异,一方面可能是在对天然异源四倍体的研究中,候选亲本与二倍体祖先相比已发生进化:另一方面也说明了基因沉默虽然是快速发生的,但可能伴随着多倍体的整个进化过程。此外,不同植物的异源多倍体基因发生沉默的频率也有很大差异。在小麦人工异源四倍体中(Kashkush et al.,2002),约有1%的基因发生沉默,而在棉花人工异源四倍体中(Adams et al.,2004),基因沉默的发生频率高达5%左右。沉默的基因包括各种类型,既有编码各种与植物生长发育相关的蛋白质和酶的基因,也有一些是非翻译的转座元件,但在不同植物异源多倍体中存在一定的差异(Comai et al.,2000;Lee and Chen,2001;Kashkush et al.,2002)。这种基因沉默在发生频率和类型上的差异,说明不同的植物异源多倍体在其进化过程中有着不同的基因沉默模式,同时也表明发生沉默的基因没有类型的特异性,而是具有广泛性。
对芸苔属和山羊草属(Aegilops)异源多倍体的研究发现,被消除的序列在某种程度上倾向于来自其中—个亲本的基因组(Song et al.,1995;Ozkan et al.,2001)。然而现有的研究结果表明,沉默的基因没有明显的基因组倾向性(Lee and Chen,2001;Kashkush et al.,2002)。沉默的基因可来自双亲或双亲之一的基因组,没有发现某一亲本基因组的基因有更易发生沉默的倾向。但在其他一些异源多倍体中是否存在类似的现象,还有待对更多的多倍体模式植物开展进一步的研究。
1.2 基因激活
基因激活是指亲本中沉默的基因在异源多倍体中被重新激活表达,也是异源多倍体形成过程中经常发生的一个现象。异源多倍化可激活反转座子(retrotransposon)、蛋白质编码基因以及一些未知功能的基因(Kashkush et al.,2002,2003;He et al.,2003)。在新合成的小麦异源四倍体中,新激活表达的基因占表达发生改变的基因的20%,其中部分基因与反转座子有很高的相似性(Kashkush et al.,2002)。小麦异源四倍体中反转座子转录量的大大提高,改变了相邻基因的表达水平(Kashkush et al.,2003)。在分别以基因组 DNA 和 cDNA 为模板进行的转座子展示试验(transposon display assay)中,未发现被激活的反转座子 Wis2-1A 两侧的 DNA 序列发生重排,却发现 Wis2-1A 两侧有26个(7%)基因的表达发生了变化,其中10个为在异源多倍体中激活表达的,16个是在异源多倍体中沉默的双亲或双亲之一的基因。这表明反转座子的激活是异源多倍体中基因表达发生变化的一个重要原因。
异源多倍体中基因激活事件的特点及发生与否因不同的多倍体和不同的植物而异。在新合成的小麦异源六倍体中,仅观察到1个编码蛋白质基因的激活,没有检测到反转座子的激活(He et al.,2003)。与此类似,在新合成的棉花异源四倍体中,没有发现有新基因激活的现象(Adams et al.,2004)。植物中基因表达具有一定的时空特异性,对不同的发育时期、不同的器官开展深入研究,有可能会发现新的基因激活。同时还需要对更多的异源多倍体进行深入的研究,这样才能更多地揭示异源多倍化过程中出现的基因激活现象,从而更好地认识和理解基因激活在异源多倍体进化中的作用。
在二倍体物种中,已经发现了许多基因具有等位剂量效应(allele-dosage effects),包括一些发育过程的重要调节基因,如玉米的结构基因tb1(Doebiey et al.,1997)、番茄果实大小基因fw2.2(Frary et al.,2000)和拟南芥开花时间基因FLC(Michaels and Amasino,1999)等。与在纯合的基因型中等位基因的高表达或低表达水平相比,等位剂量效应在杂合的基因型中表现为中间水平的基因表达和表型效应。但在多倍体中,有关剂量效应对基因表达的影响尚未开展广泛的研究,也没有具体的例证。但是它可以解释芸苔属植物由于重复的 FLC 位点表型效应而导致的开花时间变化(Osbom,2004),也能解释一些稳定多倍体中观察到的重复的基因能够高水平地保持其功能的现象。
如果2个部分同源基因编码的氨基酸序列不同,则其中1个可能会更好地与其他多亚基复合体中的蛋白质发生相互作用(Comai,2000;Adams and Wendel,2004),而使该基因得以表达,而另1个基因则沉默。例如,所有的母本基因由于它们序列能够彼此相互适应而可以表达,父本的基因则会沉默。叶绿体和线粒体中的多亚基复合体是由细胞核基因组和细胞器基因组所编码的亚基组成的。细胞器通常是单亲遗传(母性遗传)的,由于异源多倍体中没有父本提供的细胞器,从而导致父本基因的沉默,即可能存在核质互作效应。
2.3 遗传和表观遗传变化
遗传和表观遗传间的相互作用可导致异源多倍体中基因的表达发生变化(Comai,2000)。遗传变化主要是多倍体中亲本序列的丢失和新序列的产生。遗传变化对基因表达的影响尚缺乏深入的研究,但可以推测发生变化的序列是否涉及编码序列。对小麦人工异源多倍体的研究发现,基因丢失是多倍体中转录物的消失的原因之一(Kashkush et al.,2002)。此外序列消除可能会丢失部分同源基因对中的—个,从而影响到受剂量效应调节的基因以及调控网络的功能,导致基因表达水平的改变。
表观遗传变化不涉及 DNA 序列的变化,主要是通过 DNA 甲基化、组蛋白修饰和染色质包装来影响基因的表达(Wollfe and Matzke,1999;Jenuwein and Allis,2001)。同源基因间的相互作用可引起染色质结构和 DNA 甲基化模式的改变,诱导基因沉默(Meyer and Saedler,1996;Henikoff and Matzke,1997;Matzke and Matzke,1998)。在植物中,去甲基化可引起基因激活,过度的甲基化(hypermethylation)可引起基因沉默。基因甲基化模式的改变可以影响植物的花期、育性、叶片及花的形态(Marttienssen and Colot,2001)。对拟南芥和芸苔属的研究表明,基因沉默与高水平的 DNA 甲基化和低水平的组蛋白乙酰化有关(Chen and Pikaard,1997)。去甲基化试剂 5-氮胞-2脱氧胞苷处理能消除基因沉默现象(Houchins et al.,1997;Lee and Chen,2001;Madlung et al.,2002)。
然而异源多倍体中的基因沉默并非都是由甲基化引起的。在小麦异源多倍体中,有的沉默基因的甲基化模式并没有发生改变(Kashkush et al.,2002)。另外一个机制可能与转座子有关,由于转座子被激活,通过插入、转位和切除等方式引起基因组重排,改变基因的结构和表达调控模式,从而改变基因的表达(Martienssen and Colot,2001)。在小麦异源四倍体中,激活的反转座子 Wis2-1A 中长的末端重复序列可作为相邻基因的启动子,通过通读而使该基因得到表达;也可通读转录相邻靶基因的反义 RNA,通过 RNA 干涉使该基因沉默(Kashkush et al.,2003)。
遗传变异是植物品种改良的基础。在植物育种中,种内变异往往不能充分满足对品种抗病性和抗逆性需求,通过远缘杂交引入种间变异是一条非常重要的途径。种间杂交以及随后的染色体加倍,可以获得异源多倍体。成功地培育一个异源多倍体,不仅可以克服远缘杂种的育性障碍,更重要的是合成了一个过去不存在的新物种,其意义是非常深远的。我们对甜瓜属人工异源四倍体 Cucumis hytivus (2n=38) 的研究表明,其矿物质和维生素 C 含量均高于二倍体黄瓜,并抗根结线虫(陈劲枫等,2001),且具有很强的耐弱光能力(钱春桃等,2002)。这再次证明异源多倍化是植物进行新种质的创制和品种改良的一条有效途径。对该异源四倍体基因组序列变化的研究发现,该异源四倍体中发生着快速的亲本序列丢失和新片段产生,由此推测早期世代基因组中可能发生着与多倍体稳定性有关的变化(陈龙正等,2005)。目前对该异源四倍体早期基因表达变化的特点及相关机制也正在研究之中。
不同物种甚至同一物种的不同异源多倍体具有不同的基因表达变化特点。大多数人工合成的异源多倍体基因组在早期发生着快速的序列变化,而棉属(Liu et al.,2001)和大米草(Baumel et al.,2002)等的异源多倍体基因组在早期世代几乎没有发生过序列变化,表明异源多倍体在进化机制上存在复杂性。同时,一些自然界中没有的相应天然多倍体的人工异源多倍体可能存在着不同的基因表达变化特点和机制。因此,需要研究更多不同的模式植物,才能积累更多的资料,为揭示多倍体物种进化机制提供理论基础。这不仅对指导多倍体早期世代进行选择,以尽快获得稳定的异源多倍体具有理论意义,同时对利用回交等手段转导优良基因、改良现有品种也具有重要的实践意义。