基因组编辑:植物生物技术的机遇与挑战

2015-04-27 | 作者: 程曦 王文义 邱金龙 | 标签: 基因组编辑


图 1 CRISPR/Cas9 系统不同应用示例。A :野生型 Cas9 和 sgRNA 共表达时在基因组特定位点产生 DNA 双链断裂 ;B :Cas9 突变成“切口酶”形式后在基因 组特定位点产生 DNA 单链断裂(切口);C :不具有核酸剪切活性的 dCas9 蛋白与表观遗传修饰蛋白融合可实现基因 靶向表观遗传修饰 ;D :dCas9 蛋白与转录抑制子融合定向抑制靶基因表达 ;E :dCas9 蛋白与转录激活子融合定向激 活靶基因的转录 ;F :dCas9 蛋白与荧光蛋白相融合可在活体细胞中对基因组位特定座动态进行荧光动态实时观察 ;G : dCas9 蛋白与标签蛋白融合能被用于靶位点染色质的纯化 ;H :利用 sgRNA 文库对植物进行全基因组功能筛选

摘要
:基于序列特异性核酸酶的基因组编辑技术可以在不同物种中对目标基因进行定点敲除,并可实现特定基因片段置换,基因的定点插入等基因组靶向修饰。基因组编辑是一种精准和高效的基因工程方法,近年来快速发展并得到了广泛的应用,并将改变生物技术的现状。目前,基因组编辑在不同植物,特别是农作物中的技术体系已建立,初步展示了其在植物生物技术领域的巨大潜力。介绍了不同基因组编辑系统的工作原理,并对基因组编辑技术在植物研究中的应用及成功案例进行了综述,最后对基因组编辑在植物生物技术领域所面临的机遇与挑战进行了讨论。

随着新一代测序技术的出现,越来越多的植物物种完成了全基因组测序工作。面对海量的基因组序列信息,科研工作者面临的新挑战就是如何解读这些序列信息和诠释基因的功能,并利用基因组信息为人类造福。过去几十年中,通过转座子或T-DNA插入和RNA干扰下调特定基因表达的“反向遗传学”成为分析基因功能的一种有效方法。但T-DNA或转座子插入是随机的,在基因组上的位置是不可控的;同时,RNA干扰效果是短暂的,对基因表达的调控不可稳定遗传。Cre/loxP系统、PiggyBac转座子系统、PhiC31整合酶系统等位点特异性重组技术在体外实验或模式动物中可实现对基因的定点修饰,并在动物实验中得到了广泛应用,但不能广泛适用于植物基因功能的研究。此外,因为在植物中同源重组的效率很低,所以对植物基因组进行精确修饰和改造非常困难。近几年,基于序列特异性核酸酶的基因组编辑技术的出现,为植物基因组定点修饰提供了行之有效的新方法,成为研究植物基因功能的重要工具。基因组编辑是使用序列特异性核酸酶在基因组特定位点实现DNA的插入、替换或删除,从而在基因组水平对基因进行精确、定向修饰的一种高效的基因工程方法。序列特异性核酸酶锚定到基因组上的靶位点,对靶标DNA进行切割产生双链断裂(Doublestrandbreaks,DSBs)。细胞通过同源重组(Homologousrecombination,HR)或非同源末端连接(Non-homologousending-joining,NHEJ)两种不同修复机制对DNA产生双链断裂进行修复。绝大多数情况下,DNA双链断裂通过非同源末端连接修复。而非同源末端连接是易错的,常常造成碱基的添加或缺失,两者都可造成突变,实现对基因组的定点修饰。如有DNA供体,通过同源重组修复双链断裂,有可能会对目标基因进行定点突变或者基因置换。

目前,用于基因组编辑的序列特异性核酸酶主要有锌指核酸酶(Zincfingernucleases,ZFNs),类转录激活子效应蛋白核酸酶(Transcriptionactivator-likeeffectornuclease,TALEN),以及CRISPR/Cas9系统(CRISPR/Cas9system)。尤其是TALEN及CRISPR/Cas9系统相对简单,目前已经得到了相对广泛的应用。本文将首先综述不同基因组编辑系统的工作原理;然后重点介绍基因组编辑技术在植物研究中的应用;最后讨论并展望基因组编辑为植物生物技术研究和应用所带来的机遇与挑战。

1基因组编辑技术的工作原理

1.1锌指核酸酶技术


锌指核酸酶由锌指蛋白(Zincfingerprotein,ZFP)和核酸内切酶FokI的核酸酶活性域两部分融合而成。其中,ZFP是DNA结合结构域,负责特定核苷酸序列的识别与结合,通常由3-4个Cys2-His2锌指蛋白串联而成,每个锌指蛋白识别并结合一个特异的碱基三联体,因此每个ZFP结合域能识别一段9-12bp的碱基序列。FokI是一种非特异性的核酸内切酶,对切割位点不具识别特异性,并且仅在二聚体状态下才具备核酸酶活性。所以,针对每一个靶位点需要设计一对ZFNs,这对ZFNs的结合序列的间隔区域通常保持在5-7bp以确保FokI二聚体的形成,这样一对ZFNs可对靶序列进行特异切割并产生DNA双链断裂。

1.2TALEN技术

TALEN的构成与ZFN相似,由TALE(Transc-riptionactivator-likeeffector)蛋白DNA结合域和FokI核酸酶两部分融合而成。TALE蛋白DNA结合域负责靶序列的特异性识别,而FokI负责靶位点的切割。TALE是黄单胞属(Xanthomonas)植物病原菌分泌的一类效应蛋白,其DNA结合域由13-28个串联的具有DNA识别特异性的高度保守的重复单元组成。每个重复单元含有大约34个氨基酸,且不同单元的氨基酸序列非常保守,仅第12和13位氨基酸不同。这两个可变氨基酸被称为重复可变的双氨基酸残基(Repeat-variablediresidue,RVD),它们决定重复单元的DNA识别特异性。例如,NI识别A、HD识别C、NG识别T、NN和NK识别G。构建识别特定靶序列的TALEN时,只需把与序列对应的重复单元进行串联组装即可。同样,由于FokI在二聚体状态下才具有核酸酶活性,针对每一个靶位点也需要上下游各设计一个TALEN,这对TALENs结合序列的间隔区则在12-21bp之间。

1.3CRISPR/Cas9系统

在超过40%的真细菌和90%的古细菌中存在一类特殊的成簇DNA序列,它们由一系列短的高度保守的正向重复序列(Directrepeat,DR)与高度可变的间隔序列(spacer)交替排列组成,被称为成簇的规律间隔短回文重复序列(Clusteredregularlyinte-rspacedshortpalindromicrepeat,CRISPR)。在CRISPR侧翼区域存在CRISPR相关基因(CRISPR-associated,Cas)。CRISPR/Cas是古细菌和真细菌用于清除外源入侵DNA的一种免疫系统。根据Cas基因核心元件序列的不同,CRISPR/Cas免疫系统被分为3种类型,其中II型系统最简单。人们改造了II型CRISPR/Cas系统成为序列特异性核酸酶,使其能够像ZFN和TALEN那样对DNA进行靶向切割,称为CRISPR/Cas9系统。CRISPR/Cas9系统只由Cas9蛋白与sgRNA(single-guideRNA)构成,通过sgRNA与靶序列DNA的碱基配对招募Cas9蛋白来切割DNA双链,产生DNA双链断裂。靶序列通常由23个碱基组成,包括与sgRNA碱基配对的前20个碱基以及3'端Cas9识别的三核苷酸NGG的PAM(protospaceradjacentmotif)序列。Cas9切割位点位于PAM上游3nt处。靶序列的结合特异性是由sgRNA和PAM序列共同决定的。Cas9蛋白不需要形成蛋白二聚体起作用,而gRNA(guideRNA)通过碱基互补配对决定靶序列的特异性,因此,CRISPR/Cas9系统大大降低了技术门槛,一经面世就迅速得到广泛应用。

2基因组编辑技术在植物中的应用

2.1基因敲除


基因敲除是研究基因功能最直接而有效的手段。以基因组靶向修饰为基础的反向遗传学研究,成为基因组编辑在植物生物学中最直接的应用(图1-A,B)。不同的基因组编辑系统均可在特定位点产生DNA双链断裂,通过发生频率高的NHEJ修复机制,可以在切口处引起碱基的插入或缺失,从而导致蛋白质翻译的提前终止或移码突变,进而实现靶基因的定点敲除。目前,利用不同的基因组编辑系统,已经在拟南芥、烟草、水稻、番茄、马铃薯、玉米和小麦等多种植物中实现了靶基因敲除。

2005年,Lloyd等首先利用ZFN在拟南芥中对人工设计的靶序列进行了定点修饰;在ZFN诱导的106个突变中,有78%是序列缺失,13%是序列插入,8%是插入和缺失同时发生;有10%突变可以遗传到下一代。2010年,Zhang等用ZFNs对拟南芥的ADH1(ALCOHOLDEHYDROGENASE1)及TT4(TRANSPARENTTESTA4)基因实现了定点突变。在T1代转基因植物中,ADH1和TT4基因的突变率分别为7%和16%,突变类型包括碱基的插入或缺失;产生的突变分别以69%及33%的频率稳定遗传给下一代,最终通过遗传筛选及鉴定获得具有丙烯醇抗性的adh1突变体及种皮发黄的tt4突变体,纯合突变植物比例约为20%。同时,ZFNs被用于对拟南芥的ABA信号转导基因ABSISCICACIDINSENSITIVE4(ABI4)的定向敲除并成功得到对ABA不敏感的abi4突变体。大豆是古四倍体植物,其染色体中有大约75%的基因是重复的,遗传操作非常困难。但研究发现,ZFNs也可以对大豆基因组中序列高度相似的重叠基因(duplicatedgenes)进行敲除。此外,ZFNs也被成功用于敲除玉米内源基因。虽然ZFN在不同植物中获得了成功应用,但由于锌指单元对DNA识别特异性并不严谨,在不同的锌指串联中识别的序列差异较大,因此,ZFN常常表现高频率的脱靶效应(off-targeteffect)。此外,有效ZFN的构建也相当困难。这些都妨碍了该技术的进一步广泛应用,目前基本上已被新发展起来的TALEN和CRISPR/Cas9系统所取代。

TALEN技术面世后,迅速在拟南芥原生质体中实现了内源靶基因敲除,证明了其在植物细胞中的适用性。随之,Li等用TALENs定向破坏了水稻感病基因OsSWEET14启动子中的效应蛋白结合元件(effector-bindingelement,EBE),有效阻止了水稻白叶枯菌(Xanthomonasoryzae)分泌的效应蛋白与OsSWEET14基因启动子的结合,使OsSWEET14基因的表达不受白叶枯菌控制,从而提高了水稻对白叶枯病的抗性,同时也不影响水稻生长发育中的功能。Shan等构建了一系列TALENs,高效敲除了水稻中的OsDEP1、OsBADH1、OsCKX2、OsSD1基因与二穗短柄草中的BdABA、BdCKX2、BdSMC6、BdSPL、BdSPB、BdCOI1、BdRHT、BdHTA1基因。在大豆中,利用TALENs对脂肪酸脱氢酶(Fattyaciddesaturase)基因FAD2-1A和FAD2-1B进行了靶向修饰。通过鉴定,在19个转基因株系中有4个株系的FAD2-1A和FAD2-1B基因位点产生了突变,且3/4的突变可以稳定遗传到下一代。在这两个基因的双纯合突变中油酸含量从20%提高到80%,而对人体健康有害的亚油酸含量则从50%降低到4%,提高了大豆的产油量及品质。在玉米中,利用TALENs也成功对玉米的ZmPDS、ZmIPK1A、ZmIPK、ZmMRP4基因进行了敲除,在转基因玉米中TALENs诱导的突变效率在13.3%-39.1%之间。

序列特异性核酸酶,包括TALEN,在多倍体植物中的应用一直未建立。普通小麦是异源六倍体,基因组庞大且重复序列高。因此,针对小麦的基因功能研究及遗传育种都非常困难。最新的研究表明,TALEN能有效地对普通小麦基因组进行靶向的基因组编辑。MLO基因在大麦、拟南芥等多种植物中被证明是白粉病菌成功侵染所必需的,一旦突变,植物就表现出对白粉病菌的持久、广谱抗性。Wang等利用TALENs获得了对小麦MLO基因在A、B和D基因组上的3个拷贝的定点突变,产生的突变可以稳定遗传到后代并符合孟德尔遗传规律。通过小麦白粉菌侵染实验,发现只有普通小麦A、B和D基因组上3个MLO基因拷贝同时突变的纯合突变体tamlo-aabbdd表现出对白粉菌极为显著的抗性,表明小麦MLO基因的3个拷贝在功能上存在冗余,这也可能是到目前为止在自然条件下或利用传统育种手段而没有获得小麦mlo抗病材料的主要原因。此外,该研究还利用基因组编辑技术在小麦中实现了基因的定点插入,插入的片段可以稳定遗传,这可用于创制不能由简单基因敲除而产生的优良遗传特性。该研究首次在一个多倍体物种中证明可以对多个部分同源的基因同时并准确地进行编辑,展示了通过基因组编辑可以实现不同物种的育种信息资源共享。

2013年是CRISPR/Cas技术发展和应用的高峰,在植物中也得到了快速而广泛的应用。2013年8月,NatureBiotechnology杂志同时报道了3个实验室利用CRISPR/Cas9系统分别在双子叶植物拟南芥、烟草及单子叶植物水稻、小麦中成功实现基因组定点编辑的操作。其中,在拟南芥和烟草原生质体中瞬时表达CRISPR/Cas9,产生的突变效率分别可达到5.6%和38.5%;而利用农杆菌注射方法瞬时转化烟草时,突变效率为1.8%-2.4%。Shan等利用CRISPR/Cas9系统定点敲除水稻PDS基因,在水稻原生质体中基因突变效率为14.5%-38.0%,转基因水稻中基因突变效率为4.0%-9.4%,T0代得到的pds纯合突变体表现出典型的白化和矮小表型。此后,CRISPR/Cas9系统被应用于多个植物物种中,包括拟南芥、烟草、水稻、小麦、高粱、玉米、番茄等。例如,利用CRISPR/Cas9系统在水稻中诱导产生叶绿素含量降低的cao1突变体和分蘖夹角增大的lazy1突变体。Brooks等用CRISPR/Cas9系统靶向修饰番茄ARGONAUTE7基因,在T0代中就得到了有针状叶片表型的突变植株。有趣的是,CRISPR/Cas9系统在陆生植物进化研究的模式植物地钱的配子体中也得到成功应用,通过对AUXINRESPONSEFACTOR1(ARF1)定向敲除,得到生长素不敏感突变体,而且产生的突变可稳定遗传到无性世代。

2.2多基因敲除及染色体重排

利用基因组编辑技术也可以对多个基因,甚至非同源的基因同时敲除,为研究植物复杂性状及功能途径提供了重要手段。通常是将靶向不同基因的ZFNs、TALENs或sgRNA同时转化植物细胞,因为突变效率不是100%,所以需要后期筛选以得到多个基因同时突变的植株。例如,将分别靶向OsDEP1、OsCKX2和OsBADH2基因的3对TALENs同时转化水稻,在T0代得到了单基因、双基因及三基因发生突变的植株,其中三基因同时产生突变的效率为1.9%。此外,科学家们也发展了一些用于多基因敲除的CRISPR/Cas9系统。其中,第一代是将多个gRNA串联在同一个质粒上,并由RNA聚合酶III启动子起始转录。这样随着靶向的基因数量的增加,质粒变得越来越大,同时,RNA聚合酶III的转录需要从特定的核苷酸起始,这些都限制该体系的应用。最近,一个全新的通过把tRNA-gRNA串联排列高效表达多个gRNA的方法被建立,克服了以上问题,大大提高了对植物多个基因的敲除效率。

同时对两个基因组位点进行靶向切割,在染色体上产生两个切口。当两个切口在同一条染色体上时,修复时将有可能删除切口间的片段;也可能该片段反转后再修复,则产生该片段染色体的倒位。当两个切口不在同一染色体上,则有可能产生染色体的易位。例如,用ZFNs对拟南芥两条染色体上3个基因簇分别进行了片段删除,删除长度可高达55kb,效率在1%左右;实验中也观察到了染色体片段倒位及重复的发生。染色体重排(chromosomalrearrangement)为研究复杂基因的功能、长链非编码RNA、基因调控序列及基因簇的功能等提供了重要手段,也为在染色体水平上改造植物提供了可能。

2.3点突变,基因置换及基因定点插入

虽然基因敲除是研究基因功能的重要手段,但有些基因的敲除是致死的。同时,一些重要的植物性状是由基因点突变引起的。所以,利用基因组编辑进行点突变和基因置换(genereplacement)成为科学家追求的目标。基因组编辑进行点突变和基因置换通常是利用细胞修复双链断裂的同源重组(HR)机制来完成,除序列特异性核酸酶外,还需要加入与切口两侧序列同源的供体DNA分子作为模板,使得供体DNA与双链断裂处的序列发生同源重组,从而特异地改变一个基因的序列或置换掉内源序列。植物中,利用基因组编辑技术进行点突变和基因置换只是原生质体中获得了成功,在植株水平上还未见报道,这可能由于NHEJ是DNA断裂的主导修复途径,而HR只发生在特定的细胞周期和类型中。因此,科学家们尝试能否利用NHEJ修复方式实现目标基因的点突变和置换。Weinthal等在拟南芥和烟草中通过NHEJ修复方式实现了基因替换。但因为NHEJ修复是易错的,做到精确的基因替换还需要后续的研究来不断完善。相对而言,基因的定点插入效率比较高,已在多种植物中实现,并且这种定点插入可稳定遗传到下一代。如在玉米中,利用ZFN把抗除草剂基因PAT定点插入到编码肌醇-1,3,4,5,6-戊基磷酸酶的IPK1基因中,最终得到抗除草剂且植酸含量降低的玉米,定点插入的效率高达10%。Wang等用TALEN在小麦原生质体中通过NHEJ修复途径将报告基因GFP插入TaMLO基因位点,插入效率达6.5%;同时在小麦转基因植株中也分别以1.4%和2.6%的效率将His-tag和Myc-tag整合在TaMLO位点,插入片段可稳定遗传到下一代。

2.4基因组编辑系统的改造及新应用

随着基因组编辑技术的不断发展和应用,基于序列特异性核酸酶(Sequence-specificnucleases,SSNs),特别是Cas9的一些新的衍生技术被开发(图1)。这些衍生技术主要是将不同蛋白功能与SSN的DNA结合特异性相融合,从而达到对特定DNA序列的修饰、分离和观察的目的。例如,将不具有核酸剪切活性的dCas9(deadCas9)与负责转录激活、转录抑制、表观调控和荧光表达等蛋白相融合,可以实现对靶基因的转录水平及表观遗传的调控,或对基因组特定位座(loci)进行荧光成像和实时观察。这些基因组编辑衍生技术为植物研究及生物技术提供了更多的技术手段。其中,基于序列特异性核酸酶的转录调控及表观修饰(图1-C,D,E)已有报道。虽然目前靶基因组位座动态荧光观察(图1-F)、靶位点染色质的纯化(图1-G)还未在植物中实现,但为基因组编辑在植物生物技术领域的应用提供了新的方向。在动物细胞系中利用CRISPR进行全基因组水平的基因功能筛选已经成熟。而植物中,由于缺乏合适的培养细胞功能检测体系和高通量的转化体系及表型鉴定系统,利用sgRNA文库对植物进行全基因组功能筛选(图1-H)也尚待建立。

3基因组编辑给植物生物技术带来的机遇与挑战

随着1983年世界首例转基因植物——烟草的问世,以转基因为核心的植物生物技术对植物功能基因组研究及农作物品种改良等方面做出了重大贡献。转基因操作通常在植物中引入外源性基因,且转基因在植物基因组中插入是随机的,虽然至今为止,没有证据证明转基因植物是有生物安全性问题,但还是引起公众普遍的关注。美国和欧盟对转基因植物的上市也有非常严格的要求。据统计,在欧盟一个转基因植物从研发到商业化上市大约需要花费1000万欧元。因此,目前只有大的跨国企业有能力进行转基因植物的商业化研发。如前所述,基因组编辑获得的植物材料与自然突变或物理、化学诱变的机理一样,在基因组中也只有部分碱基的添加、缺失或替换,因此,分子检测无法分辨基因组编辑获得的植物突变体与常规突变体。另一方面,因为基因组编辑是对目标基因的定向修饰,这样就不需要常规育种所必需的大规模的分离后代的基因型和表型筛选,大大节约了时间和成本。所以,基因组编辑技术的出现为植物生物技术及作物分子育种提供了前所未有的机遇。同时,基因组编辑与其它先进生物技术结合也可以产生很多意想不到的巨大突破。基因组编辑迅猛发展的势头及其迅速广泛的应用也预示着它将如分子克隆、PCR一样在不远的未来改变植物学研究和植物生物技术的现状。我国应继续保持在该领域的领先地位,促进我国生物产业的发展。

任何新技术的出现都是机遇与挑战并存,基因组编辑的应用也面临着技术优化和政策法规两个层面的挑战。如何提高植物基因组定向修饰的效率及避免脱靶效应成为基因组编辑在产业化应用中亟需解决的关键问题。表达系统与转化方式直接影响对不同植物的定点修饰效率;基因组编辑元件在细胞中的表达水平、目标序列在基因组中的位置和细胞生长的生理阶段都对基因定点修饰效率有很重要的影响;研究者需要根据不同的要求找到最适合于目标植物定点修饰的表达系统及转化手段。基因组编辑在植物中可能产生一定的脱靶效应,脱靶突变的产生可能对基因组编辑在农业中的应用产生严重影响。目前,可以通过靶位点选择、优化FokI切割结构域、改造sgRNA和优化核酸酶的表达水平等方式来减少脱靶效应,但在植物中还需要更加深入系统的研究来解决这些问题。国际上对基因组编辑产生的植物新品种的监管标准存在争议:美国的农业监管部门认为由细胞自我修复机制产生的突变植物不属于转基因,因此,如果不是通过植物病原,如农杆菌等介导的基因组编辑植物不被定义为转基因生物(geneticallymodifiedorganism,GMO)。目前,至少两种基因组编辑的植物产品获得了美国农业部的批准,一个是植酸含量低的玉米品种,另一个是抗除草剂的油菜品种。加拿大也批准了基因组编辑的抗除草剂油菜的商业化。与此相反,欧盟委员会规定非自然方式产生的基因修饰就是GMO,但是他们同时认为物理和化学诱变获得植物突变体不在这个范围内。然而基因组编辑植物与物理和化学诱变获得植物无法区分,因此,欧盟委员会面临一个两难的境地,对基因组编辑植物的监管标准存在不确定性。但最近,欧盟委员会也倾向基因组编辑植物不被定义为GMO。而在我国,目前还没有监管基因组编辑植物的相关政策法规出台。放眼未来,基因组编辑技术能使我们对植物基因组特定位点进行精准、高效的改造,其在作物改良育种中的优势是无可比拟的。因此,国家需要制定出合理的监管制度来积极规范和推动基因组编辑植物新品种的研发。同时,研究人员和监管机构也应该帮助和促进公众对新技术的理解,从而提高社会认可度。

作者程曦、王文义、邱金龙单位系中国科学院微生物研究所植物基因组学国家重点实验室,原文链接:http://biotech.caas.cn/CN/abstract/abstract10632.shtml

来源:生物技术通报

相关文章