科研小助手原创 如需本文参考文献请在公众号内回复“160310”或者在文章末尾的留言区留下您的邮箱,小编看到之后会通过邮箱发给您哦~ 研究基因功能最常用的方法便是减少或者阻断基因的正常表达,然后进行表型分析,从而研究其功能。十几年来,RNAi一直是实验室的首选技术,其也是这一领域的王者。然而新兴技术的涌现(尤其是基于CRISPR的技术)正在逐渐瓦解RNAi的统治地位。日新月异的技术发展为生物学研究提供了越来越大的助力,但也给研究者们带来了一个有些纠结的问题,“到底应该选择那一种技术呢”。本文主要介绍了这几种技术的利弊并且教你如何正确选择适合你的技术。 RNAiRNAi是在研究秀丽新小杆线虫(C. elegans)反义RNA(antisense RNA)的过程中发现的,由dsRNA介导的同源RNA降解过程。1995年,Guo等发现注射正义RNA(sense RNA)和反义RNA均能有效并特异性地抑制秀丽新小杆线虫par-1基因的表达,该结果不能使用反义RNA技术的理论做出合理解释。直到1998年,Fire等证实Guo等发现的正义RNA抑制同源基因表达的现象是由于体外转录制备的RNA中污染了微量dsRNA而引发,并将这一现象命名为RNAi。 病毒基因、人工转入基因、转座子等外源性基因随机整合到宿主细胞基因组内,并利用宿主细胞进行转录时,常产生一些dsRNA。宿主细胞对这些dsRNA迅即产生反应,其胞质中的核酸内切酶Dicer将dsRNA切割成多个具有特定长度和结构的小片段RNA(大约21~23 bp),即siRNA。siRNA在细胞内RNA解旋酶的作用下解链成正义链和反义链,继之由反义siRNA再与体内一些酶(包括内切酶、外切酶、解旋酶等)结合形成RNA诱导的沉默复合物(RNA-induced silencing complex,RISC)。RISC与外源性基因表达的mRNA的同源区进行特异性结合,RISC具有核酸酶的功能,在结合部位切割mRNA,切割位点即是与siRNA中反义链互补结合的两端。被切割后的断裂mRNA随即降解,从而诱发宿主细胞针对这些mRNA的降解反应。siRNA不仅能引导RISC切割同源单链mRNA,而且可作为引物与靶RNA结合并在RNA聚合酶(RNA-dependent RNA polymerase,RdRP)作用下合成更多新的dsRNA,新合成的dsRNA再由Dicer切割产生大量的次级siRNA,从而使RNAi的作用进一步放大,最终将靶mRNA完全降解。 Off-target effects(脱靶效应)最早由Dharmacon科学家Jackson和他的同事们提出(Fedorov,Y.,et al. 'Off-targeting By siRNA Can Induce Toxic Phenotype.' RNA Accepted (2006).)。他们给细胞转染特定基因的单条siRNA后运用全基因组芯片检测技术鉴定表达上调/下调1.5到3倍的靶基因数量。研究人员发现在这种情况下有大量的基因被非特异性的调控着。siRNA正义链和反义链与脱靶基因的互补水平有高有低,并且每条siRNA所引发的脱靶基因表达谱也不尽相同,反映了序列依靠性的脱靶效应。 TALENTALENs中文名是转录激活因子样效应物核酸酶,TALENs是一种可靶向修饰特异DNA序列的酶,它借助于TAL效应子一种由植物细菌分泌的天然蛋白来识别特异性DNA碱基对。TAL效应子可被设计识别和结合所有的目的DNA序列。对TAL效应子附加一个核酸酶就生成了TALENs。TAL效应核酸酶可与DNA结合并在特异位点对DNA链进行切割,从而导入新的遗传物质。 典型的 TALEN由一个包含核定位信号(Nuclear localization signal, NLS)的N端结构域、一个包含可识别特定DNA序列的典型串联TALE重复序列的中央结构域,以及一个具有FokI核酸内切酶功能的C端结构域组成。不同类型的TALEN元件识别的特异性DNA序列长度有很大区别。一般来说,天然的TALEN元件识别的特异性DNA序列长度一般为17-18bp;而人工TALEN元件识别的特异性DNA序列长度则一般为14-20bp。 图1,TALEN的结构。(A)与靶点DNA(灰色显示,PDB ID:3UGM)结合的TALE蛋白。每一个独立的TALE重复序列元件包含33到35个氨基酸残基,这些TALE重复序列元件能够通过两个高变异度的残基(即重复可变双残基,RVD,棍状显示)来识别一个单一的碱基对。(B)TALE核酸酶(TALEN)形成二聚体结合DNA的动画演示。TALEN目标位点由两个TALE结合位点组成,这两个位点间通过不同长度的间隔区序列(12-20bp)分开。TALE可以被设计成仅仅识别左半侧位点或右半侧位点。图片来源: Thomas Gaj, Charles A. Gersbach, and Carlos F. Barbas III. (2013) ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in Biotechnology, 31(7): 397-405. TALEN技术的原理并不复杂,即通过DNA识别模块将TALEN元件靶向特异性的DNA位点并结合,然后在FokI核酸酶的作用下完成特定位点的剪切,并借助于细胞内固有 的同源定向修复(HDR)或非同源末端连接 途径(NHEJ)修复过程完成特定序列的插入 (或倒置)、删失及基因融合(图2)。 图2,TALEN进行基因组编辑的原理。利用位点特异性核酸酶可以进行基因组编辑,而核酸酶诱导的DNA双链断裂(DSB)可由同源定向修复(HDR)或非同源末端连接途径(NHEJ)来修复。(A)在供体质粒(donor plasmid)暴露出延长的同源臂(homology arm)的情况下,HDR可能导致插入的单个或多个转基因发生改变或取代原有的基因。(B)在缺失供体质粒的情况下,NHEJ介导的修复会产生小的插入或删失突变,并可能导致目标基因被破坏;在有双链寡核苷酸或线状供体质粒存在的情况下,这些DNA片段可能通过NHEJ介导的连接反应插入;同时诱导两个DSB的产生则会引起删失、插入和易位突变。图片来源:Thomas Gaj, Charles A. Gersbach, and Carlos F. Barbas III. (2013) ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in Biotechnology, 31(7): 397-405. TALEN技术的核心原理就是在同一个蛋白(TALEN)上有序地实现引导进入细胞核、靶位点DNA的特异性识别和靶位点DNA的切割这三个不同的功能,这一点在上述TALEN典型结构一节中已作了较为详细的描述。在具体操作中,例如在实验室条件下,实现TALEN的关键就在于完成DNA的特异性识别功能,一般说来分为两个步骤。图3与图4分别以“铂金门”TALEN构建系统(Platinum Gate TALEN construction system)和商业化的easyT体系为例,展示了实验操作中TALEN元件的构建。 图 3,“铂金门”TALEN构建系统TALEN元件构建操作示意图。步骤一,四个或更少的组件被连接到阵列质粒(array plasmid)上;步骤二,构建好的阵列随后被连接到哺乳动物表达载体中;白色和粉色的长方形分别表示在BsaI和Esp3I限制性内切酶切割后留下的粘性末端;蓝色字母代表RVD,红色字母代表non-RVD变化,黄色长方形代表后一半重复。图片来源:Tetsushi Sakuma, Hiroshi Ochiai, Takehito Kaneko, Tomoji Mashimo, Daisuke Tokumasu, et al. (2014) Repeating pattern of non-RVD variations in DNA-binding modules enhances TALEN activity. Science Report, 3(3379): 1-8. 图 4,“easyT” TALEN构建系统TALEN元件构建操作示意图。(A)包含一个长度为18.5个组件的TALE重复元件的TALEN体系示意图。该TALE重复元件由20个单体单位(monomer unit)组装而成。单体单位的边界在组装过程中发生了移位。(B)TALEN克隆示意图。第一步,由四个单体通过连接反应组装成4聚体;第二步,4聚体(4-mers)进行PCR扩增,琼脂糖凝胶电泳,胶回收并浓缩;最后,在第二次连接反应中,4聚体被组装到TALEN骨架质粒(backbone plasmid)上;黄色和蓝色箭头分别表示4聚体扩增时的正向引物与反向引物。图片来源:Tomonori Katsuyama, Arslan Akmammedov, Makiko Seimiya, Samuel C. Hess, Cem Sievers and Renato Par. (2013) An ef?cient strategy for TALEN-mediated genome engineering in Drosophila. Nucleic Acids Research, 41(17): e163-171. 构建TAL靶点识别模块 TAL的DNA特异性识别单位是间隔32个恒定氨基酸残基的二联氨基酸。二联氨基酸与AGCT这4个核苷酸碱基有一一对应的关系:腺嘌呤(A)由NI识别、胸腺嘧啶(T)由NG识别、鸟嘌呤(G)由NN识别,而胞嘧啶(C)则由HD识别。实验操作中,我们通过 靶位点的DNA序列可以反推能特异性识别这一序列的二联氨基酸序列,从而构建TAL靶点识别模块。 TAL靶点识别模块的克隆与表达 根据之前对TALEN结构的介绍,我们需要将上一步骤中根据目标DNA序列构建好的一对TAL靶点识别模块与N端的核定位序列、C端的FokI酶连接起来,才能得到一个完整的TALEN元件。一般来说,我们可以采用专门用于构建TALEN的真核表达载体体系,将一对特异性的TAL靶点识别模块克隆进该载体中,再通过转染等方式导入细胞内。这种体系一般由供体质粒(donor plasmid,提供单基、二联及三联等类型的TAL模块)和骨架质粒(backbone plasmid,用于构建TALEN并表达构建好的TALEN)两类质粒构成,常用的TALEN体系有RCIscript-GoldyTALEN和pC-GoldyTALEN、TAL5-BB和pTAL6-BB及pCS2TAL3-DD和pCS2TALE-RR等。 CRISPR/Cas9CRISPR/Cas9 是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御,可用来对抗入侵的病毒及外源DNA。CRISPR/Cas9系统通过将入侵噬菌体和质粒 DNA的片段整合到CRISPR中,并利用相应的CRISPR RNAs(crRNAs)来指导同源序列的降解,从而提供免疫性。 CRISPR/Cas系统最早是在细菌的天然免疫系统内发现的,其主要功能是对抗入侵的病毒及外源DNA。1987年大阪大学(OsakaUniversity)的研究人员在E.coliK12的碱性磷酸酶基因附近发现了成簇的规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeat, CRISPR),其结构如图5所示,目前普遍认为有40%的细菌基因组具有这样的结构。
CRISPR/Cas系统由CRISPR序列元件与Cas基因家族组成。其中CRISPR由一系列高度保守的重复序列(repeat)与同样高度保守的间隔序列(spacer)相间排列组成。而在CRISPR附近区域还存在着一部分高度保守的CRISPR相关基因(CRISPR-associated gene, Cas gene),这些基因编码的蛋白具有核酸酶活性的功能域,可以对DNA序列进行特异性的切割。 CRISPR/Cas作为原核生物中普遍存在的一种系统,最初的功能就是识别外源性入侵的核酸序列,并对其进行特异性降解,以达到抗病毒的作用。这一过程分两步进行——crRNA的合成及在crRNA引导下的RNA结合与剪切,具体机制如图6所示,包含crRNA的生物学合成和RNA的结合与剪切两大步骤。
crRNA的生物学合成 CRISPR区域第一个重复序列上游有一段CRISPR的前导序列(Leader sequence),该序列作为启动子来启动后续CRISPR序列的转录,转录生成的RNA被命名为CRISPRRNA(简称crRNA)。 RNA的结合与剪切 CRISPR/Cas系统中crRNA与tracrRNA(反式激活的crRNA)形成嵌合RNA分子,即单向导RNA(Single guide RNA, sgRNA)。sgRNA可以介导Cas9蛋白在特定序列处进行切割,形成DNA双链断裂(Double-Stranded Break, DSB),完成基因定向编辑等的各类操作。 根据功能元件的不同,CRISPR/Cas系统可以分为I类系统、II类系统和III类系统。这三类系统又可以根据其编码Cas蛋白的基因不同而分为更多的亚类。不同类型CRISPR/Cas系统完成干扰的步骤也有所不同(图7)。
I类和III类CRISPR/Cas系统进行干扰时只需要crRNA和Cas蛋白两种元件的参与,而II类CRISPR/Cas系统包括crRNA、tracrRNA和Cas蛋白三种元件。其中II类CRISPR/Cas系统最先在改造后用于小鼠和人类基因组编辑,同时也是目前研究最为充分的系统。根据Cas蛋白的类型不同分为三个亚类:II-A类含有Cas1、Cas2、Cas9和Csn2样蛋白;II-B类含有Cas1、Cas2、Cas4和Csx12样Cas9四种蛋白;II-C类则有Cas1、Cas2及Cas9三种蛋白。此外,II类CRISPR/Cas系统也是目前最常用于人工基因组编辑的CRISPR/Cas系统,其靶向基因组编辑的步骤如图8所示。
最后附一张表格来指导各位如何选择各项技术!
1. Boettcher M, McManus MT. Choosing the Right Tool for the Job: RNAi, TALEN, or CRISPR. Molecular cell 2015; 58:575-585. 2. Lagana A, Shasha D, Croce CM. Synthetic RNAs for Gene Regulation: Design Principles and Computational Tools. Frontiers in bioengineering and biotechnology 2014; 2:65. 3. Gaj T, Gersbach CA, Barbas CF, 3rd. ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in biotechnology 2013; 31:397-405. 5. Katsuyama T, Akmammedov A, Seimiya M, Hess SC, Sievers C, Paro R. An efficient strategy for TALEN-mediated genome engineering in Drosophila. Nucleic Acids Res 2013; 41. 6. Barrangou R, Horvath P. CRISPR. New Horizons in Phage Resistance and Strain identification. Annu Rev Food Sci T 2012; 3:143-162. 7. Richter H, Randau L, Plagens A. Exploiting CRISPR/Cas: Interference Mechanisms and Applications. Int J Mol Sci 2013; 14:14518-14531. 8. 部分资料参考自网络 |
|