RIP-seq研究的是什么? RIP-seq(RNA免疫沉淀结合高通量测序)是研究RNA结合蛋白的一种技术,可获得RNA结合蛋白结合(调控)的RNA,以及结合的位置、结合基序,结合强度等信息。 RIP-seq使用目的蛋白特异性抗体与样本孵育,使抗体与目的蛋白结合,然后磁性分离抗体及其结合的目的蛋白,目的蛋白结合的RNA也一并被分离出来,这样我们就获得了目的蛋白和它结合的RNA片段。 RNA片段洗脱、建库、测序,便知目的蛋白结合哪些RNA,结合强度、结合位置、结合基序等丰富的信息,进而还能进行差异结合分析、GO富集分析、KEGG通路富集分析。 1. RNA免疫沉淀获取目的蛋白 RIP和ChIP的流程类似。我们会首先裂解细胞,释放细胞内所有物质。为了保证免疫沉淀的特异性和效率,我们需要将细胞裂解产物分为几份,设置对照。 第一份我们不进行后续免疫沉淀(IP),作为初始对照(或阳性对照)用于了解样本IP前的情况; 第二份进行IP,即使用特异性抗体富集目的蛋白; 第三份同样进行IP,但是不使用特异性抗体,而是使用IgG进行IP。 免疫沉淀后,一方面,要对富集的蛋白进行WB质检,检测IP的特异性和目的蛋白的富集效果。 另一方面,还要提取RNA进行定量、构建测序文库,并对文库质检。 WB质检结果:
IP与Input比较可判断IP效率(是否有效富集),IgG做阴性对照可判断IP的特异性(是否为特异性富集)。经过这些对照层层把关,RIP实验、RIP-seq的结果才能更有保障、更加高质、可靠。 WB质检结果展示 文库质检结果展示 2. Peak Calling锁定目的蛋白结合的RNA IP富集的RNA就是目的蛋白结合的RNA了? 并不是,或者说并不完全是。 RIP确实会对目的蛋白结合RNA产生富集,那么在参考基因组上、蛋白结合的区域,测序reads的覆盖度升高,相对其他区域形成明显的“峰”。 但是由于RNA表达量本身存在差异,扩增、测序过程又引入偏好,非富集区域的reads覆盖也可能存在高高低低的“峰”,这无疑对筛选结合峰(Peak calling)产生严重干扰。 我们来举个例子:样本中有A mRNA共10条,均被目的蛋白结合,且都被IP下来,样本中还有B mRNA共 100条,其中只有10条被目的蛋白结合,也都被IP下来。目的蛋白对A、B mRNA的结合数目一样,但结合比例明显有天壤之别。这时我们再评判目的蛋白对A、B mRNA的结合,就需要考虑A、B mRNA表达的差异了。 Peak calling时我们会对比input和IP归一化后的reads平均覆盖深度,将input作为背景,进行Peak calling,将input产生的背景“峰”过滤,避免RNA表达等背景因素产生假阳性结果。 如上图所示,IP的reads在蓝色区域和灰色区域的分布较为相似,input的reads数则有较大差异。在蓝色区域,我们通过对比IP和input可以筛选出Peak;但是在灰色区域,因input本身有峰,对比IP和input后发现无法筛选到正真的Peak。 3. 数字标签UMI还原RNA原始丰度 其实,康测科技在建库时还留了一手,给文库片段都标记了数字标签(UMI)。 RNA结合蛋白对RNA序列是有选择性的,会倾向于结合具有某些特征的序列,因此RIP测序文库碱基平衡性通常不佳,PCR扩增偏好会导致比转录组测序更为严重的测序偏差,因此,UMI的使用也更加必要。 数据分析前,我们先根据数字标签追溯reads来源,同一个片段经过PCR扩增的产物均带有同一UMI,我们根据UMI便能精确追踪reads的来源,对那些由于PCR扩增偏好等种种原因产生的异常扩增的reads归类和去重,再以真实的序列丰度进行Peak calling,达到绝对定量检测。 做到这些,我们才算真正准确锁定了目的蛋白结合的RNA。 |
|