分享

lncRNA和miRNA共表达分析靠谱吗?

 微笑如酒 2019-06-28
 2017-01-05

OmicShare问答第四期

lncRNA测序数据挖掘

OmicShare问答栏目由各位OmicShare网友在线交流课堂中,问交流嘉宾的问答整理。旨在解答众网友的疑问,普度众生。所以,你来问我呀。

OmicShare网址:www.omicshare.com

问1:super-enhancer会被转录为RNA吗?

答:是的。 已经有相关报道表明,enhancer通过产生 enhancer RNA(来源增强子的lncRNA)来起到转录增强的调控作用。因此,Super enhancer 极有可能被转录为 lncRNA。

问2:有没有对疑似lncRNA进行分析的数据库?

lncRNA的鉴定主要包括:1)同源比对;2)编码蛋白能力的预测。

前者,主要是是一些序列收录的数据库,例如 noncode 数据库。如果能在这些数据库中找到同源序列,就可以对lncRNA 进行初步的判定;

如果是后者,还是需要自己使用一些软件,例如 CPC ,进行分析。暂时还没有听说,哪些数据库提供蛋白编码能力预测的分析。

问3:怎么做lncRNA的功能?有些什么机制?好像筛出来lncRNA但机制并不好做。

答:包括:敲除,过表达、pulldown 等。只要在 CNS 级别的期刊,一般在找到候选lncRNA后,会有详细的功能验证试验。机制验证的试验当然不好做,要找到正确的候选lncRNA,且试验比较耗费时间。难度越大,文章回报也越高。

问4:对于lncRNA,预测的RPKM值低于多少认为其没有表达?

答: 这个要看需要,一般情况0.01以下就可以认为不表达。

问5:测序出来的结果包括lncRNA和mRNA,那是不是测序的数据量要比普通的mRNA测序要大?

答:是的。目前大部分测序公司推荐的lncRNA测序量是10g。推荐测10g有2个原因吧。第一个原因,因为毕竟同时测lncRNA与mRNA本身信息比较大,自然需要更大的数据量;另外lncRNA表达量相对低一点,所以需要测到lncRNA的话,理论上就需要更深的数据量。但同时有个问题,因为测lncRNA是采用去核糖体RNA的方法,去核糖体RNA的方法无法保证能够把核糖体去得干干净净的,所以最后的测序数据里面都会多多少少比较多的核糖体的残留,那意味着我们有效的数据就偏少,所以需要比较大的数据来保证有效数据。就是说测得多才能保证剩下的数据是足够的。

问6:对于那些lncRNA表达量大,而它的靶标表达量小,这种也算共表达吧?

答:共表达并不是指的表达量,而是表达趋势,当然量太小也没有意义。

问7:lncRNA可以在原核中做不?

答:纯分析的角度是可以的。但是目前我们接触到的文献关于原核生物lncRNA的报道还比较少,所以说在原核生物上做lncRNA还是有风险的。并不是说不能做,而是说担心没有或很少。另外,我们都知道用原核生物来做转录组的话本身就是去核糖体的策略,因为原核生物编码基因也没有poly-A尾结构,所以如果你做原核转录组测序的话,也是可以顺便分析一下lncRNA,这个是没有问题的。

问8:请问,针对含有病菌的叶片组织,能否有效去除或者区分病菌的lncRNA?能否一个同时针对病菌和植株进行lncRNA分析?

答:嗯,这个问题问得挺好的。因为这个也是病原宿主互作经常遇到的问题。理论上来说,你的叶片是有病菌感染的,做了测序之后是可以将病原与宿主的基因测出来的。不过最大的问题是,微生物的基因丰度会非常低。这里分析的话有2个难点,一个是必须保证微生物的丰度基因足够多,那意味着你取样要很准,如果取样不准的话,你取样组织里面大量是健康的植物细胞,只有一部分是有微生物感染的,那么在你最后提的RNA里面,微生物的基因丰度极低,极低的话意味着你通过测序的话,病菌的RNA将检测不到或检测太低,那么表达量的信息就不准,所以第一个就是这个微生物问题。

然后第二个问题是,能够有效区分、去除病菌的lncRNA,去除病菌的lncRNA的话意味着病菌要有参考基因组,如果没有参考基因组,也就没有办法对病菌lncRNA进行分析的。

问9:许多lncRNA与mRNA是有重叠的,因此在设计引物做RT的时候,是不是要避开这部分重叠的部分?

答:这个问题也问得非常好,我们认为由2种情况,第一种lncRNA与mRNA如果在反义链上还好,比如一个在正链上,一个在反链上,因为有5‘ 3’,所以这个设计引物是没有问题的。如果是第二种情况,应该找两种序列特异的部分设计引物。 

问10:如果从单核糖体和多核糖体上分离RNA来做测序,只发现一个lncRNA,这种数据准吗?

答:这个问题很难回答。因为现在核糖体相关的RNA测序也是目前比较火的一个技术。目前这个技术更多的是研究与核糖体结合的mRNA。目前做过转录组和蛋白组关联分析的老师应该清楚,他们之间的转录组与蛋白的关联是非常差的,因为目前蛋白质谱的技术不怎么稳定,所以定量不是很准;另外从mRNA到蛋白中间经历了很多转录或修饰等等变化,所以蛋白的表达量与mRNA的表达量相关性很差,所以目前采取核糖体mRNA来测序的技术。据文献报道这种测序技术,结果是与蛋白相关性很强的,因为,既然是mRNA结合在核糖体上,那么基本上认为是可以翻译的。但是如果说找到一条lncRNA,这个到底准不准不好说,也有可能吧。因为lncRNA功能很多,在某些情况下是可以翻译一些小肽的,所以我认为说分离出lncRNA是正常的。

问11:lncRNA和miRNA共表达分析,据说不靠谱,不太可信,是不是这样?

答:我的观点是,所有的生物信息分析都是预测。这个不靠谱取决于样本量,样本量越少假阳性越多,样本量越多假阳性越少。然后是后续的数据解读吧。

问12:那如果一个物种即做了转录组,又做了蛋白组,怎么解释和取舍?

答:不同的分析使用不同的算法,取舍不一样。我的建议是,整体还OK的话,就写一篇文章吧,但如果一致性真的很差的话,那么你就写2篇文章。

问13:在转录组数据中,通过后续分析发现unigene里面有内含子,并且有些unigene很长,有超过10000bp,怎么会这样呢?

答:如果unigene超过10k,这个很有可能不是RNA,很有可能是DNA残留,是一条DNA序列,也有一定可能是mRNA前体,但很大可能是一段DNA序列。

问14:如果找到一个lncRNA,如何找到下游靶点来做呢?

答:建议找到lncRNA的话,建议优先从顺式作用考虑,看看周边有没有有意思的mRNA,不过总体来说从lncRNA来找mRNA会比较困难。可能需要双方面来找,建议先别确定某个lncRNA,可以挑几个表达量比较高的lncRNA,再看看周边有没有有意思的mRNA,然后再确定lncRNA来找下游靶点。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多