我们知道,在lncRNA的研究当中,传统的lncRNA相关的ceRNA网络已经算是比较老的研究套路了。那如果在lncRNA这个老树上找到新的方向呢?今天就介绍一个可以预测lncRNA可变剪切的数据库 。这样我们就可以把lncRNA和可变剪切联合起来研究了。 这个数据库就是:LncAS2Cancer(https://lncrna2as./)。该数据库收集了5335个批量RNA测序和1826个单细胞RNA测序样本,涵盖了30多种癌症类型。 在该数据库,我们可以使用不同的选项(如lncRNA类型,可变剪接类型,疾病等),多种检索方法来查询lncRNA的可变剪接事件,且可供下载,当然,该网站也可供用户提交lncRNA的新型剪接事件至LncAS2Cancer。 下面我们就其菜单栏的主要功能进行简单介绍。 1. Search(1)Basic我们可以在搜索栏中直接检索AS ID和感兴趣的区域。可以通过基因名称,Ensembl ID,AS类型,组织,疾病,细胞系,Study ID,测序方法(bulk,single-cell)或数据库(SRA,ENCODE,CCLE)自动搜索AS事件。这里小编以XIST为例,进行简要介绍。选择Gene Name后,输入基因名,点击搜索按钮。 结果如下,每行提供AS事件的详细信息。其中AS事件基于人类参考序列版本hg38构建。 我们可以单击LncAS2Caner ID以查看详细信息。这里以LncAS2Caner ID:790581为例,进行简要介绍。 1) Gene Annotation 这里我们可以查看AS位点的基因信息。 为了显示该基因中的剪接位点,“Visualization”显示该基因的所有潜在剪接事件,“Highlight event”突出显示了该剪接位点以及相关外显子(红色),单击“Study ID”以显示每个研究中潜在的剪接事件。将鼠标悬停在外显子上可以显示具体位置。 “Distribution of Psi”显示给定AS在不同组织和疾病中PSI(Percent Spliced In)值的分布。PSI指剪切百分比,是可以量化可变剪切的指标。 2)Alternative Splicing Annotation 该部分显示了剪接位点的详细信息。可靠分数越高,意味着剪接事件越可信。 exonStart:发生SE事件的起始位置; exonEnd:发生SE事件的终止位置; upstreamES:发生SE事件上游exon的起始位置; upstreamEE:发生SE事件上游exon的终止位置; downstreamES:发生SE事件下游exon的起始位置; downstreamEE:发生SE事件下游exon的终止位置。 “Sashimi plots”显示了在某研究中不同组别之间该剪接位点的显著事件。 当该研究中有临床数据时,将显示剪接事件的生存分析(根据PSI的中位数将其分为高低表达两组),如下图所示。若没有生存数据,则该部分不显示。 3)Genome Browser 此部分显示该lncRNA的基因,转录本信息,lncRNA-miRNA相互作用以及RNA结合蛋白,体细胞变异等多种信息。其中剪接区域突出显示。 (2)Advanced 可以输入区域,基因名和/或选择数据库,可变剪接类型,测序方法,疾病和/或细胞系来搜索数据。有效值可用于搜索重要事件。也可以选择组织或单击图像左侧的条形图以检索数据。 (3)Quick search API和Batch search我们在Tools内再详细介绍。我们也可以在首页的搜索框内进行检索,整体与Basic search差不多。 2. Tools (1)Blast 输入目的序列以对LncAS2Caner中的AS事件进行blast。 (2)Batch search 可以批量搜索(基因名称,Ensembl ID,LncRNA类型,组织,疾病,细胞系,测序方法,AS类型,AS ID)。例如,我们可以在Acute_lymphoblastic_leukaemia中搜索两个lncRNA的剪接事件:XIST,TUG1。 (3)API 根据URL以获取数据。 我们只需要在网址栏内输入网址:https://lncrna2as./tools/api.php/a5ss?gene_name=SNHG1;disease=lung_cancer,运行后即可得到基因为SNHG1的A5SS在肺癌中的数据。 当然,想对上述数据进行下载的话直接复制粘贴至txt格式,然后用EXCEL打开即可。 3. Download 在此部分中,我们可以从GENCODE和FANTOM下载不同的可变剪接事件及研究的原始数据计数。整个数据集也可以在该数据库的Figshare中下载。 4. Submit 在这里可以我们将自己的数据提交到LncAS2Caner。其中红色区域是必填的哦!
|
|