分享

chipBase:转录调控数据库

 生信修炼手册 2019-12-24

转录调控是生命活动中重要的调控机制,通过chip_seq数据,我们可以得到转录因子或者组蛋白修饰和基因之间的调控关系。chipBase数据库收集了来自10个物种共一万多个样本的chip_seq数据,整理出了转录因子和各种基因,包括蛋白编码基因,lncRNA,miRNA, tRNA等ncRNA之间的调控网络,该数据库网址如下

http://rna./chipbase/index.php

该数据不仅提供了转录因子和各种基因的调控网络,还提供了转录因子结合位点和motif的信息,同时利用TCGA数据库中的RNA_seq数据,分析了转录因子和基因之间的共表达关系,整个数据库的构建流程示意如下

chip_seq数据包含了两种类型,一种是转录因子,另外一种是组蛋白修饰,从chip_seq的数据中,可以分析得到结合位点的区域,称之为peak。

通过转录因子结合位点,可以进一步分析结合区域的motif, 还可以通过peak区域的基因注释,得到转录因子和各种基因之间的调控关系。

该数据库将基因分成了以下几类

  1. LncRNA

  2. miRNA

  3. OtherNcRNA

  4. Protein

每个类别对应一个子菜单,以LncRNA为例,可以检索得到某个转录因子与lncRNA之间的调控关系,检索框示意如下

通过chip_seq数据分析转录因子与基因的调控关系,实际上是通过对peak区间进行基因注释得到的,由于结合位点位于基因的附近,所以通常会指定一个区域,比如上下游各延伸1kb, 如果两个区间重叠,就认为二者之间存在一个调控关系。

检索结果示意如下,给出了转录因子CTCF所有可能调控的lncRNA

通过Regulator菜单,可以检索调控某个基因的所有转录因子,以TP53为例,检索结果示意如下

通过Motif菜单,可以查看转录因子motif分析的结果,结果示意如下


除此之外,官网还提供了以下两个工具

1. ChIP-Function

对转录因子所有调控的靶基因,进行GO富集分析,结果示意如下

2. Co_Expression

利用从TCGA等公共数据库中整理的约2000个RNA_seq的表达谱数据,分析指定基因的共表达关系, 结果示意如下

通过计算pearson相关系数和线性回归来分析两个基因表达量之间的相关性,并给出如下所示的结果

通过chipBase数据库,可以方便的查看转录因子和各种基因之间的调控关系。

·end·

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多