3.在Genomic一栏中,点击Genbank后,可以看到如下界面,选择send-File-GenBank格式后,可以将序列导出到电脑桌面,这样可以得到基因的DNA序列。在导出序列时有两种格式:GenBnak格式,因为这个格式提供了很多该基因的信息;FASTA格式只含有基因序列。可以根据需求选择。 1.在mRNA and protein一栏中,可以看到BCL2基因有两个转录本NM_000633.2和NM_000633.2 2.点击NM_000633.2,可以查询基因编码区CDS、以及外显子exon等。 比如,近年来异常火爆的cas9技术,是在DNA的水平进行编辑。在验证cas9对基因效率时,一般将突变型与野生型的基因序列交给测序公司,通过分析测序结果判断基因是否发生突变。而为了实现DNA的水平的突变,在进行设计时就会在mRNA序列中的mRNA序列的外显子上进行设计引物,为什么是外显子呢?因为内含子在翻译过程中被剪切,即便发生序列发生改变,功能也不会改变。 1.打开UCSC主页,选择物种,输入基因名称。 2.点击GO之后出现以下界面,点击黑色标注的BCL2。 3.点击后进入以下页面,通过UCSC数据库可以查询该基因的基因组信息,蛋白质数据库UniprotKB相关信息,该基因在不同组织表达的RNA-seq数据,基因芯片数据,蛋白质功能域以及结构,GO富集分析等等内容。 (1)根据查询目的,比如查询基因启动子、UTR、CDS区,点击Genomic sequence。 (2)根据需求选择需要查询的内容,同时可以设置UTR、CDS区等,搜索结果会以大小写形式区分。转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是猜测它的大体位置,比如你要研究promoter区,建议选择转录起始位点前的2000个碱基进行研究。当然如果觉得长度太长,也可以只研究-1000到0这一千个碱基,一般情况下,启动子区的变异都在这个区域内。 在mircroRNA的研究中,最关键的一步是验证mircroRNA与靶基因是否具有调控关系。可以通过将目的基因3’UTR区域构建至载体中报告基因luciferase的后面,通过比较过表达或者干扰miRNA后,监测萤光素酶的活性变化而验证报告基因表达的改变。 (3)如果想要查寻蛋白序列,点击protein即可得到. 当然,如果不满足于获得蛋白质序列,还可以看看蛋白质功能域与3D结构。 蛋白质的许多特性可直接从序列上分析获得,我们根据序列预测蛋白质功能比较该蛋白序列是否与已知功能的蛋白质相似,或者查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。 |
|
来自: baymini777 > 《NCBI专栏》