感谢吉林大学生命科学学院博士、吉林药学院孟老师提供的NCBI使用心得 NCBI官网 https://www.ncbi.nlm./ 打开页面后如图 点击下黑色下三角 主要三个重要选项Gene,PMC,Pubmed PMC 是下载文献的里面所有文献都是免费的,适用于我这种没订阅期刊网的。 Pubmed 适用于你下载文献。 主要教你Gene 一、在Gene后面对话栏中,输入你感兴趣基因或者蛋白eg LOX1点击 search 跳出对话框如图 搜索出很多这种蛋白。 1 确定这是你需要的蛋白。 2 注意观察后缀,红色圈部分,给出了你基因所在物种信息。选择你需要的物种,如人 Homo sapiens(human)或小鼠,大鼠,斑马鱼等。 二、在确定是你关心的基因(物种和基因缩写都对)后,点击该基因ID如下图红圈部分。 进入新界面。 三、进入新界面后,会有很多信息需要注意, 1 首先是该基因的一些信息,还有其他常用名,比如下图红色部分。 本来这个基因官方缩写是OLR1,但是它也叫做LOX1. 2 下拉网页,这里说明它位于12号染色体上。 3 下拉网页到这里如图。 红色圈,绿色圈,蓝色圈都可以点击进去获得蛋白,还有核酸的全部信息。 其实万变不离其宗,点红,绿,蓝三个圈中哪个都能获得你想要的基因背景信息。 比如点击红色的,会进入新的界面。 GenBank.1 教育GenBank页面使用,点击红框,GenBank 刷新页面,下拉网页至这里 这里说明这个基因在12号染色体上,全长13892. GenBank.2 下拉网页到这里 1-190,3017-3118等等这些都是mRNA的外显子,这个基因是由6个外显子构成的。 就是红色方框内的信息。191-3016属于DNA的内含子部分。它在转录成mRNA后被剪切掉不翻译了。 这个蛋白LOX1整体是由6个外显子合并而成的,但是蛋白分成不同亚型。不同亚型是由不同外显子拼接的,举个例子1亚型由1,2,4,5外显子组合,2亚型由1,2,3,6组成等等。 GenBank.3 下拉网页到这里 这里是CDS区,它是外显子内部分,是mRNA中翻译蛋白的部分。 你看那这也是6个外显子。轻重3017-3118,5235-5480,11267-11406,11730-11845 也就是外显子2,3,4,5跟mRNA完全一致。 不同的是1,6外显子比mRNA短。比如mRNA 1外显子是1-190,CDS 1外显子是115-190(这段就是信号肽序列,起始密码子Met)。其中1-115是mRNA不翻译蛋白的结构部分,如核糖体结合部位。同理mRNA 6外显子是12171-13892,CDS 1外显子是12171-12312。其中12321-13892是mRNA不翻译蛋白的部分如ployA。 介绍概念CDS,CDS不同于ORF CDS从mRNA第一个其实密码子开始AUG到最后终止密码子TAA(TGA,TAG)终止,核酸序列是准确表达蛋白序列。ORF随意只要有AUG及开始一段核酸序列。 举个例子如这段序列 UUG AUG TAG ATG TAU GGC TCC UAG TAA 蓝色字部分是CDS 也可以称作一段ORF, 下划线可以叫做另一段ORF。 GenBank.4 下拉网页至如下部分如图 这是该基因DNA全序列 GenBank.5 上拉该网页至上部如图位置,点击蓝色圈框部分“highlight”就可以知道DNA上哪些是RNA部分。点击后页面刷新,DNA部分发生改变如图。 CDS区被褐色背景了,同时给出蛋白序列。 以上就是GenBank教学。学会了你就能掌握不同mRNA所在DNA位置跨了多少bp内含子,便于realtimePCR 引物设计,防止DNA污染。Realtime PCR引物最好跨越一个1000 bp内含子,并且mRNA片段长度100-200bp。防止DNA污染。 4 回到初始NCBI页面,下拉菜单至 如图,下面就是LOX1蛋白的一些异构体,如isoform2,isoform1,isoform3等。 NM001172632.1点击里面是LOX1异构体1 的(isoform1)mRNA序列 点击highlight刷新网页,就能得到蛋白序列,及翻译蛋白的CDS区。同时给出蛋白序列。 NP001166103.1 点击里面是蛋白序列,刷新网页就可以得到蛋白序列 如图 5 最后还有个值得学习的地方 回到原始界面点击如图红圈部分“CCDS53745.1”
这里面就是该异构体isoform2里面的546nt的CDS区和181个氨基酸的蛋白序列。
|
|
来自: 生命科学技术集 > 《protocol》