分享

NCBI使用心得

 生命科学技术集 2023-10-24 发布于吉林

感谢吉林大学生命科学学院博士、吉林药学院孟老师提供的NCBI使用心得

NCBI官网

https://www.ncbi.nlm./

打开页面后如图

点击下黑色下三角

主要三个重要选项Gene,PMC,Pubmed

PMC 是下载文献的里面所有文献都是免费的,适用于我这种没订阅期刊网的。

Pubmed 适用于你下载文献。

主要教你Gene

一、在Gene后面对话栏中,输入你感兴趣基因或者蛋白eg LOX1点击 search

跳出对话框如图

搜索出很多这种蛋白。

1 确定这是你需要的蛋白。

2 注意观察后缀,红色圈部分,给出了你基因所在物种信息。选择你需要的物种,如人 Homo sapiens(human)或小鼠,大鼠,斑马鱼等。

二、在确定是你关心的基因(物种和基因缩写都对)后,点击该基因ID如下图红圈部分。

进入新界面。

三、进入新界面后,会有很多信息需要注意,

1 首先是该基因的一些信息,还有其他常用名,比如下图红色部分。

本来这个基因官方缩写是OLR1,但是它也叫做LOX1.

2 下拉网页,这里说明它位于12号染色体上。

3 下拉网页到这里如图。

红色圈,绿色圈,蓝色圈都可以点击进去获得蛋白,还有核酸的全部信息。

其实万变不离其宗,点红,绿,蓝三个圈中哪个都能获得你想要的基因背景信息。

比如点击红色的,会进入新的界面。

GenBank.1 教育GenBank页面使用,点击红框,GenBank

刷新页面,下拉网页至这里

这里说明这个基因在12号染色体上,全长13892.

GenBank.2 下拉网页到这里

1-190,3017-3118等等这些都是mRNA的外显子,这个基因是由6个外显子构成的。

就是红色方框内的信息。191-3016属于DNA的内含子部分。它在转录成mRNA后被剪切掉不翻译了。

这个蛋白LOX1整体是由6个外显子合并而成的,但是蛋白分成不同亚型。不同亚型是由不同外显子拼接的,举个例子1亚型由1,2,4,5外显子组合,2亚型由1,2,3,6组成等等。

GenBank.3 下拉网页到这里

这里是CDS区,它是外显子内部分,是mRNA翻译蛋白的部分。

你看那这也是6个外显子。轻重3017-3118,5235-5480,11267-11406,11730-11845 也就是外显子2,3,4,5mRNA完全一致。

不同的是1,6外显子比mRNA短。比如mRNA 1外显子是1-190CDS 1外显子是115-190(这段就是信号肽序列,起始密码子Met)。其中1-115mRNA不翻译蛋白的结构部分,如核糖体结合部位。同理mRNA 6外显子是12171-13892CDS 1外显子是12171-12312。其中12321-13892mRNA不翻译蛋白的部分如ployA

介绍概念CDSCDS不同ORF

CDSmRNA第一个其实密码子开始AUG到最后终止密码子TAATGA,TAG)终止,核酸序列是准确表达蛋白序列。ORF随意只要有AUG及开始一段核酸序列。

举个例子如这段序列 UUG AUG TAG ATG TAU GGC TCC UAG TAA 蓝色字部分是CDS 也可以称作一段ORF, 下划线可以叫做另一ORF

GenBank.4 下拉网页至如下部分如图

这是该基因DNA全序列

GenBank.5 上拉该网页至上部如图位置,点击蓝色圈框部分“highlight就可以知道DNA上哪些是RNA部分。点击后页面刷新,DNA部分发生改变如图。

CDS区被褐色背景了,同时给出蛋白序列。

以上就是GenBank教学。学会了你就能掌握不同mRNA所在DNA位置跨了多少bp内含子,便于realtimePCR 引物设计,防止DNA污染。Realtime PCR引物最好跨越一个1000 bp内含子,并且mRNA片段长度100-200bp。防止DNA污染。

4 回到初始NCBI页面,下拉菜单至

如图,下面就是LOX1蛋白的一些异构体,如isoform2,isoform1,isoform3等。

NM001172632.1点击里面是LOX1异构体1 的(isoform1mRNA序列

点击highlight刷新网页,就能得到蛋白序列,及翻译蛋白的CDS区。同时给出蛋白序列。

NP001166103.1 点击里面是蛋白序列,刷新网页就可以得到蛋白序列

如图

5 最后还有个值得学习的地方

回到原始界面点击如图红圈部分CCDS53745.1


刷新进入新界面

这里面就是该异构体isoform2里面的546ntCDS区和181个氨基酸的蛋白序列。

Blue highlighting indicates alternating exons.

Red highlighting indicates amino acids encoded across a splice junction.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多