怎样在NCBI上怎么查找基因序列的cDNA序列

热门日志推荐
人人最热标签
分享这篇日志的人常去
北京千橡网景科技发展有限公司:
文网文[号··京公网安备号·甲测资字
文化部监督电子邮箱:wlwh@··
文明办网文明上网举报电话: 举报邮箱:&&&&&&&&&&&&
请输入手机号,完成注册
请输入验证码
密码必须由6-20个字符组成
下载人人客户端
品评校花校草,体验校园广场视频: NCBI查找mRNA,cDNA及蛋白序列(教程)
分享给好友
您需要先安装&,才能下载视频哦
用优酷App或微信扫一扫,在手机上继续观看。
NCBI查找mRNA,cDNA及蛋白序列(教程)
分享给站外好友
把视频贴到Blog或BBS
flash地址:
<input type="text" class="form_input form_input_s" id="link3" value=''>
<input id="link4" type="text" class="form_input form_input_s" value=''>
节目制作经营许可证京字670号
京公网安备号
药品服务许可证(京)-经营-丁香客App是丁香园社区的官方应用,聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香客App浏览论坛,也可以在这个医生群集的关系网络中分享和互动,建立更广泛的学术圈子。
扫描二维码下载
今日:12 | 主题:213673 | & 收藏本版
每发1个新帖可以获得0.5个丁当奖励
【求助】从NCBI上查得基因序列,如何知道基因的编码区?
【求助】从NCBI上查得基因序列,如何知道基因的编码区?
分享到哪里?
这个帖子发布于7年零242天前,其中的信息可能已发生改变或有所发展。
从老外哪里要到一个基因的cDNA,但是没有给我电子版的图谱,给了纸版的。我现在可以从NCBI上查得基因序列,现在有以下问题:1.无法比对他给我得是否与我所查得基因序列相同。2.我想知道基因得编码区,如何确定? 因为要设计引物,所以必须知道编码区。
回复:【求助】从NCBI上查得基因序列,如何知道基因的编码区?
分享到哪里?
1 先从NCBI上搜索你要的GENE名称2 从搜索出来的条目中选出你要的蛋白,然后在Genomic regions, transcripts, and products栏下有一个遗传图,上面有DNA,RNA,PROTEIN的序列号,点RNA的号,RNA的网页就出来了3 这个网页上点击SEQUENCE,RNA的序列就出来了,但这是全长的,包含内含子的RNA,在这个序列上面有很多栏,在CDS这一栏,大概是倒数的吧,上面显示了编码区,以及翻译出了蛋白。4 可以将这个碱基数除以3再减一,就是蛋白氨基酸的个数,可以用这个再验证一下。 祝你顺利!!
回复:【求助】从NCBI上查得基因序列,如何知道基因的编码区?
分享到哪里?
axiye wrote:1 先从NCBI上搜索你要的GENE名称2 从搜索出来的条目中选出你要的蛋白,然后在Genomic regions, transcripts, and products栏下有一个遗传图,上面有DNA,RNA,PROTEIN的序列号,点RNA的号,RNA的网页就出来了3 这个网页上点击SEQUENCE,RNA的序列就出来了,但这是全长的,包含内含子的RNA,在这个序列上面有很多栏,在CDS这一栏,大概是倒数的吧,上面显示了编码区,以及翻译出了蛋白。4 可以将这个碱基数除以3再减一,就是蛋白氨基酸的个数,可以用这个再验证一下。 祝你顺利!!谢谢楼主的回答。。我的意思是说知道了CDs的序列,它可以有至少6种排列组合翻译出来吧。我怎么样能得到比较准确的一种,也就是我需要的ATG的部位。。谢谢!!
回复:【求助】从NCBI上查得基因序列,如何知道基因的编码区?
分享到哪里?
能告知基因的名称吗?
回复:【求助】从NCBI上查得基因序列,如何知道基因的编码区?
分享到哪里?
谢谢,我已经解决了
回复:【求助】从NCBI上查得基因序列,如何知道基因的编码区?
分享到哪里?
你好 虽然这里介绍很详细 可是我还是没有在NCBI中找到编码序列 希望得到指导
关于丁香园查看: 15809|回复: 107
蛋白质 DNA如何在ncbi上检索讲解!!
注册时间 最后登录
秀基因 个 秀蛋白 个
蛋白质 DNA如何在ncbi上检索讲解!!
希望都大奖有帮助!!!
如何在ncbi上检索 NCBI包括五个部分,第一部分是欢迎进入NCBI,包括NCBI的最新信息、计划与活动、读者来信、服务地址和用户评论等。第二部分是基因序列数据库(GenBank),包括基因库概述、检索与投稿。第三部分是数据库服务,包括免费的PubMed检索、Entrez检索、BLAST序列族性检索、电子邮件服务(详见本章第四节)、匿名FTP服务。第四部分是NCBI的其它资源。 GenBank的检索 在NCBI主页的第二部分点击&Searching GenBank&,即可进入GenBank的检索屏幕。NCBI提供了五种检索,即Entrez浏览检索、BLAST序列类似性检索、dbEST检索、dbSTS检索和文本检索(Text Searching)。 一、Entrez浏览检索 1.Entrez检索的数据库及其检索信息 Entrez浏览器(Entrez Browser)可以检索以下与NCBI链接的基因序列数据库的分子生物数据和书目文献资料。 
(1) GenBank、EMBL、DDBJ中的DNA序列; 
(2) SWISS-PROT、PIR、PRF、PDB中的蛋白质序列以及DNA序列数据库中翻译的蛋白质序列; 
(3) 基因和染色体图像数据; 
(4) PDB以及收入NCBI分子模型数据库(MMDB)的蛋白质三维结构; 
(5) 通过PubMed检索Medline和PreMedline数据库。 
2.Entrez检索功能 
Entrez提供了以下三种检索功能。
& &(1)自由词检索功能 
用户可以通过文本词、关键词、截词、期刊名或文献的作者检索Entrez数据库。截词用*号,期刊名必须用Medline刊名缩写,作者姓名必须是姓在前,名在后,用首字母缩写。
(2)索引词表(List Terms)检索功能
索引词表检索是当你键入检索词,Entrez在你选定的字段中显示从该检索词开始的一个索引词表窗口,这时,你可以选择一个或几个词进行检索,这对单词拼写不准确时非常有用。例如:在输入框中键入&P53&,选择文本字段(Text Words)和索引词表(List Terms)检索功能,再点击&Search&,这时返回一个以&P53&开始的索引词表窗口,浏览选择一个或几个索引词,点击&Search&,Entrez将返回检索结果。
(3)自动检索功能
自动检索功能就是Entrez浏览器根据用户输入的检索式自动进行检索,返回当前检索式检出的文献数,如满意,可进一步取得检索结果,如不满意,则可对当前检索式进行修改,直到用户满意为此。例如在输入框键入&P53&,选择所有字段和自动检索功能,点击&Search&,Entrez返回一个Web页,包括当前检出文献数、加词检索和修改当前检索三个部分。如果你对检出文献数不满意(过多或过少),可以在加词检索部分增加更专指的检索词,以提高查准率,也可以在修改当前检索部分选择某一布尔算符(AND、OR、NOT、ANDNOT),对当前的检索策略进行修改,直到你满意为止。
对于检出文献,用户可以选择浏览格式进行浏览,也可以打印或存盘。
3 Entrez检索规则
(1)Entrez支持&*&号截词检索; 
(2)Entrez对你键入的词可以进行逻辑识别。例如:键入&Lipman DJ Genomics&,Entrez将它识别为作者的姓名Lipman DJ和自由词Genomics,并将提问式转换为&Lipman DJ&AND Genomics。对于Entrez不能识别的提问式,如 bac 1,必须加双引号,系统就会将它们作为一个词进行检索;
(3)Entrez支持复杂的布尔逻辑检索;
(4)Entrez支持限定字段检索; 字段标识符的全称如下: WORD=Text Word, TITL=Title Word, MESH=Mesh Term, MAJR=MeSH Major Topic, AUTH=Author Name, JOUR=Journal Name, ECNO=EC/RN Number, GENE=Gene Name, DATE=Publication Year, PDAT=Publication/Creation Date, MDAT=Modification Date, PAGE=First Page, VOL=Volume, KYWD=Keyword, ORGN=Organism, ACCN=Accession Number, PROT=Protein Name, SUBS=Substance,PROP=Property, FKEY=Feature Key 和 PTYP=Publicaton Type
二、BLAST序列类似性检索 序列类似性检索就是将新测定的核酸或蛋白质序列对核酸或蛋白质序列数据库进行检索,找出与之相似的序列,从而评判新测定的序列是重复别人的工作,还是在前人的基础上有所创新,或是发现了新的序列。现在用于序列类似性检索的软件很多,下面主要介绍GenBank的序列类似性检索工具枣BLAST。
1. BLAST简介 BLAST是Basic Local Alignment Search Tool的英文缩写,意即碱基局部对准检索工具,是一种序列类似性检索工具。它采用统计学记分系统,能将真正配对的序列同随机产生的干扰序列区别开来;同时采用启发式算法系统,即采用的是局部对准算法(Local Alignment Algorithm),而不是全序列对准算法(Global Alignment Algorithm)。全序列对准算法是在检索结果中两个被比较序列所有片断均类似;而局部对准算法是找出两个被比较序列的&最类似&片断,并得出可能只包含两个序列的某个部分的对准结果。 在BLAST的基础上,NCBI又开发了BLAST 2.0、Gapped BLAST和PSI-BLAST。BLAST 2.0是一种新的BLAST检索工具,它对BLAST作了改进,运行速度更快,灵敏度更高,同时具有Gapped BLAST和PSI-BLAST两种软件的新功能。Gapped BLAST允许在对准的序列中引入空位(碱基缺失或插入),引入&空位&(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific Iterated BLAST,意即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源(Sequence Homologues)的有效方法。目前,PSI-BLAST仅用于比较蛋白质查询序列与蛋白质数据库中的序列的类似程度。
2. 使用NCBI BLAST服务的四种基本方法 (1)经由WWW使用的BLAST 使用BLAST最容易的方法是WWW方式。在用户的浏览器中键入NCBI的URL地址:http//www.ncbi.nlm.nih.gov,进入NBCI主页,然后链接到BLAST主页。BLAST主页提供了好几种BLAST检索软件,包括BLAST、BLAST 2.0、Gapped BLAST和PSI-BLAST等,其中BLAST和BLAST 2.0提供了基本检索和高级检索两种模式。
(2)网络版的BLAST BLAST2是标准的网络BLAST客户软件,它可以通过NCBI匿名的FTP服务器()下的/blast/network/blast2/获取。 PowerBlast是用于大规模分析基因序列的网络BLAST客户应用软件,它可以通过NCBI匿名的FPT服务器()下的/blast/network/blast2/powerBLAST/获取。
(3)独立运行的BLAST BLAST 2.0可以在本地计算机上独立运行,也可以在自建的序列数据库中进行BLAST检索,还可以下载NCBI数据库中的记录。BLAST运行的软硬件环境为IRIX 6.2、Solaris 2.5、PEC OSF1(第四版)和Win32系统。可独立运行的BLAST 2.0在NCBI匿名的FTP服务器()下的/blast/executables/获取。
(4) 电子邮件的BLAST 通过电子邮件对基因库进行BLAST检索(详见本章第四节二)。 3. BLAST的检索方法 (1) BLAST数据库的选择 BLAST检索的数据库包括两大类:一类是肽序列数据库,另一类是核酸序列数据库。
① 肽序列数据库包括: nr: 所有无冗余基因库CDS转录产物、PDB、SwissProt以及PIR序列 month: 最近30天注释的所有新增的或修订的基因库CDS转录产物、PDB、SwissProt和PIR序列。 SwissProt: SwissProt蛋白质序列数据库中最新的主要注释(无更新)序列。 yeast: Yeast(Saccharomyces Cerevisiae)蛋白质序列。 E.coli: E.coli基因CDS转录产物。 pdb: 从Brookhaven蛋白质序列数据和三维结构衍生出来的序列。 Kabat : 上感兴趣的蛋白质序列Kabat数据库。 alu: 从重复序列数据库(REPBASE)选取的Alu重复序列,适用于过滤查询序列中Alu重复序列。通过匿名FTP从ncbi.nlm.nih.gov下的/pub/jmc/alu目录中获取。
② 核酸序列数据库包括: nr: 所有无冗余的GenBank+EMBL+DDBJ+PDB序列;但不包括EST、STS、GSS或HTGS序列。 month: 最近30天注释的新增加的或修订的GenBank+EMBL+DDBJ+PDB序列 dbEST: GenBank+EMBL+DDBJ+PDB中EST部分的无冗余数据。 dbSTS: GenBank+EMBL+DDBJ+PDB中STS部分的无冗余数据。 htgs: 高允许能力(High Throughput)基因序列。 yeast: yeast(Saccharomyces Cerevisiae)基因核酸序列。 E.coli: 大肠杆菌(E.coli)基因核酸序列。 pdb: 蛋白质数据库。 Kabat: 免疫学上感兴趣的核酸序列Kabat数据库。 Vector: GenBank载体数据库。 mito: 线粒体序列数据库。 alu: 从重复序列数据库(REPBASE)选取的Alu重复序列,适用于过滤查询序列中Alu重复序列。通过匿名FTP从ncbi.nlm.nih.gov下的/pub/jmc/alu目录中获取。 epd: 真核生物的启动子数据库。 gss: 基因搜寻序列,包括单递基因数据、外切核酸酶捕获序列和Alu 序列。
(2) BLAST程序的选择 BLAST是一种碱基局部对准检索工具,实质上是一种序列类似性检索工具,它运行blastp、blastn、blastx、tblastn、tblastx等五种程序的启发式检索算法;这五种程序是利用改进的Karlin和Altschul的统计学方法来描述检索结果的显著性。这些程序不支持主题形式检索,也就是不支持主题词、自由词、文本词等检索。 下面介绍五种程序的基本功能。 blastp:将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行查询; blastn:将待查询的核酸序列及其互补序列一起对核酸序列数据库进行查询; blastx:先将待查询的核酸序列按六种可读框架(逐个向前三个碱基和逐个向后三个碱基读码)翻译成蛋白质序列,然后将翻译结果对蛋白质序列数据库进行查询; tblastn:先将核酸序列数据库中的核酸序列按六种可读框架翻译成蛋白质序列,然后将待查询的蛋白质序列及其互补序列对其翻译结果进行查询;  tblastx:先将待查询的核酸序列和核酸序列数据库中的核酸序列按六种可读框架翻译成蛋白质序列,然后再将两种翻译结果从蛋白质水平进行查询。 因此,根据你查询的目的和序列选择合适的blast程序,有助于获得满意的检索结果。
(3) BLAST参数的设置 BLAST提供了许多参数可限制你的检索,以达到满意的结果。对于BLAST基本检索,系统预设的参数默认值即可满足需要,不需要你重新设定。但是对于BLAST高级检索,可开窗选择如下几种参数,也可在输入框增加其它参数。
①直方图(Histogram):显示每次检索评分的直方图。有yes、no两种选择,默认值为yes
②描述(Descriptions):限定描述性类似序列的条数。有default、0、10、50、100、250、500等七种选择,默认值为100。
③对准(Alignments):限定检出高积分片断配对(High-scoring Segment Pairs,HSPs)的数据库序列的条数,有default、0、10、50、100、250、500等七种选择,默认值为50。如果检索到的数据库序列超出设定值,BLAST仅显示最具统计学意义的配对序列,直到设定值。
④期望值(Expect,E值):它是期望数据库中具有某一统计学意义配对序列的值。有default、0.001、0.01、0.1、1、10、100、1000等选择值,默认值为10,一般地,期望值越低,限制越严格,甚至会导致无随机配对序列。
⑤Cutoff:设定高积分片断配对(HSPs)的Cutoff值。有default、60、70、80、90、100、110等七种选择值,其默认值一般通过期望值来计算得出。一般地,Cutoff值越高,其限制就越严格,甚至会导致无随机配对序列。 ⑥矩阵(Matrix):为BLAST、BLASTX、TBLASTN和TBLASTX程序指定一个交替记分矩阵。其默认值为BLOSUM62,有PAM40、PAM120、PAM250和IDENTITY等四种有效选择。但交替记分矩阵对BLASTN不起作用。
⑦股(Strand):把BLASTN检索限定在数据库序列的股的首端或末端;或者把BLASTN、BLASTX、TBLASTX检索限定在查询序列股的首端或末端的机读部分。 ⑧过滤器(Filter):过滤器可以过滤查询序列中低成分复杂性(Low Compositional Complexity)片断。它只过虑查询序列及其转录产物中的低成分复杂性片断,不能过虑数据库序列中的低成分复杂性片断。用户可以在BLAST和BLAST 2.0的高级检索中选择相应的过滤程序以消除对检索结果的干扰,如不用过滤功能则选择&NONE&。但是在BLAST和BLAST 2.0基本检索中,因为,系统对于不同的BLAST程序设定了默认值,例如对于blastn程序,其默认值为&DUST&,对于其他程序,默认值为&SEG&,所以用户只须选择用不用过虑功能,而不必设定过虑程序。 值得注意的是,过滤器中的SEG和XUN程序不能过滤SWISS-PROT数据库中的低复杂性片断,因此,虽然过滤器可以应用于SWISS-PROT数据库序列,但并未起作用。 ⑨NCBI-GI:在输出结果中除存取号和位点名称(Locus Name)外,还可以选择NCBI-GI标识号。有yes 和no两种选择,其默认值为no。
(4) BLAST检索结果 BLAST程序用大致相同的格式显示检索结果,它包括四个部分:一是程序的介绍;二是一系列配对数据库序列的描述,从积分高到低排列,一行描述一条序列;三是实际的序列对准;四是检索中设定的参数及其它统计数据。
  三、dbEST检索 dbEST是基因库的一部分,主要收录核酸序列数据库的表达序列标志以及&单递&(Single Pass) cDNA序列等信息。 dbEST使用的提问式是IRX格式,其通用的IRX格式是:Term,这里的可以是一个或几个用空格分隔的字段标识符。&Term&可以是词或词组。
 dbEST中的字段: 
 DBID EST登记号 LIBX 馆藏描述
 IDS EST名称或GenBank存取号,GI号 SUB 发送者信息
 CLIN 信息或来源信息 CIT 引文信息
18:58 上传
点击文件名下载附件
下载积分: 秀基因 -2 个
83 KB, 下载次数: 783, 下载积分: 秀基因 -2 个
秀基因 +10
注册时间 最后登录
秀基因 个 秀蛋白 个
感谢楼主分享!
注册时间 最后登录
秀基因 个 秀蛋白 个
谢谢您了,需要
谢谢您了,需要
注册时间 最后登录
秀基因 个 秀蛋白 个
注册时间 最后登录
秀基因 个 秀蛋白 个
感谢楼主分享!
注册时间 最后登录
秀基因 个 秀蛋白 个
感谢楼主分享!
注册时间 最后登录
秀基因 个 秀蛋白 个
非常感谢楼主
注册时间 最后登录
秀基因 个 秀蛋白 个
好东西,大家一起分享
注册时间 最后登录
秀基因 个 秀蛋白 个
谢谢楼主分享!
注册时间 最后登录
秀基因 个 秀蛋白 个}

我要回帖

更多关于 怎么查找基因序列 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信