ncbidatabasenr什么意思

2020-11-22 11:41:40 字数 3833 阅读 6090

1楼:

nr是以下这些数

据库的并集:

all non-redundant genbank cds translations+pdb+swissprot+pir+prf excluding environmental samples from wgs projects

ncbi 中gl 什么意思

2楼:匿名用户

np_001044802.1是登录号;115441045是叫gi号。从你自己例子里体现了两者的一个基本差别:

gi号完全是数字,登录号是字母与数字的组合,通常字母代表一定的含义。关于gi与登录号的区别可以参考下面给出的链接。

这里主要讨论一下登录号的样式:

1)用户递交序列号,这些登录号通常不含下划线。

首先我们讨论一下locus name,它不是登录号,但在ncbi的发展中占据一定的地位。在ncbi的genbank记录中,locus关键字下包括许多信息,其中之一就是locus name。位点名称设计之初是用来帮助研究人员归并相似序列。

名称命名规则是[a-z][0-9]。首字母通常为物种名的首字母。locus概念最适合基因突变数据的收集,所以突变数据的最初都是按照locus概念设计的。

随着genbank数据的扩大,6个数据明显不能适应数据的增长,于是增加到8位,也就是登录号,其编码规则[a-z][a-z][0-9]。前两个字母是物种拉丁名首字母(不是很确定),后面是6个序号。因此登录号也就代替了locus名称。

2)refseq序列

由于genbank开埠之初,并不控制序列质量,所以会有许多的冗余。因此ncbi就通过利用计算机算法把一致的序列归并在一起,这些人工生成的序列都是用类似np_***xx的格式编码,严格的编码规则是[anxyz][cpgmprtwzs]_([a-z])?[0-9]。

下面的登录号样例就是用这个正则表达式提取的,供参考。

ac_123456

ap_123456

nc_123456

ng_123456

nm_123456

nm_123456789

np_123456

np_123456789

nr_123456

nt_123456

nw_123456

nw_123456789

nz_abcd12345678

xm_123456

xm_123456789

xp_123456

xp_123456789

xr_123456

yp_123456

yp_123456789

zp_12345678

ns_123456

http://****ncbi.nlm.nih.gov/refseq/key.html#accessions

最后补充一点的是序列后的“点数字”代表不同的版本,详参参考链接。

ncbi embl和什么并称三大数据库

3楼:匿名用户

ddbj:dna data base of japan 是日本人建立的核酸数据库;

ncbi中的genbank是美国建立的核酸数据库;

embl是欧洲建里的核酸数据库;

这三个数据库是连通的,数据共享。

4楼:手机用户

http://****ncbi.

nlm.nih.gov/" target="_blank">http:

//****ncbi.nlm.

nih.gov/

,是一个基因库,可以查询已知序列,还可以查找文章,登记序列等等,不管是筛选细菌还是做分子实验,都是很有用的**

求助:nt和nr数据库的详细介绍和区别

5楼:dong天的冰冷

原理很简单后者是前者的子集。chromosome只包含所有已经测序的基因组数据。估计你的序列可能只是在高等生物中保守,所以才会出现选择chromosome数据库时相似数量下降非常多。

在做blast的时候,我们通常需要根据不同的目的选择不同的数据库。

什么叫非冗余蛋白质?

6楼:洋果冻爽歪歪

像ncbi里边,因为采取的原则是100%identical的才merge到一起去,

所以它的database里边那种nr nucleotide/protein,

其实有很多都是redundant的,

需要你自己manually curate.

7楼:匿名用户

http://arep.med.harvard.edu/seqanal/db.html

像ncbi里边,因为采取的原则是100%identical的才merge到一起去,所以它的database里边那种nr nucleotide/protein,其实有很多都是redundant的,需要你自己manually curate.

转录组差异基因表达的nr注释是什么意思

8楼:马瓦里奥

nr是一个数据库,是ncbi中蛋白质数据库,集合了许多其他数据库中的蛋白质的注释信息。差异基因注释简单来说就是把有表达差异的unigene的物种、分子功能、生物学途径等等信息通过从数据库中比对,得到的结果。

如何从ncbi上**database

9楼:回忆

因此ncbi 的分类学数据库不是一个系统发育或分类学的“专家数据库”(wheeler et al., 2000)。

获取序列所对应的分类学信息有两种方法。

对于windows 用户还有一个文件称为taxdump.zip 文件。文件解压缩后包括1 个*.

prt 文件和6 个*.dmp 文件。gencode.

dmp 文件保存有不同的密码子表,与同目录的gc.prt 联合使用;merged.dmp 是保存有合并的taxid 号的对应表;nodes.

dmp 是结点信息;division.dmp 是较大的几个分类;names.dmp 结点名称信息,每个id 对应多行。

这些数据被phylogenie 软件包中的blammer 程序用于构建进化树。

第二种方法是对taxonomy 数据库进行api 分析。

ncbi选择数据库

10楼:匿名用户

原理很简单后者是前者的子集。chromosome只包含所有已经测序的基因组数据。估计你的序列可能只是在高等生物中保守,所以才会出现选择chromosome数据库时相似数量下降非常多。

在做blast的时候,我们通常需要根据不同的目的选择不同的数据库。例如,要看一下测的序列是不是子集所期望的序列,以及,那nr数据库是最好的选择。至于以谁为准,因需要解决的问题而异。

读一下blast每个数据库的定义,对于你选择数据库最有帮助。有一个基本原则是:nr数据库可以满足绝大多数的需求。

少数特殊需求可以通过其他数据库完成,例如最近30天内的更新序列,搜索新基因这是必查的;题目中的chromosome数据库是只包含了全基因组或全染色体的数据。详参ncbi blast说明。

http://****ncbi.nlm.nih.gov/blast/blastcgihelp.shtml#nucleotide_databases

ncbi上做blastp有refseq-protein和non-reqprotein两个database,区别是什么?另外accession的意义是什么?

11楼:匿名用户

是否包含蛋白序列的数据库 accession是蛋白的序号

Arol什么意思,“BL”什么意思?“BG”什么意思?

1楼 锅盔山下 写错了就是win7的毛玻璃风格的英文名字 情人叫我别穿大红大绿什么意思 2楼 匿名用户 他可能喜欢比较素雅的颜色吧。个人喜好而已。 bl 什么意思? bg 什么意思? 3楼 热词替换 bg 即是 boy and girl 的简称,起源于并多用于动漫领域。表意即为 异性恋 ,也被称为 ...

是什么意思,♂♀什么意思?

1楼 匿名用户 sigma 希腊字母 念 西格玛 表示数学中的 求和 爱神丘比特 植物学家用来表示雄花 女神维纳斯 植物学家用来表示雌花 是什么意思 2楼 热词课代表 qaq为网络词语 是一种表情 网络 里常用 是哭的意思。qaq表示悲伤等,qaq有什么梗? 3楼 匿名用户 男性 雄性符号 女性 雌...

凯旋是什么意思,pmp是什么意思;pmpmp是什么意思?

1楼 广州市唯高 打仗得胜后返回,也是一个车名,东风雪铁龙凯旋! pmp是什么意思 pmpmp是什么意思? 2楼 匿名用户 pmp 拍马屁,pmpmp 拼命拍马屁 3楼 光环国际 pmp有两种含义1 pmp认证 项目管理专业人士认证 pmp多指美国项目管理协会 pmi 发起的pmp认证。即proje...