1楼:
nr是以下这些数
据库的并集:
all non-redundant genbank cds translations+pdb+swissprot+pir+prf excluding environmental samples from wgs projects
ncbi 中gl 什么意思
2楼:匿名用户
np_001044802.1是登录号;115441045是叫gi号。从你自己例子里体现了两者的一个基本差别:
gi号完全是数字,登录号是字母与数字的组合,通常字母代表一定的含义。关于gi与登录号的区别可以参考下面给出的链接。
这里主要讨论一下登录号的样式:
1)用户递交序列号,这些登录号通常不含下划线。
首先我们讨论一下locus name,它不是登录号,但在ncbi的发展中占据一定的地位。在ncbi的genbank记录中,locus关键字下包括许多信息,其中之一就是locus name。位点名称设计之初是用来帮助研究人员归并相似序列。
名称命名规则是[a-z][0-9]。首字母通常为物种名的首字母。locus概念最适合基因突变数据的收集,所以突变数据的最初都是按照locus概念设计的。
随着genbank数据的扩大,6个数据明显不能适应数据的增长,于是增加到8位,也就是登录号,其编码规则[a-z][a-z][0-9]。前两个字母是物种拉丁名首字母(不是很确定),后面是6个序号。因此登录号也就代替了locus名称。
2)refseq序列
由于genbank开埠之初,并不控制序列质量,所以会有许多的冗余。因此ncbi就通过利用计算机算法把一致的序列归并在一起,这些人工生成的序列都是用类似np_***xx的格式编码,严格的编码规则是[anxyz][cpgmprtwzs]_([a-z])?[0-9]。
下面的登录号样例就是用这个正则表达式提取的,供参考。
ac_123456
ap_123456
nc_123456
ng_123456
nm_123456
nm_123456789
np_123456
np_123456789
nr_123456
nt_123456
nw_123456
nw_123456789
nz_abcd12345678
xm_123456
xm_123456789
xp_123456
xp_123456789
xr_123456
yp_123456
yp_123456789
zp_12345678
ns_123456
http://****ncbi.nlm.nih.gov/refseq/key.html#accessions
最后补充一点的是序列后的“点数字”代表不同的版本,详参参考链接。
ncbi embl和什么并称三大数据库
3楼:匿名用户
ddbj:dna data base of japan 是日本人建立的核酸数据库;
ncbi中的genbank是美国建立的核酸数据库;
embl是欧洲建里的核酸数据库;
这三个数据库是连通的,数据共享。
4楼:手机用户
http://****ncbi.
nlm.nih.gov/" target="_blank">http:
//****ncbi.nlm.
nih.gov/
,是一个基因库,可以查询已知序列,还可以查找文章,登记序列等等,不管是筛选细菌还是做分子实验,都是很有用的**
求助:nt和nr数据库的详细介绍和区别
5楼:dong天的冰冷
原理很简单后者是前者的子集。chromosome只包含所有已经测序的基因组数据。估计你的序列可能只是在高等生物中保守,所以才会出现选择chromosome数据库时相似数量下降非常多。
在做blast的时候,我们通常需要根据不同的目的选择不同的数据库。
什么叫非冗余蛋白质?
6楼:洋果冻爽歪歪
像ncbi里边,因为采取的原则是100%identical的才merge到一起去,
所以它的database里边那种nr nucleotide/protein,
其实有很多都是redundant的,
需要你自己manually curate.
7楼:匿名用户
http://arep.med.harvard.edu/seqanal/db.html
像ncbi里边,因为采取的原则是100%identical的才merge到一起去,所以它的database里边那种nr nucleotide/protein,其实有很多都是redundant的,需要你自己manually curate.
转录组差异基因表达的nr注释是什么意思
8楼:马瓦里奥
nr是一个数据库,是ncbi中蛋白质数据库,集合了许多其他数据库中的蛋白质的注释信息。差异基因注释简单来说就是把有表达差异的unigene的物种、分子功能、生物学途径等等信息通过从数据库中比对,得到的结果。
如何从ncbi上**database
9楼:回忆
因此ncbi 的分类学数据库不是一个系统发育或分类学的“专家数据库”(wheeler et al., 2000)。
获取序列所对应的分类学信息有两种方法。
对于windows 用户还有一个文件称为taxdump.zip 文件。文件解压缩后包括1 个*.
prt 文件和6 个*.dmp 文件。gencode.
dmp 文件保存有不同的密码子表,与同目录的gc.prt 联合使用;merged.dmp 是保存有合并的taxid 号的对应表;nodes.
dmp 是结点信息;division.dmp 是较大的几个分类;names.dmp 结点名称信息,每个id 对应多行。
这些数据被phylogenie 软件包中的blammer 程序用于构建进化树。
第二种方法是对taxonomy 数据库进行api 分析。
ncbi选择数据库
10楼:匿名用户
原理很简单后者是前者的子集。chromosome只包含所有已经测序的基因组数据。估计你的序列可能只是在高等生物中保守,所以才会出现选择chromosome数据库时相似数量下降非常多。
在做blast的时候,我们通常需要根据不同的目的选择不同的数据库。例如,要看一下测的序列是不是子集所期望的序列,以及,那nr数据库是最好的选择。至于以谁为准,因需要解决的问题而异。
读一下blast每个数据库的定义,对于你选择数据库最有帮助。有一个基本原则是:nr数据库可以满足绝大多数的需求。
少数特殊需求可以通过其他数据库完成,例如最近30天内的更新序列,搜索新基因这是必查的;题目中的chromosome数据库是只包含了全基因组或全染色体的数据。详参ncbi blast说明。
http://****ncbi.nlm.nih.gov/blast/blastcgihelp.shtml#nucleotide_databases
ncbi上做blastp有refseq-protein和non-reqprotein两个database,区别是什么?另外accession的意义是什么?
11楼:匿名用户
是否包含蛋白序列的数据库 accession是蛋白的序号
Arol什么意思,“BL”什么意思?“BG”什么意思?
1楼 锅盔山下 写错了就是win7的毛玻璃风格的英文名字 情人叫我别穿大红大绿什么意思 2楼 匿名用户 他可能喜欢比较素雅的颜色吧。个人喜好而已。 bl 什么意思? bg 什么意思? 3楼 热词替换 bg 即是 boy and girl 的简称,起源于并多用于动漫领域。表意即为 异性恋 ,也被称为 ...
是什么意思,♂♀什么意思?
1楼 匿名用户 sigma 希腊字母 念 西格玛 表示数学中的 求和 爱神丘比特 植物学家用来表示雄花 女神维纳斯 植物学家用来表示雌花 是什么意思 2楼 热词课代表 qaq为网络词语 是一种表情 网络 里常用 是哭的意思。qaq表示悲伤等,qaq有什么梗? 3楼 匿名用户 男性 雄性符号 女性 雌...
凯旋是什么意思,pmp是什么意思;pmpmp是什么意思?
1楼 广州市唯高 打仗得胜后返回,也是一个车名,东风雪铁龙凯旋! pmp是什么意思 pmpmp是什么意思? 2楼 匿名用户 pmp 拍马屁,pmpmp 拼命拍马屁 3楼 光环国际 pmp有两种含义1 pmp认证 项目管理专业人士认证 pmp多指美国项目管理协会 pmi 发起的pmp认证。即proje...