NCBIPro数据库详解:涵盖什么内容? (ncbipro数据库包括)

NCBIPro(National Center for Biotechnology Information Protein)是由美国国家生物技术信息中心(NCBI)开发的一个基于蛋白质序列的数据库。该数据库涵盖了来自不同生物领域的蛋白质序列,包括人类、动物、植物、细菌和病毒等。在这篇文章中,我们将详细介绍NCBIPro数据库的内容和功能。

一、NCBIPro数据库的构成

NCBIPro数据库由三个主要部分组成:蛋白质序列、注释和相似性搜索。下面将分别介绍这三个部分。

1.蛋白质序列

NCBIPro数据库包含了所有已知蛋白质序列的信息。这些序列可以来源于不同的生物体,包括人类、动物、植物、细菌和病毒等。这些蛋白质序列是通过高通量测序技术、质谱分析或基因克隆等方法获得的。在NCBIPro数据库中,每个蛋白质序列都有一个唯一的标识符,称为NCBIPro ID。这些ID可以用来查找和比较不同蛋白质序列之间的相似性和区别。

2.注释

注释是对蛋白质序列进行详细描述和分类的过程。在NCBIPro数据库中,每个蛋白质序列都有一些相关的注释信息,包括序列长度、氨基酸组成、功能特征、亚细胞定位、基因组位置等。这些注释信息可以帮助用户了解特定蛋白质序列的重要性和功能。此外,NCBIPro还提供了一些额外的注释信息,包括酶的功能分类、蛋白质家族信息、PDB结构等。

3.相似性搜索

相似性搜索是指通过比较蛋白质序列之间的相似性,找到与已知蛋白质序列有类似结构或功能的新蛋白质序列。在NCBIPro数据库中,用户可以使用不同的工具和算法来搜索相似性序列。其中,最常见的工具是BLAST(基于局部序列相似性搜索工具)。用户可以将已知的蛋白质序列与数据库中的所有蛋白质序列进行比较,找到与其相似的序列,并进一步分析它们的结构和功能。

二、NCBIPro数据库的功能

NCBIPro数据库有许多可用的功能,这里介绍其中的几个。

1.搜索和浏览蛋白质

用户可以通过在NCBIPro数据库中使用关键词搜索特定的蛋白质。在搜索结果页面中,用户可以浏览蛋白质序列、注释信息和相关文献。此外,用户还可以使用“BLAST”工具来搜索相似性序列,以发现与已知蛋白质序列有类似结构或功能的新蛋白质序列。用户还可以将搜索结果存储在自己的帐户中,以供后续使用。

2.下载数据和工具

NCBIPro数据库提供了多种工具和数据的下载,包括蛋白质序列、注释信息、结构数据、基因组序列等。这些数据可以用于进一步研究新的蛋白质序列,并帮助用户了解蛋白质的结构和功能。

3.探索蛋白质结构

除了蛋白质序列外,NCBIPro数据库还提供了大量的蛋白质结构数据。用户可以使用“MMDB”工具来查看具体的蛋白质结构信息,并分析蛋白质之间的相似性和差异性。此外,NCBIPro数据库还提供了“Cn3D”工具,该工具可以帮助用户可视化蛋白质结构和相互作用,以进一步了解蛋白质的结构和功能。

4.访问其他数据库

NCBIPro数据库还与其他数据库进行了链接,包括UniProt、PDB、KEGG、EMBL等。用户可以使用NCBIPro数据库中的相关链接,获取更多关于蛋白质结构和功能的信息。

NCBIPro数据库是一个非常有用的资源,可以帮助用户了解蛋白质的结构和功能,并在研究新蛋白质序列时提供支持。通过NCBIPro,用户可以搜索、浏览和下载多种类型的蛋白质数据,并使用不同的工具来分析和比较蛋白质序列之间的相似性和区别,从而推动蛋白质科学研究的发展。

相关问题拓展阅读:

核酸序列、结构数据库有哪些?

美国的核酸数据库GenBank

欧洲核酸序列数据库EMBL

日本核酸序列数据库DDBJ

这是目前世界三大核酸数据库.不本我们用的最多的还是NCBI,基本上是不用日本的!

蛋白质序列数据库包含哪些内容

蛋白质数据库

1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上更大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。

PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。

PIR和PSD的网址是:

数据库下载地址是:

2. SWISS-PROT

SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。

利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。

SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。

SWISS-PROT的网址是:

3. PROSITE

PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。

PROSITE的网址是:

4. PDB

蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Raol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。

RCSB的PDB数据库网址是:

5. SCOP

蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。

SCOP的网址是:

6. COG

蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。

COG库的网址是:

ncbipro数据库包括的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于ncbipro数据库包括,NCBIPro数据库详解:涵盖什么内容?,核酸序列、结构数据库有哪些?,蛋白质序列数据库包含哪些内容的信息别忘了在本站进行查找喔。


数据运维技术 » NCBIPro数据库详解:涵盖什么内容? (ncbipro数据库包括)