基因相互作用数据库:解码遗传信息的重要工具 (基因相互作用 数据库)

在过去几十年间,生物技术的迅速发展推动了基因组学的发展。经过长时间的研究,原来未知的遗传信息逐渐变得清晰明了。在这个过程中,发现了许多基因,但是真正的问题是如何理解这些基因之间的相互作用。解决这些问题的一个重要工具是基因相互作用数据库。

基因相互作用数据库是一个用于存储和分析基因相互作用信息的基准库。它提供了一个文献综述和其他相关数据的。这些数据可以用于构建和分析各种互动网络,包括转录因子互动网络和蛋白质相互作用网络。基因相互作用数据库的数据源可以来自多个来源,例如实验、计算模拟和文献综析。

随着基因组学研究的深入发展,越来越多的基因相互作用数据库被创建出来。它们是基因组学研究的核心数据资源之一,被广泛运用于从多个角度理解基因与基因之间的相互作用。目前,主要有以下几个数据库:STRING、BioGRID、MINT、Intact。

之一个数据库是STRING,它是一个含有数十亿种基因相互作用的数据库,可以通过数据库中的基因名、蛋白质名或关键字等方式搜索。STRING中的基因和蛋白质信息来自多种来源,包括生物关系数据库、基因表达和进化分析。除了关于基因和蛋白质的相互作用信息,STRING还提供了包括组织、通路和表达等多方面的信息。

BioGRID是另一个基因相互作用数据库,它侧重于蛋白质相互作用。BioGRID收集了全球范围内的大量研究性文献中有关蛋白质相互作用的信息。收集到的数据经过直接搜索、文献回顾和手动注释等方法获得,然后按指定的统一规则进行筛选、分析和汇总。该数据库为研究人员提供了可靠的蛋白质相互作用的数据和深入的研究方法。

MINT和Intact这两个数据库的特点在于,它们提供的不仅仅是基因或蛋白质的相互作用信息,而是提供了相互作用的细节描述,包括基因和蛋白质的域、修饰和变异等信息。这些信息使得研究人员能够更深入地了解基因或蛋白质的功能和作用。

基因相互作用数据库为基因组学和生物信息学的发展提供了强有力的支持。通过这些数据库,研究人员可以更深入地了解各种基因和蛋白质之间的互动信息,提高基因功能预测的准确度,以及为寻找新的治疗方法或药物提供有用的线索。

相关问题拓展阅读:

世界上主要的基因库有哪几个?

uropean Molecular Biology Laboratory (EMBL) ,欧洲分子生物学实验室.

Cambridge,UK.

· GenBank ,美国国家生物技术信息中心 (NCBI)所维护的供公众自由读取的、带注释的DNA序仿神列的总数据库.

· DNA Databank of Japan (DDBJ) ,日本核酸数据库.

主要就这三备丛亏个郑缓,当然还有一些其他的专门的基因数据库.

如何使用string数据库预测蛋白质相互作用

可参考如下方法:

  1) 系统发生谱

  这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。

  2) 基因邻接

  这个方法的依据是,在细菌基因组中,功能相关的基因紧密连锁地存在于一个特定区域,构成一个操纵子,这种基因之间的邻接关系,在物种演化过程种具有保守性,可以作为基因产物之间功能关系的指示。这个方法似乎只能适用于进化早期的结构简单的微生物。所以在人的蛋白质相互作用预测时不采用这个方法。

  3) 基因融合事件

  这个方法基于如下假定:由于在物种演化过程中发生了基因融合事件,一个物种的两个(或多个)相互作用的蛋白,在另一个物种中融合成为一条多肽链, 因而基因融合事件可以作为蛋白质功能相关或相互作用的指示。

  4) 镜像树

  这个方法的思想是,功能相关的蛋白质或同一个蛋白的域之间,受功能约束,其进化过程应该保持一致, 即呈现共进化(CO—evolution)特征,通过构建和比较它们的系统发育树,如果发现树的拓扑结构显示相似性,这种相似的树被称作镜像树,那么,可以推测建树基因的功能是相关的。

  5) 突变关联

  物理上相互接触的蛋白质, 比如处在同一个结构复合物中的蛋白质,其中一个蛋白质在进化过程中累计的残基变化,通过在另一个蛋白质中发生相应的变化予以补偿,这种现象被称作关联突变。

  6)

  序列信号关联

  通过检查实验上已经证实的相互作用蛋白质对,发现序列特征信号

  (sequence-signatures)在早察不同对的相互作用蛋白中重复地出现,这一现象被称作序列信号关联。利用序列域信号关联作为相互作用蛋白质的识别指示,可以预测未知功能蛋白与已知蛋白的相互作用,减少直接实验的搜索空间。

  7) 保守的蛋白间相互作用

  相互作用的蛋白质在物种演化过程中具有保守性,因此,可以通过在一个物种中建立的蛋白质相互作用网络,预测其它物种的蛋白质间相互作用。这是后基因组时代产生的一个分子进化概念,使人们联想到直系同源基因(orthologs)和平行同源基因(paralogs)两个概念。Walhout首先提出了”interologs”这个新概念,后由Matthews等利用酵母双杂交法分析了1195个酿酒酵母相互作用蛋白在线虫(C.elegans)中的保守性,获得了

  16%-31%线虫保守相互作用蛋白,它们主要集中在核心代谢过程(core metabolic processes)并预期随着亲缘关系的远近,保守性作相应变化。

  8) 同源结构复合物

  设誉缓想三维结构已知的蛋白质复合物,各自的同家族成员以同样的方式发生相互作用.

  9) 进化速率关联

  蛋白质的进化速率由这个蛋白质同其它蛋白质发生相互作用的数量决定,并呈负相关,即相互作用的数量越多进化速率越低,而不是通常设想的蛋白质的进化速率由这个蛋白质对机体的重要性决定,这是一个极重要的概念。Fraser等13Ol利用一组实验上证实的酵母相互作用蛋白,量化分析了进化速率、适合度(fitness)和序列共进化(sequence CO—evolution)之间的关系;统计分析显示,在酵母蛋白质相互作用网络中,连接点越多的蛋白质进化速率进化越低,可能的原因是,这些蛋白质需要与更多的相互作用伴体(partner)共进化。

  10) 共鸣识别模型MRRM预测蛋白质相互作用

  从蛋白质一级结构预测蛋白质相互作用,它假设生物分子(包括蛋白质和DNA)之间的相互作用是通过共鸣能量的传递来实现的,RRM恰当地引入了一些蛋白质的物理参数,并且运用了信号分析方法(Digital Signal Analysis,DSP)使得对于蛋白质和基因的分析脱离了局部性。

  11) 通过Domain相互作用来预测蛋白质相互作用

  Domain是蛋白质最小的功能单元,它庆睁模们之间的相互作用一定程度上就决定了蛋白质之间的相互作用。按照这个方法将所有的氨基酸序列进行聚类,如果类与类之间的相互作用的序列对的个数超过了一定阈值,则表示与两个类的代表序列同源的蛋白质之间都可能会发生相互作用。

  12) 根据蛋白结构来预测蛋白相互作用

  Lappe等人认为,虽然蛋白质之间的相互作用并不能直接用作预测,但是在结构上相似的蛋白质将有可能具有相似的功能,至少会给出一定的功能提示。分类的原则可按照SCOP给出的层次进行,分类方法是将已知序列的蛋白质相互作用对分别与SCOP的典型结构进行匹配,使之对应到每一个类中。预测已知与其他蛋白相互作用关系的蛋白的序列结构可以列出该蛋白结构组成的更大可能情况。

蛋白质相互作用的预测方法很非常多,以下作了简单的介绍

  1) 系统发生谱

  这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。

  2

  2) 基因邻接

  这个方法的依据是,在细菌基因组中,功能相关的基因紧密连锁地存在于一个特定区域,构成一个操纵子,这种基因之间的邻接关系,在物种演化过程种具有保守性,可以作为基因产物之间功能关系的指示。这个方法似乎只能适用于进化早期的结构简单的微生物。所以在人的蛋白质相互作用预测时不采用这个方法。

  3) 基因融合事件

  这个方法基于如下假定:由于在物种演化过程中发生了基因融合事件,一个物种的两个(或多个)相互作用的蛋白,在另一个物种中融合成为一条猛贺多肽链, 因而基因融合事件可以作为蛋白质功能相关或相互作用的指示。

  4) 镜像树

  这个方法的思想是,功能相关的蛋白质或同一个蛋白的域之间,受功能约束雹搜,其进化过程应该保持一致, 即呈现共进化(CO—evolution)特征,通过构建和比较它们的系统发育树,如果发现树的拓扑结构显示相似性,这种相似的树被称作镜像树,那么,可以推测建树基因的功能是相关的。

  5) 突变关联

  物理上相互接触的蛋白质, 比如处在同一个结构复合物中的蛋白质,其中一个蛋白质在进化过程中累计的残基变化,通过在另一个蛋白质中发生相应的变化予以补偿,这种现象被称作关联突变。

  6)

  序列信号关联

  3

  通过检查实验上已经证实的相互作用蛋白质对,发现序列特征信号

  (sequence-signatures)在不同对的相互作用蛋白中重复地出现,这一现象被称作序列信号关联。利用序列域信号关联作为相互作用蛋白质的识别指示,可以预测未知功能蛋白与已知蛋白的相互作用,减少直接实验的搜索空间。

  7) 保守的蛋白间相互作用

  相互作用的蛋白质在物种演化过程中具有保守性,因此,可以通过在一个物种中建立的蛋白质相互作用网络,源知历预测其它物种的蛋白质间相互作用。这是后基因组时代产生的一个分子进化概念,使人们联想到直系同源基因(orthologs)和平行同源基因(paralogs)两个概念。Walhout首先提出了”interologs”这个新概念,后由Matthews等利用酵母双杂交法分析了1195个酿酒酵母相互作用蛋白在线虫(C.elegans)中的保守性,获得了

  16%-31%线虫保守相互作用蛋白,它们主要集中在核心代谢过程(core metabolic processes)并预期随着亲缘关系的远近,保守性作相应变化。

  8) 同源结构复合物

  设想三维结构已知的蛋白质复合物,各自的同家族成员以同样的方式发生相互作用.

  9) 进化速率关联

  蛋白质的进化速率由这个蛋白质同其它蛋白质发生相互作用的数量决定,并呈负相关,即相互作用的数量越多进化速率越低,而不是通常设想的蛋白质的进化速率由这个蛋白质对机体的重要性决定,这是一个极重要的概念。Fraser等13Ol利用一组实验上证实的酵母相互作用蛋白,量化分析了进化速率、适合度(fitness)和序列共进化(sequence CO—evolution)之间的关系;统计分析显示,在酵母蛋白质相互作用网络中,连接点越多的蛋白质进化速率进化越低,可能的原因是,这些蛋白质需要与更多的相互作用伴体(partner)共进化。

  10) 共鸣识别模型MRRM预测蛋白质相互作用

  从蛋白质一级结构预测蛋白质相互作用,它假设生物分子(包括蛋白质和DNA)之间的相互作用是通过共鸣能量的传递来实现的,RRM恰当地引入了一些蛋白质的物理参数,并且运用了信号分析方法(Digital Signal Analysis,DSP)使得对于蛋白质和基因的分析脱离了局部性。

  11) 通过Domain相互作用来预测蛋白质相互作用

  Domain是蛋白质最小的功能单元,它们之间的相互作用一定程度上就决定了蛋白质之间的相互作用。按照这个方法将所有的氨基酸序列进行聚类,如果类与类之间的相互作用的序列对的个数超过了一定阈值,则表示与两个类的代表序列同源的蛋白质之间都可能会发生相互作用。

  12) 根据蛋白结构来预测蛋白相互作用

  Lappe等人认为,虽然蛋白质之间的相互作用并不能直接用作预测,但是在结构上相似的蛋白质将有可能具有相似的功能,至少会给出一定的功能提示。分类的原则可按照SCOP给出的层次进行,分类方法是将已知序列的蛋白质相互作用对分别与SCOP的典型结构进行匹配,使之对应到每一个类中。预测已知与其他蛋白相互作用关系的蛋白的序列结构可以列出该蛋白结构组成的更大可能情况。

存储基因数据,一般用什么数据库?

基金数据可以拍郑使用mysql,sqlserver等关系型数据库袭清颂

这种数正氏据库存储效率高, 增删改查比较方便

它提供应用程序中数据库的有关信息,在单机数据库编程中不显式地使用它,这是因为每个数据库应用程序运行

基因相互作用 数据库的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于基因相互作用 数据库,基因相互作用数据库:解码遗传信息的重要工具,世界上主要的基因库有哪几个?,如何使用string数据库预测蛋白质相互作用,存储基因数据,一般用什么数据库?的信息别忘了在本站进行查找喔。


数据运维技术 » 基因相互作用数据库:解码遗传信息的重要工具 (基因相互作用 数据库)