最常用的数据库

重要生物信息学数据库(科普生物信息学数据库大全)(1)

#1

NCBI(The National Center for Biotechnology Information):美国国家医学图书馆(NLM)的一部分,包含 GenBank 中的基因组测序数据、PubMed Central 和 PubMed 中的生物医学文章索引以及与生物技术相关的其他信息。该数据库无需注册,点击界面右侧选择数据库类型即可进入相应数据库检索基因序列信息。

网址:http://www.ncbi.nlm.nih.gov

#2

PDB (Protein Data Bank):一个大分子结构数据库,主要包含原子坐标,蛋白质结构的其他信息和除蛋白以外生物大分子的信息,使用时无需注册付费,在检索框中直接输入关键词/名称即可完成检索,可查看蛋白质的三维数据库文件并进行下载。

网址:https://www.rcsb.org

#3

KEGG(Kyoto Encyclopedia of Genes and Genomes):一个整合了基因组、化学和系统功能信息的综合数据库,大致分为系统信息、基因组信息和化学信息三大类,细分为16个主要的数据库,包括代谢通路数据库、基因数据库、配体数据库等。用户使用时无需注册,可在检索框中输入代谢途径、基因名称等进行检索,也可在界面上选择子数据库后进行检索。

网址:https://www.kegg.jp/kegg/

#4

EcoCyc (Encyclopedia of Escherichia coli genes and metabolism):由SRI国际提供的通路数据库,是一个专注于代谢通路的高质量数据库。

网址:https://ecocyc.org/

常用的基因序列数据库

重要生物信息学数据库(科普生物信息学数据库大全)(2)

#1

GeneBank DNA序列数据库:美国国家医学图书馆NLM下属国家生物技术信息中心NCBI开发的核苷酸序列数据库,是国际核苷酸序列数据库合作的成员,是核酸三大数据库之一。该数据库可通过NCBI数据库下的Nucleotide进行检索,无需注册,在检索框中输入基因名称、序列等信息即可。

网址:https://www.ncbi.nlm.nih.gov

#2

EMBL核苷序列数据库:由欧洲生物信息学研究所维护的全面的核酸序列数据库,是核酸三大数据库之一。用户使用时无需注册,只需在检索框中输入基因名称、蛋白质名称等关键词点击检索即可,另外该数据库还提供下载功能。

网址:https://www.ebi.ac.uk

#3

DDBJ日本DNA数据库:是一级核酸数据库,是三大DNA数据库之一,无需注册。该数据库有序列提交、数据查询、数据分析等功能。以数据查询为例,选择所需数据库,输入相应登录号、序列等信息即可完成检索,也可对检索结果进行下载。

网址:https://www.ddbj.nig.ac.jp/

#4

RefSeq数据库:可提供高质量、无冗余、完整的序列信息(包括基因组的DNA、转录成的RNA以及蛋白质序列信息)。该数据库位于NCBI数据库中,进入NCBI数据库主页,在数据库下拉框中选择RefSeq即可开始检索,无需注册。

网址:https://www.ncbi.nlm.nih.gov/refseq/

#5

BioSino数据库:由中国自主研发的核酸序列公共数据库,无需注册。

网址:https://www.biosino.org/bmdc/

#6

GDB人类基因组数据库:用于构建人类基因组图谱,开发描述序列水平的基因组内容的方法。

网址:http://www.gdb.org/

常用的蛋白质数据库

重要生物信息学数据库(科普生物信息学数据库大全)(3)

#1

*GeneBank DNA序列数据库:

网址:https://www.ncbi.nlm.nih.gov

#2

*UniProt(Universal Protein ):合并了分属不同研究所下的PIR-PSD、SWISS-PROT和TrEMBL数据库,具有世界上最全面的蛋白质分类信息,是蛋白质序列与功能主要的知识库,由3部分组成(分别是UniProtKB、UniRef和UniParc)。使用时无需注册,可免费检索,选择需检索的数据库后,在检索栏中输入蛋白质ID或Accession number即可查询蛋白质功能等信息。

网址:https://www.uniprot.org/

#3

*TrEMBL:包括了所有EMBL库中的蛋白质编码区序列,提供了全面的蛋白质序列。该数据库是UniProtKB数据库的组成部分之一,可直接使用。使用时在UniProt数据库中选择UniProtKB,在检索栏中输入ID号、蛋白名、基因名等关键词即可。

网址:http://www.ebi.ac.uk

https://www.uniprot.org/

#4

*SWISS-PROT(又称为蛋白质专家库,ExPASy):所有条目都经过专业的分子生物学家和蛋白质化学家通过计算机工具并查阅相关文献资料仔细核实,可从中检索获得各种蛋白质的氨基酸序列及其各种配基结合位点、酶活性位点等,是UniProtKB数据库的组成部分之一,无需注册。使用时在UniProt数据库中选择UniProtKB,在检索栏中输入ID号、蛋白名、基因名等关键词,也可使用高级检索。

网址:http://expasy.org

https://www.uniprot.org/

#5

*PIR国际蛋白质序列数据库:是提供按同源性和分类学组织的一个全面的、经过注释的、非冗余的蛋白质序列数据库,还提供免费的蛋白会数据库和分析工具,可直接检索并下载,无需注册。点击Search/Analysis进入蛋白质序列检索,选择数据库及领域后输入蛋白质名称、ID等信息即可完成检索,此外也可在右上方选择相应检索方式。

网址:http://pir.georgetown.edu/

#6

*PDB(Protein Data Bank)蛋白质结构数据库:RCSB PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)结构的数据库,用户可直接查询、调用和观察库中所收录的任何大分子三维结构,无需注册。在检索框中输入关键词或名称即可查找蛋白质结构,还可在线观看或下载蛋白质的三维数据结构。

网址:https://www.rcsb.org/

#7

*SCOP蛋白质结构分类数据库:英国医学研究委员会分钟生物学实验室和蛋白质工程中心开发的基于web的蛋白质结构分类、检索和分析系统,详细描述了已知的蛋白质结构之间的关系。可使用关键词、ID、序列检索,也可按照蛋白质结构类型或蛋白质类型进行浏览,无需注册。

网址:

http://scop.mrc-lmb.cam.ac.uk/scop/

#8

*CATH蛋白质结构分类数据库:是一个免费公开可用的在线资源,提供有关蛋白质结构域进化关系的信息,可使用文本、ID、序列等信息进行检索,无需注册。

网址:http://www.cathdb.info/

#9

*InterPro数据库:是一个集成的蛋白质结构域和功能位点数据库,通过将蛋白质序列分类为家族并预测域和重要位点的存在来提供蛋白质序列的功能分析,可以使用InterPro 网站获取有关单个蛋白质家族、域、重要位点的信息。使用时可使用序列、文本、蛋白质结构等信息进行检索,也可按照蛋白质组、蛋白质结构、分类方法等进行浏览检索,无需注册。

网址:http://www.ebi.ac.uk/interpro/

基于序列信息的疾病相关

重要生物信息学数据库(科普生物信息学数据库大全)(4)

疾病综合数据库

OMIM在线《人类孟德尔遗传》:以人类孟德尔遗传与疾病为基础的人类基因及其相关突变的在线目录,可用于查找疾病相关基因及位点,并涵盖了不同程度的综合性疾病的资料。若只需检索查看可直接使用,若有数据下载需求时需要注册账号。

网址:http://www.omim.org/

镜像网站:https://mirror.omim.org/

序列变异数据库

HGMD人类基因变异数据库(The Human Gene Mutation Database)

收集了公开发表的引起人类遗传疾病的胚系突变信息,必须注册登录后方可使用。

网址:http://www.hgmd.cf.ac.uk/ac/index.php

HGBASE(Gwas Central)人类遗传双等位基因序列数据库

收录人类基因从启动子到转录终点,即基因及其前后所发现的所有单核苷酸多态性和其他变化的数据库。使用时可直接在检索框中输入HGNC基因、染色体区域、dbSNP ID、MeSH/HPO表型术语等进行检索,无需注册。

网址:http://www.gwascentral.org/

HGVS(Human Genome Variation Society)

旨在促进基因组变异的发现和表征,包括种群分布和表型关联,内含多个生物信息数据库链接。

网址:http://www.hgvs.org/

HGVA(Human Genetic Variation Archive)

是一个开放获取的遗传变异资源,它整合了来自世界范围内主要参考项目的所有变异,但也包括基本变异注释、种群频率、蛋白质效应预测、变异相关表型等增值信息。无需注册,在检索框中输入基因、HPO术语、区域等信息即可进入结果界面。

网址:http://hgva.opencb.org

ExAC(Exome Aggregation Consortium)外显子组整合数据库

整合了各种大规模测序项目外显子测序数据,可以作为严重疾病研究的频率参考数据库。

网址:http://exac.broadinstitute.org

疾病相关数据库

以下数据库均可直接检索,无需注册。

癌症基因组数据集(The Cancer Genome Atlas Program):http://cancergenome.nih.gov

人类线粒体蛋白数据库(MitoProteome Human Mitochondrial Protein Database):http://www.mitoproteome.org/

人类代谢组学数据库(Human Metabolome Database,HMDB):http://hmdb.ca/

老年痴呆症数据库(ALZGENE数据库):http://www.alzgene.org/

帕金森氏病(PDGene数据库):http://www.pdgene.org/

Mitelman 癌症染色体畸变和基因融合数据库

(Mitelman Database of Chromosome Aberrations and Gene Fusions in Cancer):https://mitelmandatabase.isb-cgc.org/

临床方面疾病相关突变数据库:https://www.ncbi.nlm.nih.gov/clinvar/

欢迎关注 【启帆医学BioSCI】微信公众号,仅作分享之用,文章版权属于原作者。如果分享内容侵犯您的版权或者非授权发布,请及时与我们联系,我们会及时审核处理。

,