菜单

最新:全球生物代谢通路数据库大汇总

  严格来讲,某些人会认为通路实际上是不存在的,更有甚者开玩笑说其实只有网络存在。但无论怎样,通路的存在是有意义的。生物通路可以直观的向我们展示生物学过程中的无数种相互作用。

  举个例子说,只需要几个标志符号、几条线和几个箭头,一个典型常见的通路可以表现受体结合的活动、蛋白质复合物、磷酸化反应、易位与转录调控。

  即使通路图看上去有时候像是涂鸦之作,但是通路图在生物学领域中的文献和日常研究工具箱中已经是必不可少的基本工具。分析所用的计算方法用到了这些通路工具的话,科研人员可以将通路与生物学注释与实验数据库连接到一起,从而形成系统生物学的一种有效工具。但是通路信息的收集和维护道路还很漫长。

  今天为大家汇总的代谢通路数据库均从相关网站搜集,鉴于国内很少有相关方面中文资料的介绍,因此大部分的文字都是查阅维基百科和相应数据库网站翻译过来的,可能会存在某些翻译不到位的地方,还请看出端倪的朋友在文章底部留言指正,小编会深表感激。

  另外,如果还有遗漏的通路数据库请留言补充。

  ________________________________________

  SMPDB
  

  http://smpdb.ca/

  SMPDB为“小分子通路数据库(The Small Molecule Pathway Database)”的缩写,它是一个互动性较强且具有数据可视化的数据资源库,含有超过618种发现于人体中的小分子通路。其中70%的通路(超过433条)为该数据独有,在其他数据库中无法找到。这些通路包括代谢、药物以及疾病通路。

  SMPDB设计创建的初衷是为了满足并支持代谢组学、转录组学、蛋白质组学和系统生物学中的通路鉴定与通路发现。还有部分数据提供了有关人类代谢通路、代谢疾病通路、代谢物信号通路和药物作用通路的超级精美的超链接图表。

  所有的SMPDB通路包括了有关器官、亚细胞、蛋白质复合物的辅助因子、蛋白复合物的位置、代谢物的位置、化学结构和蛋白质复合物的四级结构信息。每一个小分子有相应的链接,点击后可以弹出关于该小分子的详细内容。

  所有的SMPDB通路都伴有详细的描述和参考资料,每张图表上都有通路预览图、条件或过程概述。本数据库浏览起来非常方便,支持全文本格式、序列和化学结构搜索。

  用户可以使用代谢物名称、药物名称、基因/蛋白质复合物名称、SwissProt ID以及GenBank ID列表进行查询。查询结果可以形成一个与之相匹配的通路列表,并重点给出每一个通路图上的匹配分子。绘图界面还可以得到基因、代谢物和蛋白质复合物数据的可视化图表。SMPDB上所有的图片和表格都可以下载。

  ________________________________________

  KEGG

  

  http://www.genome.jp/kegg/

  KEGG,是“京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes)”的英文缩写。是当今数据最完整,使用最广泛的数据库之一,其中包含了来自各种各样的生物(超过4,700个)的495个代谢通路。这些通路都与代谢产物和蛋白质/酶信息链接。

  目前KEGG含有17,000多种化合物(来自动物、植物和细菌)、10,000种药物(包括各种盐形式和药物载体)以及将近11,000个糖链结构。KEGG有Kanehisa实验室在1995年开始筹建。是由基因组测序和其他高通量实验技术产生的大规模分子数据集的集成与解释的参考知识库。今年6月1日,该数据库已经迎来了最新版本。

  KEGG中的通路数据汇集了一系列手工绘制的通路图,展现了该数据库在分子交互作用与反应网络方面积累的扎实功底,包括:代谢(整体/概述、碳水化合物、能量、脂质、核苷酸、氨基酸、其他氨基酸、聚糖、辅酶/维生素、类萜/ PK、其他次生代谢物质、外源性化学物质、化学结构)、遗传信息处理、环境信息处理、细胞过程、生物系统以及人类疾病,还包括药物研发所用的结构关系图。

  KEGG数据库由日本京都大学的化学研究学院(ICR)金久实验室(Kanehisa Laboratory)负责维护与更新。金久实验室始建于1985年10月,那是金久实(Minoru Kanehisa)教授从美国修成回国。在上世纪八十年代末他成为日本最早开始研究基人类因组学的人,并在ICR建立起超级计算机系统。

  1991年日本人类基因组计划(Japanese Human Genome Program)正式启动,人类基因组研究中心(Human Genome Center-HGC)也在东京大学的医学科学院建成。基因组数据库实验室是HGC的第一个实验室并由金久实教授掌管。金久实教授目前为京都大学化学研究院教授,并兼任Pathway Solutions Inc技术总监以及日本非营利组织生物信息足学的会长。

  ________________________________________

  MetaCyc

  

  http://metacyc.org/

  MetaCyc是一个阐明通过实验手段阐释代谢通路的数据库。MetaCyc的数据来源于科学实验文献,含有初生代谢和次生代谢通路,还包括相关的化合物、酶和基因,比如:与大多数的微生物和植物中发生的通路有关的2,844种不同生物;带有14,051种酶反应和52,446个相关文献引用的2,526种代谢通路;MetaCyc收集了所有的由国际生物化学与分子生物学联合会命名委员会(NC-IUBMB)分配EC编号的所有酶催化反应;MetaCyc并不会为特定有机体系简历完成的代谢模型。

  和BioCyc中收录的其他数据库不同,MetaCyc为代谢通路和酶提供了大量的参考信息。比如说MetaCyc可以为预测其他有机体中的代谢通路提供高质量的参考数据。科学家们通常使用MetaCyc来回答生命科学领域的一系列问题,比如“微生物中精氨酸降解的通路是什么”,或者“细菌中已知的辅因子生物合成通路有哪些?”

  MetaCyc的目的在于通过存储每个经过实验阐明了路径的具有代表性的样本来登记大量代谢物信息。MetaCyc的应用包括:在线代谢百科全书;预测基因组测序中的代谢通路;通过酶数据库支持代谢工程;代谢数据库辅助代谢组学研究。

  MetaCyc数据支持几种不同的浏览和查询方式。对于通路,蛋白质、反应和化合物,MetaCyc网站支持:

  文本搜索:当你尚未掌握明确的目标名称时可以使用文本方式查询信息;

  使用本体进行浏览:当你希望从一般范畴到具体实例了解物质信息时可以尝试使用本方法;

  直接查询:当你知道识别符时可以尝试使用本方法;

  除此之外,将MetaCyc与BioCyc数据库系统中的数据子集库的功能进行比较的话,还可以提供一些额外的数据浏览方式,比如对于跨物种比较而言,包括:

  比较两种或两种以上生物的特定通路;

  比较两种或两种以上生物的基因组图谱。

  另外,软件的电脑版还提供了相当多的其他功能。当本地安装了多个生物特定数据库时,可以比较比较不同生物的整体代谢网络。

  斯坦福国际研究所(SRI International)是该数据库的筹建与维护运营机构。斯坦福国际研究所是一家由美国斯坦福大学成立的非营利性国际研究机构,位于加州梅洛科技园区内。该中心的使命是希望创造可以改变世界的科技解决方案让人类生活更加安全、健康并带来生产力的提高。

  目前研究所承担的生命科学研究项目包括从藻类生物中提取原油(Biocrude Oil from Algal Biomass)、靶向药物输送(Cell-Targeted Drug Delivery)、抗肿瘤先导化合物的剪接体调制器(Spliceosome Modulators as Antitumor Lead Compounds)、流感病毒RNA依赖的RNA聚合酶(RdRp)抑制剂(Influenza RNA-dependent RNA polymerase (RdRp) Inhibitors)等。

  ________________________________________

  HumanCyc

  

  http://humancyc.org/ 

  HumanCyc是一个生物信息学数据库,描述人类代谢通路和人类基因组。该数据库版本在31个人类基因组基础上建成,可以搜索到的通路/基因组数据库包括了28,783基因以及它们的产物和代谢反应以及催化通路信息。HumanCyc提供了查询、可视化和基础数据分析以及组学数据分析的工具:组学和多组学数据库的多通路分析方法,包括把数据添加到通路图表和代谢图;把基因和通路数据储存到你注册的个人账户中,然后实现分享、分析。

  HumanCyc的定位是人类基因和代谢的百科全书,提供的用于组学数据的查询、可视化以及分析潜在数据库的工具有:可用于组学的多路径分析方法,包括将数据绘制到通路图和代谢图上的多组学数据库;把基因和通路组以SmartTables的形式存放到个人账户,然后可以共享、分析、转移你账户存储的信息。

  ________________________________________

  BioCyc

  

  http://biocyc.org/

  BioCyc中收集了7,615个通路/基因组数据库。BioCyc中的每一个数据库描述了单个有机体的基因组和代谢通路。根据用户留下的操作预览和数据更新信息,这些BioCyc中的数据库会建立起不同的层级。第一层数据库通过大量的手动创建,包含了EcoCyc、MetaCyc和BioCyc Open Compounds Database(BOCD)。BOCD里面又包含了来自数百个有机体的代谢酶激活剂,抑制剂,和辅因子。第二层和第三层数据库则包含了计算预测代谢通路,以及哪些基因编码代谢通路中缺少酶的预测和预测的操纵子。

  BioCyc提供的用于组学数据的导航、可视化以及潜在数据的分析工具包括:基因组浏览器、个体代谢通路和完整代谢图的显示、将数据绘制到通路图和代谢图上的多组学数据库;把基因和通路组以SmartTables的形式存放到个人账户,然后可以共享、分析、转移你账户存储的信息。

  更多有关BioCyc和通路工具的出版文献可以通过以下链接获取。https://humancyc.org/publications.shtml#[HumanCyc04]

  ________________________________________

  Reactome

  

  http://www.reactome.org/

  Reactome包含的生物学通路经过同行评议,是一个知识数据库,除了包括代谢通路之外还有蛋白质转运与信号通路。Reactome包含了经过实验证实,手动推断和电子推断的反应路径图集合中几种不同的反应类型。Reactome含有超过20中不同有机体的通路数据,但是最基本的有机体为智人。数据库有9,600多个蛋白通路图和数据,9,800种反应和2,000个人体通路。

  Reactome的幕后团队由来自不同学科领域的专业人士组建,包括软件开发人员和数据管理员,团队的成员分别来自于纽约大学医学中心(NYUMC)、安大略省癌症研究中心(OICR),以及英国剑桥的欧洲生物信息研究所(EBI)。

  ________________________________________

  WikiPathways

  

  http://www.wikipathways.org/index.php/WikiPathways

  WikiPathways是一个开放式协同平台,用于数据可视化和分析所用的生物学通路模型的收集和传播。它是一个类似维基百科一样的数据库,用户可以自行编辑更新当中的数据,网站的布局也与维基百科非常类似,使用起来也很容易入手,网站会统计每月新增的代谢通路。数据库配备了超过20个物种的通路,其中七种物种的通路多大100多条。人类通路集包含了800多个通路,涵盖了7500种基因。除此之外,WikiPathways还有超过1000代谢产物的通路。WikiPathways由美国格莱斯顿研究所(Gladstone Institutes)维护与科研数据支持。

  WikiPathways中的每一个通路都有自己专属的页面,呈现该通路最近的图解、描述、引用、下载选项、版本历史以及成分基因和蛋白质列表。任何用户都可以编辑通路信息,只要激活嵌入式路径编辑器就可以编辑。当用户完成编辑之后,一个崭新版本的通路就会留下相应的更新版本信息。

  用户还可以轻松的监测到自己修改的通路并撤销之前的编辑,还可以比较之间的差异并搜索重复通路。用户可以根据名称、基因和包含的蛋白质属性,或者根据通路自带的文本表示和平路信息找到特定通路位置。

  WikiPathways中的数据信息免费下载,下载格式也有很多,比如文本格式和图片格式,包括GPML格式,这种格式可以与Cytoscape、GenMAPP和PathVisio等通路可视化软件相兼容。

  WikiPathways的联合创始人几乎都是发表了高频引用次数文献的科研红人,比如Thomas Kelder、Chris Evelo、Alexander R Pico。

  ________________________________________

  Medical Biochemistry Page

  

  http://themedicalbiochemistrypage.org/

  Medical Biochemistry Page主要提供人体通路数据信息,虽然网站页面简单,但是在人体通路方面也做到的极致,比如每条通路都有非常详细的人体代谢过程、激素和代谢产物/蛋白质复合物相互作用信息。除此之外,网站还包括疾病状态与代谢先天性错误的临床信息。

  ________________________________________

  Pathway Commons

  

  http://www.pathwaycommons.org/pc/

  Pathway Commons是一个汇集了来自众多资源的多个物种的公开获取通路数据,也包含其他多种通力数据库。里面的通路信息包括生化反应、复合物组装,转运和催化事件,以及涉及蛋白质复合物、DNA、RNA、小分子化合物和配合物在内的物理相互作用。这个数据库是一个通路信息的中央资料库,使用的是标准生物路径交换(BioPAX)格式把通路信息整合为一体。

  ________________________________________

  Cell Signaling Technology

  

  http://www.cellsignal.com/

  Cell Signaling Technology是一家致力于提供壮心演技工具的企业,他们研发的软件工具可以用于界定隐藏在细胞功能和疾病中的机制,并拥有一个以蛋白质复合物信号为主的通路数据库。他们也提供基于蛋白质复合物的细胞过程调控的功能障碍相关疾病状态基因信息。

  ________________________________________

  Sigma-Aldrich

  

  http://www.sigmaaldrich.com/life-science/cell-biology/learning-center/pathway-slides-and.html

  Sigma Aldrich生命科学通路主要针对细胞信号和神经科学。现在Sigma Aldrich归属于德国默克制药公司,并开通了中国大陆和香港的官方网页。他的资源包括13个细胞凋亡和细胞周期通路,3个细胞因子、生长因子与激素通路,5个细胞骨架和细胞外基质通路,20个基因调控与表达通路,2个描绘了G蛋白质复合物和核酸的相互作用的路径,2条与免疫信号和血液有关的路径,5个脂质细胞信号通路,4个多药耐药通路,12个神经生物学和神经传递通路,3个蛋白质复合物磷酸化通路,9个一氧化氮与细胞应激通路。

  ________________________________________

  DrugBank

  

  http://drugbank.ca/

  DrugBank是一个混合了生物信息学与化学计量学资源的数据库,它将详尽的药物数据(比如化学、药理与制药)与综合药物靶标信息(比如序列、结构与途径)相结合。

  数据库涵盖了超过8,261个药物条目信息,包括FDA认证的2,021个小分子药物、340个FDA认证的生物技术药物(蛋白/肽)、94个保健品以及6,000多个实验药物。DrugBank还含有涵盖面很广的用于药物基因组学研究的SNP药物数据。

  该数据库项目是由加拿大健康研究所(Canadian Institutes of Health Research)、阿尔伯塔创新-健康解决方案解决中心(Alberta Innovates - Health Solutions)以及加拿大国际代谢组学研究中心(TMIC)组建,由国家资助进行代谢组学研究。目前该数据库已经更新到5.0版本。

  加拿大代谢组学研究创新中心(TMIC)是由国家资助的核心研究机构,拥有强大的基础设施和优秀的科研人员,他们所从事的尖端代谢组学研究课题包括临床试验研究、生物医学研究、生物制品研究、养分分析和环境试验。

  该研究中心一共由6位男博士执掌,分别为Dr. David Wishart (加拿大伯塔大学),Dr. Christoph Borchers (加拿大维多利亚大学和麦克吉尔大学),Dr. Liang Li (加拿大阿尔伯塔大学),Dr. James Harynuk (加拿大阿尔伯塔大学),Dr. Michael Overduin (加拿大阿尔伯塔大学)以及Dr. Philip Britz-McKibbin (加拿大麦克马斯特大学)。

  ________________________________________

  herapeutic Target DB

  

  http://bidd.nus.edu.sg/group/cjttd/

  Therapeutic Target Database(TTD)是一个专门为提供关于文献中描述的已知治疗蛋白和靶核酸、靶向疾病条件、通路信息以及针对每种标靶的响应药物/配体设计的药物数据库。

  该数据库目前含有2,025个标靶、17,816种药物以及3,681个多靶点药物。该数据库在2011年8月25日已经更新到4.3.02版本。新版本提供定量构效关系(QSAR)模型和标靶验证信息。而且多靶点药物数据还有相应的结构和药效信息,而复方制剂和天然药物以及药物种类来源数据也包含其中。

  Therapeutic Target Database(TTD)属于Bioinformatics & Drug Design group(BIDD)数据库资源的一个分支。BIDD的数据库一共分为三大类,分别为Pharmainformatics Databases(药物信息学数据库PhD)、Bioinformatics Databases(生物信息学数据库BiD)和Herbinformatics Databases(草药信息学数据库HiD)。

  PhD包括了以下子数据库:Therapeutic Target Database(靶向治疗数据库TTD)、Chemical Families Database(化学物质家族数据库CFam)、Drug Adverse Reaction Target(药物不良反应指标DART)、ADME-Associated Protein(ADME相关蛋白质)、Therapeutically Relevant Multiple Pathways(多途径相关治疗)、Pathway Crosstalk Database(通路串扰数据库)、Information of Drug Activity Data(药物活性信息)、Server for Pharmacophore Information and Mapping(药效信息和映射服务器)。

  BiD包括以下子数据库:Human Ethnic and Regional Specific Omics Database(人类种族和地区特定的组学数据库HEROD)Computed Ligand Binding Energy(计算配体结合能CLiBE)、Kinetic Data of Biomolecular Interactions(生物分子相互作用动力学数据DBI)。

  HiD则单纯为Traditional Chinese Medicine Information Database(传统中药信息数据库TCM-ID)。

  BIDD团队来自新加坡国立大学的药学系。这个团体主要活跃于计算机辅助药物设计、医药信息学和化学信息学、计算生物学与生物信息学、草药、艺术与科学研究领域。他们已经开发了很多计算方法、软件工具和数据库,用于药物发现、靶点发现、生物系统的蛋白质功能预测建模以及生物标志物发现。他们已经常见了10个数据库,9个网页版软件工具,在一些国际期刊上(Nature Reviews Drug Discovery、Pharmacological Reviews、Clinical Pharmacology and Therapeutics、Drug Discovery Today、Molecular Therapeutics、Natural Product Reports、Cancer Research、Nucleic Acids Research和Journal of Immunology)发表了161多篇文献。

  目前BIDD团队由来自新加坡国立大学的陈宇综教授带领。陈教授现任新加坡国立大学(NUS)终身教授,兼任清华大学深圳研究生院教授、深圳肿瘤个性化诊疗技术工程实验室主任。英国曼彻斯特大学获博士学位,曾先后任职美国ISIS制药公司科学家、新加坡国立大学计算科学系主任、新加坡国立大学计算药学系教授、新加坡国立大学-美国麻省理工学院联盟研究员、联合国工业发展组织高科技中心国际科学(顾问)委员会委员等,入选国家千人计划(第三批)B类。

  _______________________________________

  PharmGKB

  

  http://www.pharmgkb.org/

  PharmGKB是一个由斯坦福大学负责创建并维护,由美国国立卫生研究院出资筹建的面向公众免费开放的互联网搜索工具。如果你正从事药物基因组学研究,那么PharmGKB数据库可以为你提供遗传、基因组、分子和细胞表型数据和临床信息。

  作为一个全国协作研究联盟,美国国立卫生研究院的药物基因组学研究网络与PharmGKB一直保持战略合作伙伴关系。双方合作的目的就是帮助研究人员理解不同个体的基因变异对药物产生怎样不同的反应。

  PharmGKB数据库的信息包括但不限于心血管、肺、癌症、通路、代谢和转运研究领域的临床和基本药代动力学和药物基因组学研究。数据库创建的目的在于帮助研究人员理解不同个体的基因变异对药物作用体现出的不同反应。

  PharmGKB包含了关于基因(20,000条以上)、疾病(3000条以上)以及通路(53条)的可搜索数据。它还包含470个基因变异(SNP数据)影响药物代谢的详细信息。

  ________________________________________

  STITCH

  

  http://stitch.embl.de/

  STITCH是“搜索化学品相互作用的工具(search tool for interactions of chemicals)”的缩写,它是一个整合了代谢途径、晶体结构、结合实验和药物-靶关系相互作用信息的数据库。

  文本挖掘和化学结构相似性用于进行化学物质之间关系的预测。每一种相互作用关系都可以找到原始的数据资源。STITCH含有300,000个小分子和来自于1,133有机体的两百六十万个蛋白质的相互作用关系信息。

  目前参与STITCH数据库建设的机构有四家,分别为瑞士生物信息研究所(Swiss Institute of Bioinformatics)、

  欧洲分子生物学实验室(European Molecular Biology Laboratory)、瑞士苏黎世大学(University of Zurich)和哥本哈根大学NNF蛋白质研究中心(NNF Center for Protein Research)。每个研究中心都有相应的研究团队及研究人员,一共有11人参与到了STITCH的组建与维护。

  这四个机构的11个团队成员大都非常年轻,虽然到目前为止他们发表的文献数量加到一起还不到两百篇,但是有的论文已经产生极高的影响。比如瑞士生物信息学院的Damian Szklarczyk,自从2002年于波兰波兹南密茨凯维奇大学毕业后,他参与创作的论文在2016年被引用5066次。