Closed ixxmu closed 8 months ago
生信益站,一点就有益
!祝友友们天天开心,月月发 CNS~
生物是细胞中分子之间的一系列相互作用,导致细胞中的蛋白产物或变化。这样的可以触发新分子通路的组合,例如脂肪或蛋白质通路。通路还可以打开和关闭基因,或刺激细胞一些最常见的生物试剂涉及免疫、基因表达的调节和信号的传递。通路在基因组学的高级研究中发挥着关键作用。
通路信息可以通过大量数据库获得,从专业技术人员创建的高质量数据库到海量数据库,主题通过自然语言处理和摘要文本挖掘创建了大量预期通路。由于大小、质量和/或属性的各种差异,可以根据需要用户的目的使用正确的数据库,无论是用于商业用途还是公共用途。
世界各地正在创建通路数据库。每个数据库都强烈反映了其构建者的意图和目的。有些数据库有详细的通路求助,而另一些数据库则有详细的信号通路。大多数数据库是由管理者创建的,他们阅读论文并提取通路信息,这些信息将与数据库中的通路图组织在一起。其他的则使用自然语言处理和文本挖掘来创建,从论文中提取各种生物关系,例如基因调节关系,把它们组织到数据库中。
KEGG(Kyoto Encyclopedia of Genes and Genomes)(http://www.kegg.jp/)是由京都大学生物信息学中心和东京大学人类基因组中心共同开发的一系列数据库。正如百科全书的名字一样表明,该数据库包含系统理解生物学所需的信息,例如基因组序列和化学信息。KEGG 的“Pathway”部分主要由通路组成。对于非商业用途,许可证是免费的,而对于商业用途,许可证由 Pathway Solutions Inc.(http://www.pathway.jp/) 出售。KEGG 的独特叉车利用其对车轮、原型和人类实现的关注和覆盖。目前,细胞周期和细胞采集的信号放大器正在扩展。新的通路是由阅读和总结相关文献的专业人士(策展人)创建的。该数据库以 KEGGML 的格式存储。由于后面的通路被显示为 GIF 文件,因此用户不能轻松地编辑通路信息。
BioCyc 是 SRI International (http://www.biocyc.org/) 提供的备份数据库。该数据库是由 SRI International 生物信息学研究组发起的,其目的是为了获得高质量的数据库。与 BioCyc 相关的是 EcoCyc、 MetaCyc、HumanCyc 数据库。学术和非营利用途的许可证是免费的。人类和大肠杆菌是与其他多种生物体一起上市的主要生物体。EcoCyc 主要是大肠杆菌通路的数据库。这些反应以化学方式 EcoCyc 还包含少量信号支持。策展人从文献中提取了通路知识。通路以乳腺癌格式描述。此外,还导入了导出通路上游的调控基因信息。换句话说,有助于通路与编码酶及其调节因子的基因之间存在联系。通路图显示按详细程度分开。在最详细的层面上,导出产物以化学方程式的形式显示。
Reactome 是一个包含细胞需求和信号缺失的备份数据库(http://www.reactome.org/)。冷泉港实验室、欧洲生物信息学研究所和基因本体联盟(后面提到的基因本体联盟)是该项目的主要臂。虽然是编写主要目的生物体,但它还拥有小鼠和支架等 22 个其他物种的数据。人类反应组的通路和反应可以通过网络浏览器查看,但不能编辑。存储格式是底层的,但可以多种格式获得大量通路。
WikiPathways 是一个社区资源,用于贡献和维护致力于生物通路的内容。任何注册的 WikiPathways 用户都可以做出贡献,任何人都可以成为注册用户。贡献由一组管理员监控,但大多数同行评审 WikiPathways 使用 MediaWiki 软件、图形图形编辑工具 (PathVisio) 和通路主要基因、蛋白质和失踪物系统的集成 BridgeDb 数据库构建。
Ingenuity Pathways 知识库 (IPKB) 是由 Ingenuity Systems Inc. (http://www.ingenuity.com/) 创建的通路数据库。所有许可证,包括学术许可证和非营利许可证,都需要付费。该数据库由基因调控和信号负载组成。管理员从该数据库的文献中提取知识,该数据库目前包含人类、小鼠和遗传的遗传信息。
ResNet (http://www.ariadnegenomics.com/) 是 Ariadne Genomics 创建的通路数据库。学术和商业许可证需要付费。ResNet 的通路主要包括基因调控通路和信号通路。与其他数据库不同,ResNet 是通过计算机分析构建的。换句话说,通路和网络是通过相关文献的自然语言处理创建的。MedScan 用于该自然语言处理过程。该数据库主要根据 PubMed 中的摘要构建,但有些条目使用全文。此外,还有少量策展人创作的作品。MedScan 创建的通路数据可以通过查看工具 Pathway Studio 查看。与其他数据库类似,MedScan 使用自己的专有格式。
元数据数据库可以整合各种数据库中包含的知识。PathGuide (http://www.pathguide.org/) 是一个交互和通路相关资源的综合目录,目前在其元数据库中已推出超过 702 个资源 PathwayCommons 和 ConsensusPathDB 是存储集成生物通路数据的数据库示例。特别是之前,从各个项目收集数据并以标准化格式表示。这些元数据数据库特别适合分析集成的通路信息。
尽管对于数据组织和存储至关重要,但生物数据库面临的挑战是多方面的。首先,由于本体表面的不一致,数据库内容的集成变得复杂;因此,非标准化命名法需要一种解决方法,需要一种解决方法进行地图。另一个主要问题是数据可能不完整、不明确、包含错误、信号或与文献不一致。随着新知识的到来,也可能需要定期更新。专业数据库的问题包括通路数据库中的通路图,这些图本质上通常是静态的并且仅代表生物学的快照。因此,重要的是要以某种能力评估和解释这种可变性,使这些数据库的用户最终能够从实际用途中受益。
虽然通路数据库有很多,但即使是理想化的统一版本也显然不够全面。大多数数据库都专注于特定类型的生物过程,反映特定群体的研究兴趣和专业知识。这些数据库在内容、质量和此外,资源的缺乏限制了大多数数据库无法提供最新知识的能力,因为需要消化的科学文献非常庞大并不断积累。目前,通路数据库中存储的信息仍然依赖于科学文章中传递的知识。综合存储方法似乎是解决问题的自然方法;然而,它受到了数据模型和缺乏标准化数据访问方法等问题的阻碍。已经开发了各种数据交换标准来帮助通路信息的、组织和交换。然而,它们仍处于早期发展阶段。
本文来源:https://omicstutorials.com/introduction-to-biological-pathway-databases/
OK,今天的分享到此为止。咱们明天见~
❝对
本篇文章有疑问
,或者有科研服务需求
的友友可以在益站发消息留言
,也欢迎各位童鞋扫下面的二维码
加入我们的
https://mp.weixin.qq.com/s/Jro8boad0rwOVwOpPxSl3Q