ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

scMethBank:单细胞全基因组 DNA 甲基化图谱在线数据库 #3067

Closed ixxmu closed 1 year ago

ixxmu commented 1 year ago

https://mp.weixin.qq.com/s/G7hFi-Nc5p5u6qfQsqxpZg

ixxmu commented 1 year ago

scMethBank:单细胞全基因组 DNA 甲基化图谱在线数据库 by 单细胞天地


分享是一种态度

文章信息

题目scMethBank: a database for single-cell whole genome DNA methylation maps
日期:2022-01-07
期刊:NAR
链接:https://academic.oup.com/nar/article-abstract/50/D1/D380/6376025

简介

DNA 甲基化 (DNAm) 作为表观基因组学的一个重要分支,为转录调控提供了重要的依据,其中包括基因组印记、早期胚胎发育和癌症进展。尽管大量全基因组亚硫酸氢盐测序 (WGBS) 在绘制跨组织类型的 DNA 甲基化组图谱方面做出了巨大努力,但它在解释细胞异质性和理解特定生物学状态下的发育动态方面仍然存在一定的不足。另外,许多情况下(如哺乳动物早期胚胎发生),比较难获得大量细胞。目前开发的单细胞水平DNA甲基化策略包括:scRRBS和 scBS-seq,以及多组学方法,如 scTrioSeq2和 scM&T-seq。

不过目前大量的实验和数据在积累,大多数数据库却只提供原始数据的存储和下载,研究人员无法从这些数据中获取直观有效的信息。目前唯一的单细胞甲基化数据库 HeteroMeth, 仅存储 150 个 DNA 甲基化异质性数据而不是整个基因组甲基化谱。

scMethBankhttps://ngdc.cncb.ac.cn/methbank/scm/)的定位是一个单细胞全基因组 DNA 甲基化图谱数据库,它包括了公开可用的人和小鼠数据集的单细胞甲基化数据和元数据。

数据处理

  • sequencing reads format conversion
  • quality control:FastQC + trim galore
  • alignment:scBS-map (hg38 + mm10)
  • methylation level estimation :Methylation calls were extracted from BAMfiles after the duplicated sequences had been removed using CGmapTools
  • differential methylation analysis
  • cell cluster analysis
  • gene set enrichment analysis

数据库部署

使用Spring Boot (http://spring.io/) 组织,部署在 Centos Linux 环境。处理后的数据和注释文件存储在 MySQL (https://dev.mysql.com) 中。

前端显示是使用 Thymeleaf (https://www.thymeleaf.org)、Bootstrap4 (https://getbootstrap.com) 和semantic-ui (https://semantic-ui.com) 呈现。

几个 JavaScript 库,如 zTReeJS、HighchartJS、EchartsJS、PlotlyJS 和 AJAX 用来构建交互式和动态网页。

数据库内容

包含了8328个人和小鼠的全基因单细胞甲基化数据和metadata,覆盖了15个项目、29种细胞类型和2种疾病。细胞类型主要有:mbryonic cells (11.0%), cancer cells (14.4%), germ cells (10.7%), nerve cells (54.5%), stem cells (7.9%) and other cell types (2.3%)。涉及的生物学背景包括早期胚胎发育、癌症进展、细胞分化和衰老。

交互式可视化

cMethBank 还提供了两种交互式可视化感兴趣样本的 CpG 甲基化的方法。

  • 首先,热图模式图使用户能够通过输入基因名称或指定基因组位置来浏览局部区域相对更广泛的甲基化模式。热图提供了不同样本甲基化状态的直观比较。
  • 其次,对于某些特别关注的位点的模式,也允许更精细的棒棒糖样图,以帮助用户更精确地解释单细胞甲基化谱。

此外,来自不同数据集的所有单细胞样本的 t-SNE 分析结果显示在细胞群模块中,点颜色代表不同的细胞群。

简易下游分析

提供了Lollipop plotter、DMR 注释和 Enrichment 分析工具。

用户上传的DMR列表将匹配到相关的基因组元件,包括启动子、5'UTR、3'UTR、外显子、内含子、下游和基因间。基于注释的基因列表,进行GO和KEGG分析,结果也可访问。


往期回顾

2022单细胞关键意见领袖的关键文章

单细胞RNA-seq分析小鼠肺动脉高压内皮细胞

单细胞转录组聚类算法: scGMAI

人类远端肺部气道细胞图谱绘制

多组学单细胞数据库:HTCA






如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程



看完记得顺手点个“在看”哦!


生物 | 单细胞 | 转录组丨资料
每天都精彩

长按扫码可关注