ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
124 stars 31 forks source link

泛癌层面的表观调控单细胞多组学资源 #4534

Closed ixxmu closed 9 months ago

ixxmu commented 9 months ago

https://mp.weixin.qq.com/s/ND6DdFmggy-apPMCWXMybQ

ixxmu commented 9 months ago

泛癌层面的表观调控单细胞多组学资源 by 生信菜鸟团

美国圣路易斯华盛顿大学的Li Ding团队是TCGA计划的重要发起者和参与者,而TCGA计划大家都很熟悉了,在2012附近就产出了几十篇CNS文章,而且在2018和2020又产出了一两百的CNS子刊级别的TCGA数据挖掘成果,非常的厉害!

最近(2023年底)他们又在《Nature》杂志上合作发表了题为 《Epigenetic regulation during cancer transitions across 11 tumour types》的文章,主要是使用了snATAC-seq与snRNA-seq两个单细胞技术,量化了十几个癌症的两百多个病人的样品。可以理解为单细胞层面的TCGA计划?或者说是TCGA计划的单细胞衍生?

11种癌症类型的201名患者中获取了225个样本

让我们一起来看看这个资源吧,是泛癌层面的表观调控单细胞多组学!首先看样品数量,总共是: 225 samples from 201 patients across 11 cancer types

  • 158 primary and 52 metastatic tumour samples and 15 normal adjacent tissues (NATs)
  • snATAC-seq analysis of all 225 samples, along with paired single-cell or single-nucleus RNA-seq (sc/snRNA-seq) for 206 of these samples

当然了,并不全部是新产出的数据,还纳入了之前的研究的一些数据,包括:

  • 14 scRNA-seq multiple myeloma (MM) samples,
  • 10 snRNA-seq PDAC samples,
  • 14 snRNA-seq glioblastoma (GBM) samples,
  • 28 snATAC-seq and 27 snRNA-seq clear-cell renal cell carcinoma (ccRCC) samples

让我们首先看看snATAC-seq的数据分析情况:

  • The snATAC-seq data encompassed 1,019,175 nuclei from the 225 samples (mean nuclei per sample, 4,530)
  • averaging 126,196 ACRs (accessible chromatin regions)per sample, with most appearing in intronic (49%), distal intergenic (30.8%) and promoter (8.6%) regions, as expected (

因为有配套的单细胞转录组数据,所以很容易做细胞亚群注释,联合起来是 sc/ snRNA-seq data yielded 1,157,955 cells or nuclei,

  • 250,222 immune,
  • 69,684 stromal,
  • 69,506 normal epithelial
  • 588,895 cancer cells

详细的数据情况,可以自行阅读文献:

详细的数据情况

虽然说数据本身都是在dbGaP里面,需要申请后才有可能访问:

  • Sequencing data are part of Human Tumour Atlas Network (HTAN) dbGaP Study accession phs002371.v3.p1
  • Clinical Proteomic Tumour Analysis Consortium (CPTAC) dbGaP Study accession phs001287.v17.p6.

但是也网页工具可以访问:https://data.humantumoratlas.org/

网页工具

另外,值得一提的是这些样品本身也有肿瘤外显子数据:Bulk whole-exome sequencing (WES) data were also generated for 195 samples  ,所以文献的method里面有大量的肿瘤外显子数据分析环节描述:

肿瘤外显子数据分析

我们在《生信菜鸟团》有一个专栏:《肿瘤外显子》

该专栏的目录(节选)如下:

虽然落脚点是肿瘤外显子的数据分析,但是掌握了这个系列里面的软件安装和数据库资源配置之后,处理普通的外显子数据也不在话下!