ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

单细胞亚群细分这样弄可能不妥 #4202

Closed ixxmu closed 11 months ago

ixxmu commented 11 months ago

https://mp.weixin.qq.com/s/6kAnrgI-l8iwceunV0rbww

ixxmu commented 11 months ago

单细胞亚群细分这样弄可能不妥 by 生信技能树

新鲜出炉的单细胞数据挖掘文章:《Single-cell RNA sequencing reveals the vascular smooth muscle cell phenotypic landscape in aortic aneurysm》,主要是在关心主动脉瘤的血管平滑肌细胞表型,所以是12个主动脉瘤样本和5个正常主动脉样本(从 GSE166676和 GSE155468获得)的单细胞测序数据,如下所示:

  • GSE155468 (including 8 aortic aneurysm samples and 3 normal aorta samples)
  • GSE166676 (including 4 aortic aneurysm samples and 2 normal aorta samples)

都是公共数据,所以很容易下载其表达量矩阵后走流程,但是这个文章最后得到最重要的结果是说 A total of 7150 VSMCs were categorize into 6 phenotypes:

  • contractile VSMCs,
  • fibroblast-like VSMCs,
  • T-cell-like VSMCs,
  • adipocyte-like VSMCs,
  • macrophage-like VSMCs,
  • mesenchymal-like VSMCs.

第一层次降维聚类分群如下所示,这个时候其实就有问题了,因为CD8的T细胞居然在UMAP上面被分裂成为了两个独立的区域,一小撮CD8的T细胞居然是混入了mesenchymal类型的细胞(主要是SMC和fibroblast),而且SMC和fibroblast本身就是界限很模糊啦。

第一层次降维聚类分群

可以看到主要的分类这个时候是符合认知的:

  • monocytes/macrophages (CD14 + CD68 + CD163 +)
  • smooth muscle cells (ACTA2 + MYH11 + CNN1 +)
  • endothelial cells (ECs) (PECAM1 + VWF + ECSCR +)
  • CD8 + T cells (CD3D + CD3E + CD8A +)
  • B cells (CD37 + CD79A + CD79B +)
  • natural killer cells (CD160 + KLRC1 + XCL2 +)
  • fibroblasts (COL1A1 + COL1A2 + PDGFRA +)
  • haematopoietic stem cells (HSCs) (KIT + CD44 + GATA2 +)

当然了,文章使用的基因跟我不是很一样,这个无可厚非啦,前面我们系统性梳理了各种器官的上皮细胞的细分亚群,以及其对应的标记基因列表:

它这里面居然是没有上皮细胞,蛮有意思的。

最让人迷惑的是,里面的总共的50,690 cells 既然是已经降维聚类分群而且生物学命名了,应该是直接取 smooth muscle cells (ACTA2 + MYH11 + CNN1 +) 去继续单细胞亚群细分,但是作者这个时候选择了, All cells with ACTA2 expression levels > 1 and MYH11 expression levels > 1 were selected from the total cell population.

得到了:A total of 7150 cells were preliminarily identified as VSMCs (3255 from aortic aneurysm, 3895 from the normal aorta).

细分就有点诡异了:

诡异的细分亚群

因为 VSMCs 理论上比较纯粹的底层的单细胞亚群了,如果细分很难给出来生物学名字,比如immune cells (macrophages, B cells, T cells, NK cells) ,然后里面的每个都可以细分,因为它们并不是底层。

但是我从来没有听说过SMC这样的非免疫细胞可以从里面细分出来 T-cell-like VSMCs,  和 macrophage-like VSMCs, 虽然说命名的时候加上了 like,但是从标记图里面来看,很明显应该是前面的第一层次降维聚类分群的时候t细胞和髓系免疫细胞混入了smc里面,这个时候有两个原因:

  • smc的细胞破碎后它的标记基因污染了很多临近的单细胞比如t细胞和髓系免疫细胞
  • 部分t细胞和髓系免疫细胞和smc比较靠近可能是因为同样的参与细胞增殖状态

虽然作者在这个单细胞亚群细分后的生物学命名可能是不妥,但是作者确实是下功夫了,毕竟是拟时序,细胞因子,细胞通讯分析这3个高级分析都纳入了。

学徒作业

完成前面的GSE166676和 GSE155468数据集的表达量矩阵下载后读入到Seurat后走harmony流程后进行降维聚类分群和生物学命名,然后提取SMC子集继续细分,看看作者主要是错在了哪里。