ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
93 stars 25 forks source link

不应该让细胞数量成为你单细胞项目的限制 #1655

Closed ixxmu closed 2 years ago

ixxmu commented 2 years ago

https://mp.weixin.qq.com/s/1KtuKmXSodcnaBDCVb-5LA

github-actions[bot] commented 2 years ago

不应该让细胞数量成为你单细胞项目的限制 by 生信技能树

我们在2021的尾巴在《生信技能树》和《单细胞天地》等公众号推出来的10X单细胞转录组钜惠套餐,详见:2个分组的单细胞项目标准分析,原价15~20万的6个10x单细胞转录组套餐,现价10万。就相当于一个10x单细胞样品仅需1.6万。引起了很多小伙伴的注意,毕竟生命科学领域从业者或多或少都要涉及一点点单细胞,但是很多小伙伴蛮有意思的, 我们的宣传是每个10x单细胞转录组样品可以出8000附近的单细胞数量,但是他并不满足。希望可以出好几万个细胞,其实这完全就是对10x单细胞转录组的不了解。起码应该看一点综述,比如2020年9月发表在 《Experimental & Molecular Medicine》杂志,标题是:《Single-cell sequencing techniques from individual to multiomics analyses》,链接是:https://www.nature.com/articles/s12276-020-00499-2 ,就讲清楚了smart-seq2和10x技术的单细胞差异。

  • smart-seq2技术依赖于C1这个仪器,每次都是96个细胞一起测序,每个细胞的测序量这个综述可能是写错了,应该是1M-10M为佳,不太可能是100-1000个M,最重要的是它是整个RNA分子的全长测序,每个细胞都是独立的测序。
  • 但是10X呢,每次可以测好几千的细胞,每个细胞只需要5-10K的reads,而且仅仅是测RNA分子的一段即可,全部的细胞都混合在一起,虽然说有barcode可以区分。

不应该是盲目追求细胞数量的增加,普通的单细胞数据分析其实并不受细胞数量的影响而有所不同。让我们看看同济大学最近发表的文章 Cell Death and Disease (2022)13:23 ; https://doi.org/10.1038/s41419-021-04477-y ,标题是:《Single-cell transcriptomic analysis reveals the critical molecular pattern of UV-induced cutaneous squamous cell carcinoma》

使用的是  Smart-seq2,总共就350 cells,分成了5个亚群,normal KCs (112 cells), FBs (99 cells), cSCCs (75 cells), B cells (38 cells), and DCs (26 cells)

即使是就区区几百个细胞,它的降维聚类分群分析完全不受影响 ,如下所示:

降维聚类分群分析

可以很清晰的看到主要的5个亚群,以及各自的标记基因也很清晰:

  • KRT15, KRT7 (normal KCs),
  • CFD, APOD (fibroblasts (FBs)),
  • CDKN2A, KRT6A (cSCCs),
  • CD79A, IGLL1, JCHAIN, MZB1 (B cells),
  • RGS1, TYROBP (dendritic cells (DCs)).

大家可以很容易去搜索到 UV-induced cutaneous squamous cell carcinoma 的10x单细胞转录组数据集,比如10X Genomics platform (GSE144240) ,如果你做同样的降维聚类分群,会发现确实没有太多差异。大家很容易自己进行降维聚类分群然后检验我们的列表。可以参考前面的例子:人人都能学会的单细胞聚类分群注释 ,我们演示了第一层次的分群。如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

这个文章主要的下游分析就是 cSCC and normal KCs 的差异,就是KCs (Cluster 0) and cSCCs (Cluster 2) 的对比,主要的在cSCCs单细胞亚群里面的上调基因是:

  • seven keratin encoded genes (KRT5, KRT6A, KRT6B, KRT6C, KRT14, KRT16, and KRT17),
  • six genes (S100A2, S100A7, S100A7A, S100A8,and S100A9) from the S100 family,
  • five genes (SPRR2A, SPRR2B, SPRR2D, SPRR2F, and SPRR1B) from SPRR family

主要的下调基因是 CFD, APOD, and VIM ,也是同样的差异分析后的火山图而已:

火山图

目前简单的差异分析流程,基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异,公众号推文在:

写在文末

我在《生信技能树》,《生信菜鸟团》,《单细胞天地》的大量推文教程里面共享的代码都是复制粘贴即可使用的, 有任何疑问欢迎留言讨论,也可以发邮件给我,详细描述你遇到的困难的前因后果给我,我的邮箱地址是 jmzeng1314@163.com

如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:

We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。