ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
103 stars 30 forks source link

为什么会有好看的单细胞降维聚类分群的数据分析结果 #2580

Closed ixxmu closed 2 years ago

ixxmu commented 2 years ago

https://mp.weixin.qq.com/s/dB_TvZSaUpMsnW89INog_A

github-actions[bot] commented 2 years ago

为什么会有好看的单细胞降维聚类分群的数据分析结果 by 生信菜鸟团

之前我们组织了大量单细胞文献图表复现,就是2021和2022期间一直在安排学徒和实习生做单细胞数据集图表复现的腾讯会议分享,其中2021的100次单细胞分享,仅仅是30个成功录屏,已经编辑上传到b站:

  • https://www.bilibili.com/video/BV14b4y177EJ【生信技能树】单细胞文献分享计划11月
    • https://www.bilibili.com/video/BV1zY411L7Zg【生信技能树】单细胞文献分享计划1月
    • https://www.bilibili.com/video/BV1734y117f7【生信技能树】单细胞文献分享计划12月

如果大家系统性刷一遍我们分享的文章,会发现里面的文献里面的降维聚类分群图表大多分群很清晰。比如西湖大学的发表于2022年6月的,发表在Cell Discovery 的文章 :《Single-cell multiomics analysis reveals regulatory programs in clear cell renal cell carcinoma》,就可以看到第一层次的单细胞亚群清晰可见的界限,如下所示:

第一层次的单细胞亚群清晰可见的界限

就是我们一直确定的肿瘤单细胞降维聚类分群规则啦,第一层次分群也是肿瘤上皮细胞,基质细胞(内皮,成纤维等),免疫细胞(淋巴系的T, NK 和B,髓系的巨噬和单核)。

恰好这个西湖大学的 团队非常贴心的整理了其全套单细胞多组学下游分析R语言代码给大家,在:GitHub (https://github.com/Dragonlongzhilin/RenalTumor). 让我们打开看看为什么他们可以做到比较漂亮的结果吧。首先里面有去除双细胞步骤,如下所示:

去除双细胞步骤

可以看到,仅仅是一个去除双细胞步骤,作者就探索了各种参数。

前些天组建了《 单细胞多组学上下游全打通 》的微信交流群,是关于  clear cell renal cell carcinoma (ccRCC)  的肿瘤微环境的单细胞多组学,包括:

  • single-cell RNA sequencing (scRNA-seq)
  • single-cell assay for transposase-accessible chromatin sequencing (scATAC-seq)

数据在PRJNA768891,然后看看文章的降维步骤,也是多种算法组合起来使用,看不同参数后的可视化效果:

pdf("2.Cluster/SCT.Harmony.Integration.PC50.feature3000-test.pdf")
pdf("2.Cluster/SCT.Harmony.Integration.PC40.feature3000.pdf")
pdf("2.Cluster/SCT.Harmony.Integration.PC30.feature3000.pdf")
pdf("2.Cluster/Stardard.Harmony.Integration.PC50.feature3000.pdf")
pdf("2.Cluster/Stardard.Harmony.Integration.PC30.feature3000.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.harmony.stardard.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.harmony.SCT.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.seurat.stardard.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.seurat.SCT.pdf")

但是我们做图表复现练习题可能是会为了节省时间,通常是把我给大家的标准代码跑一遍就ok了,仅仅是一个学习的过程。

但是真正发文章的数据分析,不仅仅是做这个分析,而且是需要探索不同参数组合,看看什么样的参数效果最好。甚至如果时间足够,会探索多个软件,进行简单的测评。

写在文末

我在《生信技能树》,《生信菜鸟团》,《单细胞天地》的大量推文教程里面共享的代码都是复制粘贴即可使用的, 有任何疑问欢迎留言讨论,也可以发邮件给我,详细描述你遇到的困难的前因后果给我,我的邮箱地址是 jmzeng1314@163.com

如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:

We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。


github-actions[bot] commented 2 years ago

为什么会有好看的单细胞降维聚类分群的数据分析结果 by 生信菜鸟团

之前我们组织了大量单细胞文献图表复现,就是2021和2022期间一直在安排学徒和实习生做单细胞数据集图表复现的腾讯会议分享,其中2021的100次单细胞分享,仅仅是30个成功录屏,已经编辑上传到b站:

  • https://www.bilibili.com/video/BV14b4y177EJ【生信技能树】单细胞文献分享计划11月
    • https://www.bilibili.com/video/BV1zY411L7Zg【生信技能树】单细胞文献分享计划1月
    • https://www.bilibili.com/video/BV1734y117f7【生信技能树】单细胞文献分享计划12月

如果大家系统性刷一遍我们分享的文章,会发现里面的文献里面的降维聚类分群图表大多分群很清晰。比如西湖大学的发表于2022年6月的,发表在Cell Discovery 的文章 :《Single-cell multiomics analysis reveals regulatory programs in clear cell renal cell carcinoma》,就可以看到第一层次的单细胞亚群清晰可见的界限,如下所示:

第一层次的单细胞亚群清晰可见的界限

就是我们一直确定的肿瘤单细胞降维聚类分群规则啦,第一层次分群也是肿瘤上皮细胞,基质细胞(内皮,成纤维等),免疫细胞(淋巴系的T, NK 和B,髓系的巨噬和单核)。

恰好这个西湖大学的 团队非常贴心的整理了其全套单细胞多组学下游分析R语言代码给大家,在:GitHub (https://github.com/Dragonlongzhilin/RenalTumor). 让我们打开看看为什么他们可以做到比较漂亮的结果吧。首先里面有去除双细胞步骤,如下所示:

去除双细胞步骤

可以看到,仅仅是一个去除双细胞步骤,作者就探索了各种参数。

前些天组建了《 单细胞多组学上下游全打通 》的微信交流群,是关于  clear cell renal cell carcinoma (ccRCC)  的肿瘤微环境的单细胞多组学,包括:

  • single-cell RNA sequencing (scRNA-seq)
  • single-cell assay for transposase-accessible chromatin sequencing (scATAC-seq)

数据在PRJNA768891,然后看看文章的降维步骤,也是多种算法组合起来使用,看不同参数后的可视化效果:

pdf("2.Cluster/SCT.Harmony.Integration.PC50.feature3000-test.pdf")
pdf("2.Cluster/SCT.Harmony.Integration.PC40.feature3000.pdf")
pdf("2.Cluster/SCT.Harmony.Integration.PC30.feature3000.pdf")
pdf("2.Cluster/Stardard.Harmony.Integration.PC50.feature3000.pdf")
pdf("2.Cluster/Stardard.Harmony.Integration.PC30.feature3000.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.harmony.stardard.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.harmony.SCT.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.seurat.stardard.pdf")
pdf("2.Cluster/AnnotateCellType/initial.cluster.seurat.SCT.pdf")

但是我们做图表复现练习题可能是会为了节省时间,通常是把我给大家的标准代码跑一遍就ok了,仅仅是一个学习的过程。

但是真正发文章的数据分析,不仅仅是做这个分析,而且是需要探索不同参数组合,看看什么样的参数效果最好。甚至如果时间足够,会探索多个软件,进行简单的测评。

写在文末

我在《生信技能树》,《生信菜鸟团》,《单细胞天地》的大量推文教程里面共享的代码都是复制粘贴即可使用的, 有任何疑问欢迎留言讨论,也可以发邮件给我,详细描述你遇到的困难的前因后果给我,我的邮箱地址是 jmzeng1314@163.com

如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:

We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。