ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
84 stars 25 forks source link

FeatureScatter散点图 #4932

Closed ixxmu closed 3 weeks ago

ixxmu commented 3 weeks ago

https://mp.weixin.qq.com/s/Go64e_GfgsizcfsjVHrSbg

ixxmu commented 3 weeks ago

FeatureScatter散点图 by 单细胞天地

质控方法回顾

陆续整理了单细胞数据下游质控的内容

ncount_RNA 和nFeature_RNA辅助过滤

根据线粒体基因进行过滤

ncount_RNA 和nFeature_RNA辅助过滤中,使用小提琴图对所有细胞中检测到的分子总数(ncount_RNA )以及基因数量(nFeature_RNA)进行可视化,帮助我们判断细胞在哪些位置的密度高,从而推断一个过滤的阈值

根据线粒体基因进行过滤中,首先可视化细胞中高表达的基因(TOP50)

从图中可以看到表达量最高的基因一般是线粒体基因、核糖体基因等,所以也使用小提琴图可视化然后选择一个合适的阈值进行过滤

初步质控的话一般是基于ncount_RNA 和nFeature_RNA和线粒体基因的特征来进行过滤,在数据处理过程中的合理的质量控制是很有必要的中就有提到

在单细胞质控中一般先跑默认的质控的流程,但是如果分析结果不尽人意那就需要自行探索最佳质量控制流程

除了用小提琴图可视化来辅助判断阈值,其实也可以可视化这些特征之间关系,seurat包中就有FeatureScatter()函数用来可视化两个特征的相关性,那就一起来了解一下叭!

FeatureScatter散点图

FeatureScatter()函数可以用于可视化两个高变特征(通常是基因)在单细胞数据集中的表达水平。结果生成一个散点图,其中每个点代表一个单独的细胞,X 轴和 Y 轴分别代表两个指定特征的表达量。

一般在质控过程中我们会简单可视化一下nCount_RNA vs nFeature_RNA,即基因数量与分子总数的关系的散点图

从图中可以简单推断测序深度与基因数量的关系,图上会显示两者之间的相关系数,高质量的测序数据中两者基本处于正相关的关系

FeatureScatter()函数是用来展示单细胞中两个特征之间的关系,所以除了可以简单的展示基因数量与分子总数的关系,还可用来查看所有细胞或某个细胞中两个基因的相关性

基因相关性可视化

可以在Pbmc的数据集,查看一些细胞亚群的marker基因的相关性

FeatureScatter(pbmc, feature1 = "CD3E", feature2 = "CD3D")

CD3D和CD3E是T细胞亚群的普适性的Marker基因,一般我们通过先判断亚群是否存在这两个Marker基因去推断是否是T细胞亚群,但其相关性为0.51,属于是中等程度的正相关,说明两个基因的表达水平在细胞亚群中倾向于一起增加或减少,但这种关系并不是绝对的

FeatureScatter(pbmc, feature1 = "CD3E", feature2 = "CD19")

如果是不同亚群的Marker基因,CD3E和CD19分别是T细胞和B细胞亚群的Marker基因,可以看到它们表达水平之间存在非常弱的相关性,CD3E和CD19的表达水平可能相对独立,它们可能受到不同的调控机制控制,在细胞的生物学功能中扮演不同的角色。

#monocytes
FeatureScatter(pbmc, feature1 = "S100A8", feature2 = "S100A9")

使用FeatureScatter计算单核细胞的S100A8和S100A9相关性,结果显示相关系数为0.87两个基因在表达水平上存在较强的正相关性,说明S100A8和S100A9可能在单核细胞的生物学功能中共同起作用,它们可能参与了相似的细胞过程或信号通路。

小结

FeatureScatter提供了一个直观的方式来观察两个基因的表达水平是否存在某种关系,比如正相关、负相关或无关。

可以通过分析特定细胞亚群中基因的相关性,可以揭示该亚群的分子特征和生物学特性。