spotBinning 在空间数据中的应用

spotBinning 在空间数据中的应用 by 单细胞天地

作者 | 周运来

男，

一个长大了才会遇到的帅哥，

稳健，潇洒，大方，靠谱。

一段生信缘，一棵技能树。

生信技能树核心成员，单细胞天地特约撰稿人，简书创作者，单细胞数据科学家。

我们知道，空间分析中常见的是解析每个spot中的细胞数，这是往细了做。而临近的细胞放到一个bin中获得概览，不仅是在可视化方面，在数据集大了之后，这种分箱的操作可以减少维度。这种分析方法或可叫做spotbinning抑或是pseudospot。之所以产生这个联想是因为之前做宏基因组的时候做过Contigbinning。今天我们就来看看spotBinning 在空间数据中的应用，主角是：同属于Seurat生态的schex ，起初，schex 拟解决单细胞转录组图谱（tsne/umap）中细胞重叠的问题。如：

library(schex)
library(Seurat)
library(SeuratData)
data("pbmc_small")
pbmc3k.final <- make_hexbin(pbmc3k.final, 10, dimension_reduction = "PCA")
p1 <- DimPlot(pbmc3k.final,reduction = 'pca')
p2 <- plot_hexbin_density(pbmc3k.final)

p1+p2

可以看到schex在pca空间中将细胞点划分为不同的区域，并计算了该区域的细胞数。当然，如果我们把pca空间换成空间位置信息，自然也是可以做类似的操作的。而空间位置的点，往往是均匀分布的，所以每个bin（箱子）可以看作是重采样的过程。下面我们就来做一下这个演示：

载入空间数据并作标准计算：

SeuratData::AvailableData()

stxBrain.SeuratData::anterior1  -> Brain
Brain <- FindVariableFeatures(Brain)
Brain %>%  NormalizeData() %>% 
  ScaleData() %>%
  RunPCA() ->Brain

Brain %>% FindNeighbors(dims=1:20)  %>%
  FindClusters()  ->Brain

坐标替换：

Brain@reductions$sptial  <- Brain@reductions$pca
# head(Brain@reductions$sptial@cell.embeddings)
Brain@reductions$sptial@cell.embeddings <- as.matrix(Brain@images$anterior1@coordinates[2:3])
Brain <- make_hexbin(Brain, 20, dimension_reduction = "sptial")
Brain

An object of class Seurat 
31053 features across 2696 samples within 1 assay 
Active assay: Spatial (31053 features, 2000 variable features)
 2 dimensional reductions calculated: pca, sptial

下面就可以调用schex了

plot_hexbin_density(Brain) + theme_bw()

可以看到明显的边际差异：处在边界上的bin中的spot更少。

绘制分群信息：

plot_hexbin_meta(Brain, col="Spatial_snn_res.0.8", action="majority") + theme_bw()

当然不止于此，我们可以在上面画基因啊。如，bin中的基因平均表达量：

VariableFeatures(Brain)
plot_hexbin_feature(Brain, mod="Spatial", type="scale.data", feature="Ttr", 
                    action="mean", xlab="row", ylab="col", 
                    title=paste0("Mean of  expression of Ttr")) + theme_bw()

还记得Seurat空间变异基因如何计算的吗？

Brain <- FindSpatiallyVariableFeatures(Brain, assay = "Spatial", features = VariableFeatures(Brain)[1:100], 
                                       selection.method = "markvariogram")
grep("Cc",SpatiallyVariableFeatures(Brain, selection.method = "markvariogram"),value = T)

[1] "Cck"  "Ccl5"

用Seurat画两个基因：

SpatialFeaturePlot(Brain,features = c("Cck", "Ttr"))

第二种方式：

FeaturePlot(Brain, features = c("Cck", "Ttr"), blend = TRUE)

schex 提供三种方式，这里看一下在空间中绘制差异基因：

plot_hexbin_interact(Brain, type=c("scale.data", "scale.data"),
                     mod=c("Spatial", "Spatial"), feature=c("Cck","Ttr"), interact="fc",
                     ylab="row", xlab="col", 
                     title="Interaction ") +
  scale_fill_gradient2(midpoint=0, low="blue", mid="white",
                       high="red", space ="Lab")  + theme_bw()

看到指定差异的interact="fc"了吗？

两基因在bin中的相关性：

plot_hexbin_interact(Brain, type=c("scale.data", "scale.data"),
                     mod=c("Spatial", "Spatial"), feature=c("Cck","Ttr"), interact="corr_spearman",
                     ylab="row", xlab="col", 
                     title="Interaction ") +
  scale_fill_gradient2(midpoint=0, low="blue", mid="white",
                       high="red", space ="Lab") + theme_bw()

除了简单的绘图 schex还可以调用shiny更灵活地调节

plot_hexbin_feature_shiny(Brain, type="counts", feature="Cck", 
                          action="prop_0", min_nbins=10, max_nbins=50, dimension_reduction="sptial",
                          mod="Spatial")

如果分群好的话，还可以用plus版的，加上分群信息：

plot_hexbin_feature_plus(Brain,
                         col="Spatial_snn_res.0.8", type="counts",
                         feature="Cck", action="mean")+theme_bw()

本文提出的问题其实是在空间数据中如何重采样? 在单细胞转录组中重采样的话，随机抽取就可以了，但是在空间中如果随机抽取的话，势必把好不容易得到的空间信息采的稀烂。如：

Brain2 <- subset(Brain,cells=WhichCells(Brain,downsample = 50))
p1<- SpatialDimPlot(Brain2)
p2<- SpatialDimPlot(Brain)

p1+ p2

其实空间数据的获得本身就是空间位置分箱采样的过程，不信请看：

Binning 在空间数据中的应用：

References

[1] High-definition spatial transcriptomics for in situ tissue profiling:

如果你对单细胞转录组研究感兴趣，但又不知道如何入门，也许你可以关注一下下面的课程

看完记得顺手点个“在看”哦！

生物 | 单细胞 | 转录组丨资料

每天都精彩

长按扫码可关注

ixxmu / mp_duty