ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
104 stars 30 forks source link

两种筛选和分析特定的细胞亚群的技术你pick谁(GFP报告系统和抗体标记) #3882

Closed ixxmu closed 11 months ago

ixxmu commented 11 months ago

https://mp.weixin.qq.com/s/QASgQAf6E64J3wduaA29gw

ixxmu commented 11 months ago

两种筛选和分析特定的细胞亚群的技术你pick谁(GFP报告系统和抗体标记) by 生信技能树

交流群里面小伙伴发了一个小鼠的肝脏单细胞转录组数据文章,说不会读取作者给出来的矩阵,文章是2019的:《Single-Cell Transcriptomics Uncovers Zonation of Function in the Mesenchyme during Liver Fibrosis》

数据集是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE137720,作者给出来的是如下所示的文件:

GSM4085623_10x_1_barcodes.tsv.gz 27.0 Kb
GSM4085623_10x_1_genes.tsv.gz 212.7 Kb
GSM4085623_10x_1_matrix.mtx.gz 50.1 Mb
GSM4085624_10x_2_barcodes.tsv.gz 28.8 Kb
GSM4085624_10x_2_genes.tsv.gz 212.7 Kb
GSM4085624_10x_2_matrix.mtx.gz 68.1 Mb

所以是只需要很简单的改名即可,如下所示:

├── [ 160]  GSM4085623_10x_1
│   ├── [ 27K]  barcodes.tsv.gz
│   ├── [213K]  features.tsv.gz
│   └── [ 50M]  matrix.mtx.gz
├── [ 160]  GSM4085624_10x_2
│   ├── [ 29K]  barcodes.tsv.gz
│   ├── [213K]  features.tsv.gz
│   └── [ 68M]  matrix.mtx.gz
├── [ 160]  GSM4085625_10x_3
│   ├── [ 22K]  barcodes.tsv.gz
│   ├── [213K]  features.tsv.gz
│   └── [ 45M]  matrix.mtx.gz
├── [ 160]  GSM4085626_10x_4
│   ├── [ 23K]  barcodes.tsv.gz
│   ├── [213K]  features.tsv.gz
│   └── [ 31M]  matrix.mtx.gz
└── [ 160]  GSM4085627_10x_5
    ├── [ 23K]  barcodes.tsv.gz
    ├── [213K]  features.tsv.gz
    └── [ 34M]  matrix.mtx.gz

每个样品都是标准的3个文件,在同一个文件夹里面,就可以批量读取啦:


dir='GSE137720_RAW/outputs/' 
samples=list.files( dir )
samples

# samples = head(samples,10) 
sceList = lapply(samples,function(pro){ 
  # pro=samples[1] 
  print(pro)  
  sce =CreateSeuratObject(counts =  Read10X(file.path(dir,pro )) ,
                          project = gsub('^GSM[0-9]*_','',
                                         gsub('filtered_feature_bc_matrix','',pro) )  ,# pro, #
                          min.cells = 5,
                          min.features = 500 )
  return(sce)
})
names(sceList) 

# gsub('^GSM[0-9]*','',samples)
sce.all=merge(x=sceList[[1]],
              y=sceList[ -1 ],
              add.cell.ids =  gsub('^GSM[0-9]*_','',
                                   gsub('filtered_feature_bc_matrix','',samples))    )
# gsub('_gene_cell_exprs_table.txt.gz','',
#      gsub('^GSM[0-9]*_','',samples) )  

as.data.frame(sce.all@assays$RNA@counts[1:101:2])
head(sce.all@meta.data, 10)
table(sce.all$orig.ident) 

后面的降维聚类分群就是常规的代码即可,我顺便看了看文章的降维聚类分群结果,蛮有意思的:

文章的降维聚类分群结果

也就是说,里面并没有我们通常看到了免疫细胞,上皮细胞等等,仅仅是mesenchymal类型的单细胞。Mesenchymal细胞免疫细胞上皮细胞是三种不同类型的细胞,它们在结构、功能和位置等方面存在显著差异。

  1. Mesenchymal细胞
  • 起源:Mesenchymal细胞源自胚胎中的中胚层组织。它们可以分化为多种不同类型的细胞,如成骨细胞、软骨细胞、脂肪细胞等。
  • 结构:Mesenchymal细胞通常呈纤维状或星形,具有多分支突起。
  • 功能:它们在修复组织和骨骼发育中起着重要作用。Mesenchymal干细胞也有抑制免疫反应和抗炎作用的能力。
  • 位置:Mesenchymal细胞分布广泛,可以在骨髓、脂肪组织、肌肉和其他结缔组织中找到。
  • 免疫细胞
    • 起源:免疫细胞是免疫系统的一部分,包括各种类型的白血细胞,如T细胞、B细胞、巨噬细胞、粒细胞等。
    • 结构:免疫细胞具有多样性的形态和结构,根据类型不同而异。
    • 功能:它们的主要功能是保卫机体免受感染和疾病。免疫细胞可以识别和清除病原体、感染细胞和异常细胞。
    • 位置:免疫细胞分布于全身的淋巴组织、血液和组织中,以便对抗感染。
  • 上皮细胞
    • 起源:上皮细胞源自外胚层组织,构成身体的皮肤、黏膜、内脏器官等外界和内界表面的组织。
    • 结构:上皮细胞通常密集排列,具有紧密连接的细胞间连接,形成生物屏障。
    • 功能:它们的主要功能是构成生物屏障,保护内部组织免受外界环境的侵害,同时也参与分泌和吸收等生理过程。
    • 位置:上皮细胞分布于皮肤、呼吸道、消化道、泌尿道、生殖道等器官的黏膜表面,也构成内脏器官的外层。

    总结来说,这三种细胞类型在起源、结构、功能和位置等方面都存在差异。Mesenchymal细胞具有多向分化潜能,免疫细胞主要用于免疫防御,而上皮细胞构成生物屏障。它们各自在人体中担任不同的生物学角色。

    我们自己读取它之后的降维聚类分群,也是如此:

    自己读取它之后的降维聚类分群

    没有文章那么干净的3个分群。。。。

    其实GFP报告系统我的第一次看到

    而之所以上面的数据集都是仅仅是mesenchymal类型的单细胞,是因为前面的实验设计方面做了:isolate the different GFP+ mesenchymal cell populations

    因为是a Pdgfrb-GFP knockin reporter mouse to label all mesenchymal cells in the mouse liver ,而且  Pdgfrb-GFP mouse labeled PDGFRb+ cells in liver with high efficiency and specificity

    这个GFP报告系统

    1. 原理:GFP报告系统利用基因工程技术将GFP基因插入到感兴趣的基因或表达的蛋白质上。当目标基因表达时,GFP也被表达,使得这些细胞或蛋白质发出绿色荧光,可以轻松识别和分离。
    2. 应用:GFP报告系统常用于追踪基因表达、蛋白质定位、基因调控研究等。它通常用于细胞培养和显微镜下观察。
    3. 优点
    • 高灵敏度:GFP荧光强度可以直接与目标基因或蛋白质的表达水平相关联。
    • 不需要杀死细胞:细胞可以保持活性,适用于动态研究。
    • 显微镜下观察:可以直观观察单个细胞或亚细胞结构。
  • 缺点
    • 通常需要基因工程:要利用GFP报告系统,需要对目标细胞进行基因工程改造,这可能会影响其生理特性。
    • 不适用于活体体内研究。

    但是使用各种抗体的流式细胞筛选就很常见了

    实际上,这个  fluorescence activated cell sorting (FACS)技术,就可以根据上面的荧光标记物(如GFP)进行细胞分选:

    1. 原理:流式细胞仪使用激光或其他光源来激发细胞或微粒中的荧光标记物(如GFP)。随后,探测器检测和记录细胞荧光的强度和波长,从而对细胞进行鉴定、计数和分析。
    2. 应用:流式细胞仪广泛用于细胞生物学研究、细胞表型分析、细胞周期分析、免疫分析等。它适用于各种样本类型,包括细胞培养、血液、组织等。
    3. 优点
    • 高通量:流式细胞仪可以快速分析大量细胞,允许高通量筛选。
    • 多参数分析:可以同时分析多种荧光标记,提供多维数据。
    • 适用于多种样本:可以用于不同来源的样本,包括体内和体外。
  • 缺点
    • 需要样本制备:样本需要进行特殊的处理和标记以适应流式细胞仪的分析。
    • 有限的分辨率:流式细胞仪不能提供像显微镜一样高分辨率的图像。
    • 昂贵:流式细胞仪的购买和维护成本较高。

    比如2022的文章:《Single-cell RNA sequencing reveals time- and sex-specific responses of mouse spinal cord microglia to peripheral nerve injury and links ApoE to chronic pain》,就是使用FACS 技术,进行 gating for CD45lowCD11BhighCX3CR1high cells.

    FACS 技术

    可以看到,拿到的单细胞转录组数据里面的基本上都是小胶质细胞,非常干净:

    基本上都是小胶质细胞

    小胶质细胞Microglia)是胶质细胞中体型最小的一种, 也俗称大脑的巨噬细胞。

    胞体细长或椭圆,小胶质细胞的形态变化多样,大致有分枝型、阿米巴型、肥大型,杆型,营养不良(衰老)型,卫星型等6种形态。小胶质细胞的形态和功能变化多样,因此找到小胶质细胞不同状态下的标志物是共同需求,目前关于小胶质细胞标志物的分类从来源上说分为刺激信号细胞相关蛋白以及分泌因子三类,从小胶质细胞活化类型大致分为稳态型、M1型以及M2型(可细分为M2a、M2b、M2c)四种,随着研究的深入,分类的精细程度会逐渐增高。

    文末友情宣传

    强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶: