ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
112 stars 30 forks source link

顶刊精读 | 北大张泽民院士新作,人类成纤维细胞图谱的构建与表征 #5631

Closed ixxmu closed 2 weeks ago

ixxmu commented 2 weeks ago

https://mp.weixin.qq.com/s/H1MfzvsK-HH7OeBAQ6aZBg

ixxmu commented 2 weeks ago

顶刊精读 | 北大张泽民院士新作,人类成纤维细胞图谱的构建与表征 by BioJournal Link

Basic Information

  • 英文标题: Cross-tissue human fibroblast atlas reveals myofibroblast subtypes with distinct roles in immune modulation
  • 中文标题:跨组织的人成纤维细胞图谱揭示了具有不同免疫调节功能的肌成纤维细胞亚型
  • 发表日期:19 September 2024
  • 文章类型:Article
  • 所属期刊:Cancer Cell
  • 文章作者:Yang Gao | Zemin Zhang
  • 文章链接:https://www.sciencedirect.com/science/article/pii/S1535610824003192

Highlights

Para_01
  • 一种跨组织和疾病的人类成纤维细胞图谱揭示了多种成纤维细胞亚型
  • 病理状况重塑成纤维细胞的转录组和细胞组成
  • PI16+ 和 LRRC15+ 成纤维细胞连接到功能上不同的免疫微环境
  • MMP1+肌纤维母细胞有助于免疫抑制生态位的形成

Summary

Para_01
  1. 纤维母细胞以其功能多样性而闻名,在炎症和癌症中发挥着关键作用。
  2. 在这项研究中,我们对来自517个人类样本的纤维母细胞进行了全面的单细胞RNA测序分析,涵盖了11种组织类型和各种病理状态。
  3. 我们识别出具有普遍性和组织特异性特征的不同的纤维母细胞亚群。
  4. 病理状态导致纤维母细胞组成发生显著变化,包括在炎症过程中免疫调节纤维母细胞的扩张和癌症中组织重塑的肌纤维母细胞。
  5. 在肌纤维母细胞类别中,我们识别出四个转录上不同的亚群,它们来自不同的发育起源,其中LRRC15+肌纤维母细胞显示出终末分化的特征。
  6. LRRC15+和MMP1+肌纤维母细胞均显示出促肿瘤潜力,有助于免疫排斥和免疫抑制的肿瘤微环境(TMEs),而PI16+纤维母细胞在相邻的非癌性区域显示出潜在的抑瘤功能。
  7. 纤维母细胞亚型组成定义了具有不同临床结果的病人亚型。
  8. 这项研究加深了我们对纤维母细胞生物学的理解,并提出了针对癌症治疗中特定纤维母细胞亚群的潜在治疗策略。

Graphical abstract

Introduction

Para_01
  1. 成纤维细胞在维持组织稳态、响应炎性和纤维化条件、促进伤口愈合以及参与癌症进展的复杂机制中扮演着关键角色。
  2. 在癌症领域,成纤维细胞已经成为肿瘤微环境(TME)中的核心角色,发挥着多方面的作用。
  3. 这些作用包括细胞外基质(ECM)的沉积和重塑、与癌细胞进行复杂的相互信号传导以及与浸润的白细胞进行精细的交叉对话。
  4. 因此,它们作为优化抗癌治疗策略的潜在靶点而备受关注。
  5. 然而,许多挑战阻碍了当前将癌症相关成纤维细胞(CAFs)调节用于治疗利益的持续努力。
  6. 多项研究强调了成纤维细胞的异质性和可塑性是追求CAF靶向治疗的主要障碍。
  7. 对疾病相关成纤维细胞状态、它们与免疫细胞的相互作用模式及其对临床结果的影响的全面理解,可能会为疾病管理和治疗干预带来新的机会。
Para_02
  1. 单细胞RNA测序(scRNA-seq)彻底改变了我们对成纤维细胞异质性的理解,导致在多种组织类型中,在健康和病理状态下,识别出具有不同功能的成纤维细胞亚群。"," Sentence_02": "在胰腺癌中,已经描述了两种通过CD105表达区分的胰腺成纤维细胞系,分别具有促进肿瘤或抑制肿瘤的功能。"," Sentence_03": "在乳腺癌中,已经确定了两个肌成纤维细胞群,它们具有细胞外基质蛋白和转化生长因子β(TGF-β)信号特征,并通过与调节性T细胞(Tregs)的正反馈回路表现出免疫抑制功能。"," Sentence_04": "此外,已在多种癌症类型中确定CD74+抗原呈递成纤维细胞,其作用多样,从促进免疫抑制到增强抗肿瘤免疫,具体取决于特定的癌症类型。"," Sentence_05": "尽管各项研究提供了有价值的见解,但由于使用了不同的测序方法和分析手段,从这些研究中比较和提取细微差别仍然具有挑战性,这阻碍了我们对成纤维细胞异质性的理解。"," Sentence_06": "为了阐明具有潜在治疗意义的成纤维细胞的共同特征,迫切需要统一健康和病理组织中观察到的成纤维细胞身份。"," Sentence_07": "尽管最近的一项研究揭示了小鼠和人类中存在跨物种普遍的成纤维细胞亚群,但还需要从大型样本队列中进行彻底的研究,以描述不同疾病背景和组织类型中详细的人类成纤维细胞景观。
Para_03
  1. 在这里,我们整合了来自517个人类样本的scRNA-seq数据,以构建健康和疾病状态下人类成纤维细胞的全面视图。
  2. 除了之前定义的成纤维细胞群外,我们还识别出了一些未曾被充分描述的成纤维细胞群,包括HOPX+肌成纤维细胞、SFRP2+肌成纤维细胞和MMP1+成纤维细胞,它们具有独特的表型和功能。
  3. 我们对每个成纤维细胞群的通路激活和转录因子(TF)调控网络进行了深入研究,揭示了调控成纤维细胞表型的不同调控过程。
  4. 我们还展示了LRRC15+成纤维细胞及其祖细胞PI16+成纤维细胞的功能差异,二者的比例与患者预后相关。
  5. 然后,我们定义了肿瘤患者中成纤维细胞与免疫细胞共存的模式,识别出多个与成纤维细胞相关的细胞群落,每个群落都具有独特的功能特征和临床意义。
  6. 最后,我们研究了多细胞模块的空间组织,包括两个具有免疫抑制特性的模块。
  7. 这项工作揭示了不同疾病背景下多种成纤维细胞亚群详细的 功能特征,并为理解成纤维细胞表型和功能异质性的复杂性提供了前所未有的资源,指导了针对多种人类癌症类型的有效CAF靶向治疗的发展。

Results

Construction of fibroblast scRNA-seq atlas across diverse tissues and pathological states

构建在不同组织和病理状态下的成纤维细胞单细胞RNA测序图谱

Para_01
  1. 为了系统地表征在健康和病理状态下成纤维细胞的异质性,我们从以前的研究中收集了人类成纤维细胞单细胞RNA测序(scRNA-seq)数据集(图1A;表S1;STAR方法)。
  2. 为了增加特定癌症类型的覆盖率,我们纳入了来自四种不同癌症类型的38名患者新产生的scRNA-seq数据(图1A和1B)。
  3. 在经过每个数据集的严格质量控制和非成纤维细胞的剔除后(图S1A和S1B;STAR方法),我们总共获得了269,899个单一成纤维细胞转录组。
  4. 这个成纤维细胞图谱包含11种不同组织的517个样本,每个样本涵盖了一系列病理状况,包括癌前病变、慢性炎症和纤维化的各个阶段、邻近的非肿瘤组织、癌症和转移(图1A和1B)。
  • 图 1. 健康和疾病状态下的跨组织成纤维细胞图谱 (A) 研究设计和分析流程的示意图。 (B) 按病理状况(x轴)和器官(y轴)汇总的分析数据集。符号代表不同类型的数据。侧边栏显示每个器官中的成纤维细胞总数,特定癌症类型中我们的内部数据的比例有注释。注意,"发炎"一词广义上指代炎症和纤维化等病理状况以简化表达。 (C) 成纤维细胞群(FCs)的统一流形近似和投影(UMAP)可视化。特定的组别用虚线圈出。 (D) 成纤维细胞功能签名13在各个FCs中的表达模式。虚线代表所有FCs的平均签名分数。 (E) 热图显示每个成纤维细胞群中表达最高的前100个基因的表达模式,标志基因用突出显示。表达,Z分数标准化平均表达。 (F) 点图显示特定组织中所有成纤维细胞内FCs的出现频率,大小和颜色表示。右侧的饼图显示各种组织中簇丰度的分布,颜色代表不同频率基础的丰度组。 (G) 热图显示通过Ro/e(STAR方法)的簇的表型偏好。另见图 S1 和 S2 以及表 S1、S2 和 S3。
Para_01
  1. 使用批量平衡的k最近邻居(BBKNN)方法(STAR方法)对所有这些数据集进行综合聚类,共鉴定出20个转录上不同的成纤维细胞群,这些细胞群被归类到不同的功能组中(图1C和S1C-S1G;表S2)。
  2. 与之前单细胞成纤维细胞研究一致,我们的分析确认了已知成纤维细胞亚型的存在,例如PI16+成纤维细胞前体(c05),LRRC15+肌成纤维细胞(c04),IL6+炎症性成纤维细胞(c07)和CD74+抗原呈递成纤维细胞(c20)(图1C-1E和S1G)。
  3. 重要的是,我们的跨组织整合鉴定出了一些仍知之甚少的成纤维细胞群(FCs),包括各种肌成纤维细胞群,如c11-HOPX和c16-SFRP2成纤维细胞,c14-HSPA6应激相关成纤维细胞和c19-MMP1成纤维细胞,它们同时具有肌成纤维细胞和炎症性成纤维细胞的特征(图1D,1E和S1G)。
  4. 值得注意的是,基于RNA-seq本体图形用户环境(ROGUE)和单细胞聚类评估框架(SCCAF)分析,我们的细胞群显示了高内部同质性(图S1H和S1I),并且对数据整合方法的选择具有鲁棒性(图S1J;表S3;STAR方法)。
  5. 这突显了我们的整合成纤维细胞注释在揭示异质性方面的有效性。
Para_02
  1. 我们首先检查了纤维细胞(fibroblasts, FCs)在不同组织类型中的分布,并发现了几种不同的丰度模式(图1F和S2A)。
  2. 有6个FCs仅在一个或两个组织类型中发现,因此被定义为"组织特异性"FCs。
  3. 这些包括c10-PRG4纤维细胞(特异性地存在于滑膜中),c15-SOX6和c02-ADAMDEC1纤维细胞(结肠和胃),c18-HHIP平滑肌细胞(结肠),c07-IL6纤维细胞(乳腺和肺)以及c13-HGF纤维细胞(肾脏和肝脏)。
  4. 值得注意的是,这些组织特异性纤维细胞表现出与它们各自器官功能维护相关的分子的高表达。
  5. 例如,c15-SOX6纤维细胞显示出SOX6和POSTN的表达升高,这表明它可能在隐窝-绒毛轴的上皮分化和增殖中起作用,而c02-ADAMDEC1纤维细胞表达了ADAMDEC1和各种细胞因子,可能有助于固有层中的白细胞招募(表S2)。
  6. 单细胞调控网络推断和聚类(SCENIC)分析揭示了在独特的组织特异性纤维细胞簇中TF调控子的独特激活(图S2B),这表明它们可能与特定的组织相关功能有关。
  7. FOXL1,在胃肠道器官的隐窝纤维细胞中高表达,调节GREM1和WNT信号传导,这对于肠道发育和上皮稳态至关重要。
  8. TCF21,在门脉周围区域的肝星状细胞(HSCs)中高表达,可能导致慢性损伤肝脏中的活化纤维细胞的产生。
Para_03
  1. 此外,我们还鉴定出"共享"的细胞簇,这些细胞簇在一到两种组织类型中含量丰富,但在其他组织中的比例较低(图1F)。
  2. 这些包括c06-ADH1B成纤维细胞、c11-HOPX成纤维细胞、c20-CD74成纤维细胞、c17-STMN1成纤维细胞和c12-间皮细胞。
  3. c06-ADH1B成纤维细胞高表达肺特异性成纤维细胞标志,代表一组在健康和正常肺组织中高度富集的肺泡成纤维细胞(图1F和S2A)。
  4. 这些成纤维细胞也可以在正常胃和其他组织类型中检测到,这表明它们可能代表一种在组织间共享的低活化状态的成纤维细胞。
Para_04
  1. 在我们的成纤维细胞图谱中,近一半的成纤维细胞簇(9个FCs)在超过八种组织类型中广泛分布,因此被定义为"普遍"的FCs(图1F)。这些簇包括成纤维细胞样细胞(c01-SMC和c08-周细胞),应激相关的成纤维细胞(c14-HSPA6),成纤维细胞祖细胞(c05-PI16和c03-COL15A1),肌成纤维细胞(c04-LRRC15、c16-SFRP2、c19-MMP1)以及肌成纤维细胞样成纤维细胞(c09-CTNNB1)。值得注意的是,我们普遍的成纤维细胞簇高度表达了先前定义的组织共享基因,23确认了这些FCs在不同组织中的广泛分布(表S2)。有趣的是,我们观察到普遍的FCs倾向于下调组织特异性转录因子调节子,而上调与它们功能属性密切相关的TFs(图S2B-S2D;表S2)。例如,成纤维细胞祖细胞(c05和c03)表现出FOXP2的特定上调,调节与祖细胞状态相关的基因,如CD34和CD55。此外,肌成纤维细胞簇(c04和c11)上调了LEF1,WNT信号通路的一个下游TF,它可能调节多个肌成纤维细胞特征基因(图S2C和S2D)。相比之下,c14-HSPA6成纤维细胞与c07-IL6成纤维细胞和c12-间皮细胞聚类,显示出调节炎症相关基因的TFs的高活性,如NFKB1(图S2C和S2D),表明其可能促进成纤维细胞的炎症表型。

Remodeling of the fibroblast cell compartment during chronic inflammation and cancer

慢性炎症和癌症期间纤维母细胞细胞室的重塑

Para_01
  1. 在仔细观察这些成纤维细胞群的表型富集模式后,我们发现大多数组织特异性的FCs更倾向于在健康组织中富集(图1G),这进一步强调了它们在组织稳态中的作用。
  2. 然而,一些组织特异性的成纤维细胞在慢性炎症期间表现出扩张,正如在炎症性肠病中观察到的c18-HHIP SMC,以及在肾硬化症和肝硬化中观察到的c13-HGF成纤维细胞(图2A和S2A),这暗示它们参与了疾病进展。
  3. 对于组织共享的FCs,它们在病理状态下的特定富集在各组织间有所不同。
  4. 例如,c11-HOPX肌成纤维细胞在肾硬化症中富集,但也存在于几种癌症组织中(图2A和S2A)。
  5. c20-CD74抗原呈递成纤维细胞在患有类风湿关节炎和克罗恩病的患者的炎症滑膜和结肠组织中扩张,但在如肺和胰腺这样的组织中,它们主要存在于恶性状态(图2A和S2A)。
  6. 有趣的是,我们发现普遍存在的FCs,尤其是肌成纤维细胞和类肌成纤维细胞,与组织特异性和组织共享的FCs相比,在恶性状态中的富集程度更高(图1G和S2E)。
  7. 这突显了癌症与慢性伤口愈合之间的相似性,两者都涉及持续的炎症和组织重塑,这可能导致肌成纤维细胞的积累和激活。

图 2. 在炎症和癌变组织中成纤维细胞细胞室的重塑(A)箱形图比较了不同病理状态下特定成纤维细胞群的比例(颜色表示)。

  • p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001, Wilcoxon 检验。(B)在各种病理状态下的细胞类型组成的概述。如图 1C 所示,有几个群被分组。(C)与不同病理状态下成纤维细胞活化相关的标志性基因的表达。(D)箱形图比较了各种组织表型中的成纤维细胞活化分数,以健康/正常组织作为参考。Wilcoxon 检验。(E)火山图显示肿瘤与炎症组织中的成纤维细胞之间的差异表达基因。经校正 p 值 <0.01(Wilcoxon 秩和检验)且 log2(倍数变化) > 0.25 的基因被着色。(F 和 G)基于特定群(c19 或 c20)(F)和所有群(G)之间的炎症与肿瘤成纤维细胞差异表达基因的富集途径。(H)说明在炎症和癌症中成纤维细胞的组成和表型转变的模型。另见图 S2。
Para_01
  1. 比较不同疾病状态下整体的成纤维细胞组成,我们观察到了炎症组织的一个中间激活状态,这种状态保留了大量组织特异性的成纤维细胞因子(FCs),同时呈现出向癌状态转变的趋势,伴随着少量肌成纤维细胞的增加(图2B)。
  2. 通过定义一个成纤维细胞激活特征(图2C;STAR方法),我们发现与不同组织类型中的健康和肿瘤状态相比,炎症成纤维细胞的一致性中间评分水平(图2D),这表明炎症状态可能会动态地重新编织成纤维细胞组成向预癌状态,这与之前的研究是一致的。
Para_02
  1. 为了进一步探索与疾病相关的成纤维细胞的转录重编程,我们比较了具有两种表型(炎症和癌症)的组织中的基因表达数据,重点研究了两类在炎症和癌变组织中优先富集的成纤维细胞(FCs)c19和c20(图1G、2A和S2A)。
  2. 结果显示,与炎症组织相比,在癌变组织中成纤维细胞表现出较低的前炎症细胞因子(CXCL1和CCL2)表达和较高的WNT(GREM1和SFRP2)以及TGF-β受体信号传导基因(INHBA和LTBP1)表达(图2E和2F),表明它们对成纤维细胞表型有不同的影响。
  3. 通过比较来自具有匹配的炎症和肿瘤组织的器官中获得的成纤维细胞总转录组,进一步证实了这一模式(图2G),这表明在炎症中与免疫相互作用的成纤维细胞特征可以在肿瘤微环境(TME)内重新编程为组织重塑表型。
  4. 此外,伴随着这些通路的变化,我们观察到癌症中的代谢重编程,表现为糖酵解增加,可能是由于癌变条件下缺氧水平升高所驱动(图S2F)。
  5. 值得注意的是,与炎症相比,一些代谢通路在癌症中受到下调,如视黄醇代谢和DNA去甲基化,这对于维持成纤维细胞的静止状态至关重要(参考文献29、30),因此强调了通过代谢重编程和通路激活在炎症和癌变条件下对成纤维细胞表型的不同调控(图2H)。

Deciphering myofibroblast heterogeneity and their cell types of origin

解析成纤维细胞的异质性和它们的细胞来源类型

Para_01
  1. 由于肌成纤维细胞是肿瘤基质的主要部分,我们进一步研究了我们数据集中的肌成纤维细胞亚群。
  2. 我们鉴定出四个不同的肌成纤维细胞簇(c04、c11、c16和c19),它们均高度表达肌成纤维细胞特征基因(图1D和S1G),但在基因表达和富集途径上存在差异(图3A和S3A;表S2)。
  3. 主要的亚群是c04-LRRC15纤维细胞,它高度表达LRRC15(图3A),这是一个最近与具有免疫抑制特性的肿瘤促进纤维细胞相关联的标志基因。
  4. 它还表达了COL10A1和MMP11(图1E和3A),这与上皮细胞向间充质转化(EMT)有关。
  5. 值得注意的是,WNT信号通路的关键调节因子CTNNB1和PTK7也在c04中高度表达(图3A),强调了这一通路在肌成纤维细胞分化和功能中的关键作用。
  • 图3。肌成纤维细胞亚群及其调控因子的谱系关系(A)点图显示肌成纤维细胞亚群的标记基因表达水平。点的大小表示每个簇中表达细胞的分数,颜色表示归一化后的表达水平。
  • (B)泛组织成纤维细胞簇的UMAP表示,叠加了RNA速度向量。
  • (C)在不同癌症类型的代表性组织切片上进行多重免疫组化染色,显示PDGFRb+MCAM+周细胞和MCAM+LRRC15+成纤维细胞在血管和肿瘤区域的位置。白色五角星标记MCAM+LRRC15+成纤维细胞。虚线突出显示围绕血管的周细胞。
  • (D)不同成纤维细胞簇(行)之间的平均通路活性(列)。黑色虚线表示簇特异性平均通路得分。
  • (E)森林图显示c04特征表达与总生存期的关联。红色表示泛癌危险比。p值来源于Cox比例风险模型,年龄、性别和肿瘤分期校正(*p < 0.05, **p < 0.01, ***p < 0.001)。
  • (F)箱形图显示来自各种组织的肿瘤和炎症样本中肌成纤维细胞簇的比例。
  • (G)热图显示肌成纤维细胞亚群之间的平均调节子活性得分。
  • (H)热图显示在LRRC15+肌成纤维细胞(c04)中高表达的转录因子的调节子活性得分。
  • (I)预测c04特征基因(右)作为转录因子调节子的靶基因(左)。
  • (J)热图显示根据NicheNet分析确定的顶级配体对肌成纤维细胞特征基因的调控潜力。另见图S3和表S2。
Para_01
  1. 我们利用多种计算方法,如RNA速率、PAGA和CellRank,发现c04-LRRC15肌成纤维细胞似乎是肌成纤维细胞分化的最终分化状态,并且它们可以来自两个主要的细胞源,即成纤维细胞祖细胞(c05和c03)和周细胞(c08)(见图3B和S3B-S3F)。
  2. 多色免疫组化(mIHC)证实了表达周细胞标志物(MCAM+和PDGFRb+)的LRRC15+成纤维细胞的存在(见图3C),这表明这些肌成纤维细胞可能来源于周细胞,与之前的研究一致。
  3. 其他3个肌成纤维细胞亚群(c16、c19和c11)被发现是起源于不同前体细胞类型的独特中间过渡状态(见图3B和S3B),这表明它们是原始肌成纤维细胞状态。
  4. 当考虑单个癌症类型时,这一观察结果保持一致(见图S3G)。
  5. 支持分化谱系,我们发现成纤维细胞在谱系发育过程中TGFβ和WNT信号通路激活逐渐增加(见图3D),在c04-LRRC15肌成纤维细胞中达到峰值。
  6. 我们对TCGA数据集的生存分析显示,每个肌成纤维细胞簇的预后都很差,其中c04在不同癌症类型中一致表现出最差的预后,这表明终末分化的肌成纤维细胞与患者的不良生存有强烈的关联(见图3E和S3H)。
  7. 有趣的是,我们发现肌成纤维细胞簇的丰富程度在不同癌症类型中差异显著,这可能与前体细胞在特定组织中的丰富程度有关。
  8. 确实,c11和c09这两个可能来源于周细胞的簇,在胰腺癌和肝癌中分别有很高的丰富度,这两种癌症都富含周细胞(见图1F和3F)。
  9. c04和c16在乳腺癌和肺癌中最常见,后者含有大量c05祖代成纤维细胞(见图1F和3F)。
  10. c19的分布也显示出对易发炎的组织,如结肠和皮肤(见图1F和3F)的偏好,这表明肌成纤维细胞的表型特征受到器官特异性信号环境的深刻影响。
Para_02
  1. 在我的纤维母细胞集群中,由于c19-MMP1纤维母细胞显著的高表达炎症信号通路,因而特别显眼(图3D)。
  2. 它们还上调了涉及白细胞介素(MMP1、SOD2、CXCL1和CCL11)和干扰素信号(CD74、ICAM1、ISG15和B2M)的基因(图3A),提示它们潜在的免疫调节作用。
  3. 与其他纤维母细胞集群相比,HIF1A在c19中高表达,表明缺氧依赖的转录网络参与塑造c19表型,这与c19的高缺氧活性一致(图3D和3G)。
  4. 相比之下,c16-SFRP2纤维母细胞表现出与分泌的卷曲相关蛋白(SFRP)基因(SFRP1、SFRP2和SFRP4)和胰岛素生长因子(IGF)信号基因(IGF1和IGF2)高表达的水平(图3A;表S2)。
  5. 据报道,SFRP1能够抑制纤维母细胞凋亡,这提示c16具有抗凋亡表型。
  6. NFIA,一个与胶质母细胞瘤细胞凋亡逃避相关的转录因子,与其他纤维母细胞集群相比,在c16中也有所上调(图3G)。
  7. 与这些纤维母细胞集群相比,c11-HOPX纤维母细胞唯一上调了与纤维化相关的基因,包括COL4A1、TCF21、HOPX和BGN(图3A)。
  8. 涉及脂肪生成、TGF-β信号和间充质干细胞分化的基因在c11中也高表达(图S3A;表S2)。
  9. 有趣的是,我们观察到c04和c11之间有多个共享的TF调节单元(图S2B和3G),这提示它们之间的密切关系。
  10. 除了前面提到的LEF1(图S2C),我们还观察到,最近报道的能够驱动系统性硬化病(SSc)纤维母细胞分化的CREB3L1,在两个集群中都有上调(图3G)。
  11. 此外,还鉴定出几个在终末分化的纤维母细胞(c04)中既具有最高的TF调节单元激活水平又具有基因表达水平的TFs,包括SOX4、GLIS2、STAT2、CREB3L1和TEAD1(图3H;表S2),这些可能是驱动纤维母细胞分化的主要调节因子。
  12. 在c04中上调的模式也在不同组织中得到了保留(图S3I;表S2)。
  13. 此外,它们还可以调节纤维母细胞的多个关键目标基因,如FAP和LRRC15(图3I)。
  14. 其中,SOX4最近被报道通过SWI/SNF复合物依赖的染色质重塑促进CAF转化。
  15. 此外,这些TFs中的大多数也发现随着纤维母细胞分化谱系的过程中基因表达增加,这提示它们潜在的调节作用(图S3J)。
Para_03
  1. 鉴于成纤维细胞的可塑性,我们接着研究了影响肌成纤维细胞分化的细胞外信号。"," Sentence_02 ":"不出所料,我们确定TGFB1是所有肌成纤维细胞簇的最强预测刺激因子(图3J),这与TGF-β家族配体在推动成纤维细胞活化中的既定作用一致。"," Sentence_03 ":"值得注意的是,除了肿瘤坏死因子(TNF)外,干扰素家族成员,包括IFNA1和IFNG,被预测为c19特异性的顶级刺激因子,这突显了干扰素在塑造c19表型中的潜在作用(图3J)。"," Sentence_04 ":"对于c16,IL1B成为一个高度优先的调控因子。"," Sentence_05 ":"据报道,IL1B能在肌成纤维细胞中减弱TGF-β信号传导,这表明c16表型是由具有不同功能的细胞因子组合塑造的。"," Sentence_06 ":"此外,c04和c11的一个顶级调控因子是SPP1(图3J),这与内皮间质转化及纤维化相关成纤维细胞活化紧密相关,强调了其在肌成纤维细胞活化中的关键作用。"," Sentence_07 ":"总的来说,我们的发现揭示了肌成纤维细胞亚群分化是由共享的和独特的转录因子以及环境信号的组合协调调控的。"," Sentence_08 ":"这种调控高度依赖上下文,并反映了局部信号微环境中的动态变化。

Properties and plasticity of fibroblast progenitors

成纤维细胞前体的性质与可塑性

Para_01
  1. 如前所述,两种普遍的成纤维细胞前体细胞,c05-PI16和c03-COL15A1成纤维细胞,能够在多种组织类型中分化成肌成纤维细胞(图3B),与之前的一项研究结果一致。
  2. 尽管这两个簇都表现出高DPT表达的前体状态(表S2),但它们之间的基因表达谱存在显著差异,这暗示了它们具有不同的功能。
  3. 特别是,c05上调了与TNF-α信号传导(ATF3和MYC)和缺氧途径(S100A4、ACKR3和CAV1)相关的基因(图4A和4B;表S4),并且已经在血管周围区域发现,可能具有血管重塑的潜在作用。
  4. 相反,c03上调了与脂肪生成、基底膜成分(COL15A1、LAMA2和COL18A1)以及组织再生和增殖(APOD、APOE、IGF1和MDK)相关的基因(图4A和4B;表S4),这表明它们可能参与了维持上皮细胞再生和组织稳态,这与之前报道的它们位于上皮周围的位置一致。
  • 图4. 成纤维细胞祖细胞的特征及其与患者生存的关系(A)火山图显示c05和c03之间差异表达基因。经调整的p值<0.01(威尔科克斯秩和检验)和log2(倍数变化)>0.25的基因被着色编码。(B)条形图显示两个成纤维细胞簇的富集通路。(C)箱线图比较六种癌症类型中相邻正常和肿瘤样本的成纤维细胞亚群比例。威尔科克斯检验。(D)mIHC染色在代表性组织切片上显示PI16+成纤维细胞(c05)和FAP+LRRC15+成纤维细胞(c04)细胞的位置及其在正常、相邻正常和肿瘤区域的位置。白色矩形分别突出显示PI16+和FAP+LRRC15+成纤维细胞,并在右侧以更高的放大倍数显示。虚线突出显示相邻正常区域中正常和肿瘤区域的边界。(E)箱线图显示两种癌症类型相同大小的不同组织区域中PI16+成纤维细胞和FAP+LRRC15+成纤维细胞的比例。每个点代表一个切片(n=11,每种癌症类型各有2名患者)。t检验的p值。(F)热图显示肿瘤样本(列)中成纤维细胞簇(行)的频率。通过层次聚类和成纤维细胞组成的堆叠条形图显示肿瘤亚型,右侧显示每个簇的成纤维细胞频率分布的箱线图。(G)TCGA癌症患者的Kaplan-Meier总生存曲线,按肌成纤维细胞(c04)和成纤维细胞祖细胞(c05和c03)的基因签名表达分类。p值是通过年龄、性别和阶段的Cox回归模型计算的。(H)森林图描绘了基于成纤维细胞的两组患者对总生存的影响。参见附图S4和S5及表S4。
Para_01
  1. 有趣的是,与多种组织类型中的健康组织和癌症样本相比,这些祖细胞成纤维细胞在邻近的非癌细胞组织中最为丰富(图4C和S4A)。
  2. 与c04肌成纤维细胞相比,c05-PI16成纤维细胞在邻近正常区域的偏好性富集也通过结肠和胃癌症的mIHC染色得到证实(图4D和4E)。
  3. 此外,四种组织类型的健康组织和邻近正常成纤维细胞之间的基因表达比较显示,邻近正常组织中与成纤维细胞祖细胞相关的基因上调(图S4B),进一步证实了这一模式。
  4. 考虑到邻近正常样本中的PI16+成纤维细胞与健康和癌症样本相比,上调了炎症成纤维细胞特征并下调了肌成纤维细胞特征(图S4C),我们假设这些类似祖细胞的成纤维细胞可能被肿瘤远端的细胞因子级联或炎症信号所塑造,而这些信号可能被肿瘤附近的高TGF-β梯度所抵消,类似于PDAC中描述的模型47。
  5. 支持这一假设的是,NicheNet分析优先考虑了几种促炎细胞因子,这些因子可能驱动PI16+成纤维细胞的靶基因表达,而04肌成纤维细胞的成熟更可能受TGFB1的调控(图S4D)。
  6. 利用结肠和肺癌患者邻近正常组织的成纤维细胞进行体外刺激实验,我们观察到了这些细胞因子的不同影响,其中CXCL12、IL6和LIF提升了祖细胞成纤维细胞特征基因,而TNFα和IL1α促进了iCAF特征基因表达(图S4E和S4F;STAR方法)。
  7. 为了在空间层面上进行更深入的验证,我们对公共数据和内部数据集进行了空间转录组(ST)分析(表S1;STAR方法)。
  8. 值得注意的是,在同一ST切片上,c05和c04相对于恶性细胞的差异分布仍然可以观察到(图S4G)。
  9. 将体外分析建立的细胞因子诱导的反应基因特征映射到ST数据上,发现在富含c05成纤维细胞的远端肿瘤区域,CXCL12、IL6和LIF的特征显著增加(图S4H),与TNF和IL1A形成对比,这表明这些配体在促进祖细胞成纤维细胞表型方面的潜在作用。
  10. 这一观察结果与之前的研究一致,之前的研究显示PI16+成纤维细胞比例的增加伴随着促炎信号通路激活的增加53,尽管确切机制需要进一步探讨。
Para_02
  1. 为了评估成纤维细胞组成如何对肿瘤患者进行分层,我们对不同癌症类型的肿瘤样本根据成纤维细胞簇比例进行了分类,发现 TME 内存在四个主要的亚组(图 4F)。
  2. "CT-specific"亚组的特点是特定癌症类型的成纤维细胞在成纤维细胞群体中占主导地位,而"混合肌成纤维细胞"亚组则具有多种肌成纤维细胞亚簇,在样本中的流行程度各不相同。
  3. 除了它们,大多数肿瘤样本可以划分为两个主要的亚型,其特征是末端分化的肌成纤维细胞或成纤维细胞祖细胞占主导地位(图 4F),这一发现得到了成纤维细胞祖细胞(c05 和 c03)与末端分化的肌成纤维细胞(c04)在癌症样本中的细胞频率显著负相关的支持(图 S5A)。
  4. 值得注意的是,通过根据成纤维细胞祖细胞和 c04-LRRC15 肌成纤维细胞的差异化富集来对癌症患者进行分类,我们发现在不同癌症类型或单个癌症类型(如乳腺癌和肺癌)中,myoFloprogFhi 肿瘤的预后比 myoFhiprogFlo 肿瘤更好(图 4G 和 4H)。
  5. 此外,与成纤维细胞祖细胞 c05-PI16 比例较高且肌成纤维细胞 c04-LRRC15 比例较低的肿瘤基质相比,那些肿瘤基质中 T 细胞和抗肿瘤细胞因子的表达特征更高(图 S5B),这表明它们可能对肿瘤免疫微环境(TIME)有独特的影响。
  6. 这一发现与最近的一项研究一致,该研究强调选择性耗竭 LRRC15+ CAFs 可以显著降低总肿瘤成纤维细胞含量并增强 CD8+ T 细胞的效应功能,强调了重新校准 CAF 组成以实现临床疗效的重要性。

PI16+ fibroblasts and LRRC15+ fibroblasts participate in spatially distinct multi-cellular modules across different cancer types

PI16+ 成纤维细胞和 LRRC15+ 成纤维细胞在不同癌症类型中参与空间上不同的多细胞模块

Para_01
  1. 由于CAF在肿瘤免疫微环境(TIME)中起着关键作用,我们对肿瘤患者进行了细胞类型共现分析,以探讨成纤维细胞(FCs)与TIME之间的相互作用。除了成纤维细胞外,我们还纳入了所有的T细胞和骨髓细胞亚型,结果识别出九个共变的多细胞模块(CMs)(图5A;补充方法),这使我们能够将我们数据集中的这些肿瘤患者归类到相应的TME亚型中(图S5C)。
  • 图5.在不同的癌症类型中,成纤维细胞亚群参与空间背景下不同的多细胞群落(A)热图显示不同癌症类型肿瘤样本之间细胞类型比例的成对皮尔逊相关性。细胞模块由顶部的彩色框标出。(B)点图显示根据TME亚型分类的样本的TME相关特征评分的表达水平。(C)点图显示根据TME亚型分类的样本的特定标记基因的表达。(D–F)利用cell2location方法将细胞类型映射到不同癌症类型的空间转录组学(ST)幻灯片上,分别是(D)CM1,(E)CM6和(F)CM7。所有细胞类型的估计细胞丰度由颜色强度表示(左上角),以及每个细胞类型单独表示(右上角)。密度图展示了两个簇之间观察值的库尔巴克-莱布勒(KL)散度与零分布的比较(底部)。通过排列测试确定了经验p值。另见图S5和S6及表S1和S5。
Para_01
  1. 在这些细胞模块(CMs)中,我们观察到c05-PI16和c04-LRRC15明显地分属于不同的模块(分别是CM1和CM6)(图5A)。
  2. 特别是,c05与c16、CD8+ CX3CR1+ Temra细胞、CD14+单核细胞以及LYVE1+巨噬细胞一同出现在CM1中。
  3. 值得注意的是,后两种细胞类型被发现围绕着血管富集,这暗示了CM1可能靠近血管。
  4. 有趣的是,CM1高的患者表现出"效应细胞"和"抗肿瘤免疫"的标志物升高(图5B),强调了CM1在促进有效的抗肿瘤免疫反应中的潜在作用。
  5. 相反,c04与几种成纤维细胞亚型和SPP1+巨噬细胞一同出现在CM6中。
  6. 值得注意的是,在包括的免疫细胞类型中,SPP1+巨噬细胞与c04的相关性最强(图S5D),强调了它们之间的密切关系。
  7. 之前,SPP1+巨噬细胞已被描述为具有肿瘤促进功能的促血管生成巨噬细胞。
  8. 这一发现得到了CM6中"基质重塑"、"M2"和"促肿瘤细胞因子"标志物升高,以及T和B细胞标志物降低的支持(图5B和5C),揭示了CM6的免疫排除特性。
  9. 使用TCGA数据集,我们进一步验证了特定成纤维细胞亚群与CM相关免疫细胞在不同癌症类型中的共存关系,并采用了两种分析策略(图S5E-S5G;STAR方法)。
  10. 值得注意的是,根据空间转录组数据评估细胞类型丰度进一步揭示了CM相关细胞的空间共存(图S6A),其中不同CM中的不同成纤维细胞亚群和免疫细胞共定位(图5D-5F和S6B;表S5)。
  11. c04(FAP+LRRC15+)与SPP1+巨噬细胞的空间共定位在肺癌标本上通过多重免疫组化染色进一步得到了验证(图6A和S6C)。
  12. 有趣的是,我们发现FAP+LRRC15+成纤维细胞在空间上比FAP+LRRC15-细胞更接近SPP1+巨噬细胞(图6A和S6D),这种模式也可以在使用ST数据的其他癌症类型中观察到(图S6E),这表明终末分化的肌成纤维细胞更有可能与SPP1+巨噬细胞共定位。
  • 图6.成纤维细胞与免疫细胞亚群之间的细胞间通讯(A)代表性肺肿瘤标本中的多重免疫组化染色,显示CD68+SPP1+巨噬细胞(虚线圆圈)和FAP+LRRC15+成纤维细胞(星号)在单个或合并面板中的空间共定位。(B)和弦图显示特定成纤维细胞群与免疫细胞之间具有统计学意义的关键配体-受体相互作用(p < 0.05)。颜色表示不同的细胞类型,形状代表相互作用的 direction。(C)空间特征图描绘了成纤维细胞亚群高区域(顶部一行)以及每个空间转录组切片中配体-受体对的基因表达(下面三行)。(D)空间特征图显示各种ST切片中功能签名的得分。(E)箱线图显示选定的配体-受体对在成纤维细胞亚群高区域(紫色和青色)和其他区域(灰色)在ST切片中的共表达水平。仅在成纤维细胞亚群高区域显著上调的配体-受体对显示(p < 0.05, Wilcoxon检验)。(F)点图比较SPP1刺激条件下样本与对照组样本的功能签名得分。单侧配对t检验。(G)在无MMP1+成纤维细胞、DN对照组存在的情况下,CD4+CD25+ T细胞的迁移。迁移百分比是下室T细胞总数与上下室细胞总数之比。每个点代表一个独立实验(n ≥ 6)。∗p < 0.05, ∗∗p < 0.01, ∗∗∗p < 0.001, ∗∗∗∗p < 0.0001, 学生t检验。(H)无CCL2、CXCL16或ICAM1的情况下,CD4+CD25+ T细胞的迁移。每个点代表一个独立实验(n = 5)。学生t检验。另见图S6-S8和表S6。
Para_01
  1. 我们进一步根据CellPhoneDB分析探索了每个CM内的潜在细胞间通讯(图6B和S6F;STAR方法)。
  2. 在CM1中,经常可以观察到c05与免疫细胞之间的与细胞迁移和保留相关的相互作用,如CD34-SELL,CXCL12-ACKR3,CCL5-ACKR4和ADAM15-ITGB1(图S6F和S6G;表S6)。
  3. 特别是,c05高度表达ACKR3和ACKR4,它们可以与LYVE1+巨噬细胞和CX3CR1+Temra细胞分别分泌的CXCL12和CCL5结合,以促进免疫细胞转运(图S6G和S6H),这与周围血管生态位免疫浸润增加一致。
  4. 此外,已知参与祖细胞外周归巢的CD34在c05中特异表达(图S6H)。
  5. 我们另外还发现了与凝血调节、补体激活和血管渗透性信号相关的相互作用(例如,C3-C3AR1,SEMA3C-NRP1),表明CM1有助于血管重塑(图S6F和S6G;表S6)。
  6. 其中大部分基因与其它成纤维细胞类型相比,在c05中高度表达,强调了c05在建立区域性周围血管枢纽以支持组织免疫中的作用(图S6H)。
  7. 重要的是,在ST数据中的CM1高表达区域验证了多个配体-受体对的共表达(图6C和6D;表S6),以及抗肿瘤免疫信号的增强(图S6I),这表明这些相互作用在维持CM1中具有关键作用。
Para_02
  1. 相比之下,c04与CM6中的SPP1+巨噬细胞之间的相互作用包括了与组织重塑和基质沉积相关的多种配体-受体对,包括COL1A1-ITGA5、FN1-SDC2、ADAM12-ITGB1、ADAM12-SDC4、SPP1-ITGAV/ITGB1和COMP-CD36(图6B和S6G;表S6)。
  2. 特别值得注意的是,c04最显著地表达了ADAM12,这是已知的促进免疫细胞迁移和粘附的a解聚素和金属蛋白酶结构域(ADAM)基因家族的成员,可能通过ADAM12-SDC4/ITGB1相互作用增强SPP1+巨噬细胞的渗透(图S6G和S6H)。
  3. 此外,c04可能通过CSF1-CSF3R、GAS6-MERTK、MIF-CD44、APOE-SDC2和RARRES2-CMKLR1等相互作用促进巨噬细胞的极化和存活(图6B和S6G;表S6)。
  4. 此外,主要由SPP1+巨噬细胞分泌的SPP1,通过结合ITGAV和ITGB1,成为成纤维细胞活化和增殖的诱导剂,这两种蛋白在c04中均高度表达(图S6G和S6H)。
  5. 这些相互作用通过在CM6高表达区域的共表达分析得到进一步的空间验证,强调了它们在塑造CM6肿瘤促进微环境中的重要作用(图6C-6E)。
  6. 通过体外刺激实验进一步研究了SPP1促进肌成纤维细胞转化的潜力,揭示了其在结肠和肺癌中诱导肌成纤维细胞表型的能力(图6F)。
  7. 总的来说,我们的结果表明,SPP1+巨噬细胞通过LRRC15+成纤维细胞诱导成纤维细胞活化和胶原蛋白分泌,形成一个正反馈循环,最终招募和极化更多的巨噬细胞。
  8. 这种复杂的动态似乎是形成CM6所代表的免疫排斥生态位的关键决定因素。
  9. c05和c04分入不同的CMs进一步暗示它们通过与其他不同的免疫细胞亚群相互作用,具有独特塑造免疫微环境的能力。

MMP1+ fibroblasts contribute to the formation of an immunosuppressive cellular niche and immunotherapy resistance

MMP1+成纤维细胞有助于形成免疫抑制性细胞生态位和免疫治疗抵抗

Para_01
  1. 除了前面提到的成纤维细胞外,我们的细胞共现分析还识别出c19-MMP1成纤维细胞是CM7的核心组成部分,与多种免疫细胞类型一同存在,包括FOXP3+调节性T细胞,LAMP3+树突状细胞(DCs),浆细胞样树突状细胞(pDCs),INHBA+和NLRP3+巨噬细胞(见图5A)。
  2. 其中,FOXP3+Tregs和LAMP3+DCs与免疫抑制密切相关,与"髓系细胞免疫抑制"和"Treg和Th2通路"的增强信号一同(见图5B和5C),这表明CM7表现出免疫抑制和促肿瘤特性。
  3. 我们进一步使用TCGA和空间转录组数据在不同癌症类型中验证了c19与这些免疫细胞的相关性(见图5F,S5F,S5G和S6A)。
Para_02
  1. CM7中的成纤维细胞与免疫细胞之间的细胞相互作用表明,c19可能通过趋化因子-受体相互作用促进白细胞运输,例如通过CCL2-CCR4、CXCL16-CXCR6和ICAM1-IL2RA/IL2RG招募Tregs(见图6B)。
  2. 支持这些发现的是,将荧光激活细胞分选(FACS)分选的MMP1+成纤维细胞与CD4+CD25+FOXP3+Tregs共培养,显著提高了Treg细胞迁移,与对照组相比(见图6G和S7A-S7F)。
  3. 与对照 group 相比,分离的MMP1+成纤维细胞也表现出更高水平的这些预测配体(见图S7G和S7H)。
  4. 值得注意的是,外源性添加这些配体显著增强了Treg细胞迁移,凸显了它们在促进招募中的潜在作用(见图6H)。
  5. 此外,c19可能参与多种相互作用,促进免疫耐受环境(例如,TGFB1-TGFBR2、LGALS9-CD44和IL11-IL6R),并通过MMP1-CD44和TNC-SDC4有助于组织重塑和基质沉积,这可能限制淋巴细胞浸润(见图S6G和S6H)。
  6. 这些相互作用得到了空间转录组数据的进一步证实(见图6C-6E;表S6)。
  7. 值得注意的是,对接受免疫疗法治疗各种癌症类型的患者进行的批量RNA-seq数据分析显示,非应答者中MMP1+和LRRC15+成纤维细胞特征的显著富集(见图S7I),突显了它们在免疫逃避中的潜在作用,并可能成为癌症治疗中联合治疗潜在的靶点。
Para_03
  1. 与免疫抑制的CM7相比,富含c20的CM4表现出强烈的抗原呈递活性,表明其具有强大的免疫激活作用(图5B和5C)。
  2. 在结直肠癌中,CM4细胞的空间定位显示它们位于三级淋巴结构(TLS)中,这一点进一步通过TLS相关标志物和配体-受体对的高表达得到证实(图6C和6D)。
  3. 此外,c03与CM2中的几种幼稚和记忆T细胞亚群以及cDC2细胞共存(图5A),可能与有效的抗肿瘤免疫相关,正如我们最近的研究所提出的。
  4. 值得注意的是,对于所有这些CMs,它们在肿瘤中的细胞间通讯比在正常情况下更为频繁,表明它们在肿瘤微环境(TME)中的细胞交互作用增强(图S7J)。
  5. 利用TCGA数据集评估上述提及的与CM相关的TME亚型的预后相关性,我们发现CM6和CM7亚型与单个肿瘤类型内和多种肿瘤类型之间的不良预后相关,而CM1、CM2和CM4则与更好的预后相关(图S7K和S7L),这突显了不同成纤维细胞亚群之间的功能差异。
  6. 总的来说,我们的结果为理解成纤维细胞的功能异质性提供了参考(图7和S8),这可能有助于指导新疗法的开发和患者的分层,而不是传统的基于癌症类型的度量。
  • 图7.本研究中纤维细胞特征、动态和空间生态位的总结 图形摘要描绘了纤维细胞亚群的动态相互作用和过渡过程。(A) c05-PI16纤维细胞主要存在于邻近的正常组织中,当暴露于IL1β和TGF-β的组合时,可以转变为c16-SFRP2原肌成纤维细胞。(B) c05纤维细胞在招募CD8记忆T细胞到血管周围生态位中发挥关键作用,这一过程是通过CCL5-ACKR4轴介导的。(C) c03-COL15A1纤维细胞在靠近基底膜的正常组织中占主导地位,当暴露于IFNs和TGF-β刺激时,具有转化为c19-MMP1纤维细胞的能力。(D) c19纤维细胞通过复杂的配体-受体相互作用(如ICAM1-IL2RA),积极参与招募和保留免疫抑制性Tregs和髓系细胞(如LAMP3+ DCs),并通过分泌TGFB1和IL11促进免疫抑制环境。(E) 在TGFβ的影响下,c16、c11和c19纤维细胞亚群均能分化为c04-LRRC15肌成纤维细胞。(F) 这些c04-LRRC15纤维细胞反过来又参与吸引SPP1+巨噬细胞,通过SPP1-ITGAV/ITGB1等相互作用形成一个免疫排除的细胞生态位。参见附图S8。

Discussion

Para_01
  1. 通过整合来自517个人类样本的成纤维细胞单细胞数据,跨越11种组织和43种健康/疾病状态,我们的研究揭示了成纤维细胞转录异质性的被低估的一面,鉴定出20个稳健的成纤维细胞亚型,并深入描述了它们的分子和功能表型、系谱关系和空间分布特征。
  2. 由于不同实验室数据集的异质性,定义精确反映转录差异的成纤维细胞簇,既具有高精确度又具有生物学相关性是具有挑战性的。
  3. 我们确定的这20个亚型表现出显著的异质性、内部同质性和高可分离性,并且可以通过不同的数据整合方法可靠地重现,为在泛组织层面上解析成纤维细胞异质性提供了精细的分辨率(图1E和S1E-S1J)。
  4. 然而,我们承认,尽管这种聚类方法有助于防止由于技术效应导致的过度聚类,并产生具有生物学解释的细胞类型,但合并的簇可能代表这些成纤维细胞类型的进一步亚组,这需要在未来的研究中进行进一步的特征分析。
  5. 系统地评估也对于研究不同整合方法在定义来自各种组织和疾病条件的成纤维细胞亚型方面的影响是必要的。
Para_02
  1. 我们的全景视角强调了组织和疾病相关环境在塑造成纤维细胞独特的表型景观和组成中的决定性影响。
  2. 特别是,在炎症期间成纤维细胞的免疫调节属性可以被重新编程,以在肿瘤环境中采用组织重塑表型,导致细胞通路和代谢动力学的显著改变,从而有助于免疫抑制的肿瘤微环境。
  3. 此外,恶性变之前炎症中肌成纤维细胞比例的早期增加强调了炎症在肿瘤进展中的关键作用。
  4. 这些发现为成纤维细胞的转录可塑性提供了有力的证据,并支持这样的观点,即成纤维细胞经历一系列表型,起到启动、支持和最终抑制炎症的作用。
Para_03
  1. 我们的数据集揭示了在各种组织中纤维母细胞之间存在一系列过渡状态的连续体(图7和S8)。
  2. 我们确定了两种可能的肌成纤维细胞来源,即普遍的纤维母细胞祖细胞(c05-PI16和c03-COL15A1纤维母细胞)和周细胞(c08)。
  3. 肿瘤区域中存在MCAM+LRRC15+纤维母细胞,证实了周细胞向肌成纤维细胞的潜在转变,尽管这些LRRC15+肌成纤维细胞也可能由于平滑肌细胞(SMCs)中MCAM的高表达而来源于SMCs。
  4. 对于PI16+纤维母细胞,我们发现它们主要位于相邻的非癌组织区域并且在肿瘤核心组织中耗竭。
  5. 我们的体外实验和空间转录组分析揭示了特定细胞因子在塑造纤维母细胞祖细胞中的潜在促进作用。
  6. 未来需要采用更准确模拟体内环境的三维培养技术,结合特定纤维母细胞亚群的单细胞流式细胞术(FACS),以彻底研究特定配体对纤维母细胞亚型的具体功能影响。
  7. 值得注意的是,c05-PI16纤维母细胞与血管周围生态位中的CX3CR1+ Temra细胞和LYVE1+巨噬细胞发生相互作用,可能促进血管重塑并增强抗肿瘤免疫反应。
  8. 这些结果与一个阐述抗肿瘤免疫反应时空动态的预处理模型一致,强调了DPT+趋化因子产生的CAFs和骨髓细胞在炎症肿瘤中招募和支持T细胞功能的作用。
  9. 根据纤维母细胞祖细胞或终末分化纤维母细胞的相对丰度,我们揭示了两个主要肿瘤亚组,它们具有不同的预后。
  10. 先前的研究强调了与功能性纤维母细胞亚群相关的标记基因在特定癌症类型中改善患者分层的有用性。
  11. 我们的发现支持采用与纤维母细胞分化相关的标记基因来评估临床试验和治疗靶点期间基质组成的改变,旨在使CAFs恢复到更"正常"的状态,正如维生素D受体激动剂所展示的那样。
Para_04
  1. 癌症相关成纤维细胞的异质性和它们在肿瘤微环境中的功能一直受到深入研究。
  2. 我们的分析揭示,癌症相关的肌成纤维细胞构成了异质性的群体,表现出表型的变异和功能的多样性,其中LRRC15+和MMP1+的myCAFs通过不同的机制具有促肿瘤功能。
  3. 特别是,FAP+LRRC15+(c04)的成纤维细胞可能通过与SPP1+巨噬细胞的相互作用,促进细胞外基质调控异常和免疫排斥。
  4. 而FAP+MMP1+(c19)的成纤维细胞可能通过与Tregs的相互作用,参与创造一个免疫抑制的生态位。
  5. 此前,FAP+成纤维细胞和SPP1+巨噬细胞在结肠癌中的空间共定位已被揭示。
  6. 我们的分析进一步揭示了在泛癌症层面上,c04(FAP+LRRC15+)成纤维细胞和SPP1+巨噬细胞的空间共定位,并发现它们与SPP1+巨噬细胞的空间距离比整体的FAP+成纤维细胞更近。
  7. 我们对FAP+肌成纤维细胞的细致分类可能具有重要的临床意义,可能阐明治疗抵抗背后的原因,并激发针对FAP+ CAFs和其他免疫细胞群体的新联合治疗。
  8. 对于MMP1+成纤维细胞,它们与Treg细胞的细胞间相互作用通过体外共培养实验得到了进一步验证,这表明它们在塑造免疫抑制微环境中具有重要作用。
  9. 它们还可能通过表达抑制性细胞因子如IL11和TGFB1,以及基质金属蛋白酶(MMPs)来促进免疫抑制和癌症发展。
  10. 值得注意的是,我们发现的与免疫治疗抵抗相关的MMP1+成纤维细胞与最近识别的与结直肠癌免疫检查点阻断抵抗相关的CCL2+CCL11+成纤维细胞的研究是一致的。
  11. 考虑到MMP1+成纤维细胞在皮肤癌和结肠癌中的普遍存在,我们提议使用JAK抑制剂或MMP1抑制剂重新编程CAF,以潜在地重新激活免疫细胞功能,特别是在这些癌症类型中。
  12. 我们相信,对这些数据的深入分析,结合功能研究,将为成纤维细胞-免疫细胞相互作用提供新的见解,并指导CAF靶向治疗或免疫治疗的生物标志物或治疗靶点的识别。
Para_05
  1. 总之,我们的研究对各种组织及疾病背景下的成纤维细胞生物学进行了全面的研究。
  2. 我们描绘了不同的成纤维细胞亚群,阐释了调控因子,并识别了功能各异的多细胞模块。
  3. 为了使我们的数据能够被广泛的研究团体使用,已经开发了一个交互式门户网站(http://pan-fib.cancer-pku.cn/)用于分析和可视化我们的单细胞数据。
  4. 这幅全景图加深了我们对疾病相关成纤维细胞的理解,并提供了一个宝贵的资源,有助于实现精细的治疗策略和患者分层。

Limitations of the study

研究的局限性

Para_06
  1. 尽管我们的研究已经有效地表征了在不同组织和病理条件下成纤维细胞的异质性,但某些局限性应当被认识到。
  2. 首先,公共数据集中缺乏综合的临床数据,阻碍了我们对成纤维细胞表型和组成影响的研究。
  3. 其次,虽然我们关注了成纤维细胞与免疫细胞的相互作用,但未来的研究应该剖析成纤维细胞与肿瘤细胞的相互作用,以完整地描绘这一过程。
  4. 第三,我们的体外功能分析受到FACS门控策略、小样本量以及二维培养技术的限制。
  5. 未来的研究需要使用体内实验来为特定成纤维细胞亚群提供更多因果证据。
  6. 尽管如此,我们的单细胞成纤维细胞图谱有效地捕捉了在不同疾病背景下成纤维细胞细胞的详细特性,并为不同癌症类型中基于成纤维细胞的疗法提供了见解。

Resource availability

Lead contact

主要联系人

Para_01
  1. 进一步的信息和资源及试剂的请求应直接联系并完成于主要联系人,张泽民(zemin@pku.edu.cn)。

Materials availability

材料可用性

Para_01
  1. 本研究未生成新的独特试剂。

Data and code availability

数据和代码的可获得性

Para_01
  1. 本研究生成的单细胞RNA测序数据(scRNA-seq)和RNA测序数据(RNA-seq)可以从NCBI GEO数据库获取,访问号为GSE246219。
  2. 本研究的单细胞RNA测序数据集的可视化可以在http://pan-fib.cancer-pku.cn/找到。
  3. 公共空间转录组数据的GEO访问号列在关键资源表中。
  4. 所有公共数据集的详细信息已提供在表S1中。
  5. 我们的分析代码已上传至GitHub(https://github.com/aliceygao/pan-Fibroblast)。
  6. 重新分析本文报告中数据所需的任何附加信息,可应主要联系人请求提供。

Acknowledgments

Para_01
  1. 我们感谢 J. Deng、H. Ning、Q. Gao、L. Sun、Y. Miao 和 X. Chen 参与讨论。
  2. 我们感谢 B. Su 慷慨提供空间转录组学数据。
  3. 本研究中的分析工作是在深圳湾实验室超级计算中心完成的。
  4. 本项目得到了深圳湾实验室重点课题项目(资助编号 S201101004)、开放课题项目(资助编号 SZBL2020090501005)、中国博士后科学基金(资助编号 2021M700233)以及广东省基础与应用基础研究基金(资助编号 2023A1515140127)的支持。

Author contributions

Para_01
  1. Z.Z.构思了这项研究;Y.G.和W.H.进行了数据分析;J.L.、W.C.、T.D.、H.L.、Y.B.、W.Z.和C.L.进行了实验;L.Z.、J.L.、W.C.和M.C.提供了实验方法;J.P.、W.H.、R.C.、Z.L.和Y.Z.提供了临床样本;Y.G.、W.H.、J.L.、W.C.和Z.Z.撰写了手稿,所有作者均参与了反馈提供。

Declaration of interests

Para_01
  1. Z.Z. 是 Analytical Bioscience 的创始人,同时也担任 Cell 顾问委员会的成员。

STAR★Methods

Key resources table

关键资源表

Experimental model and study participant details

实验模型与研究对象详情

Human specimens

人类标本

Para_01
  1. 本研究纳入的11名癌症患者被病理诊断为结肠癌、肺癌和胰腺癌。
  2. 在按照常规原则收集研究用组织之前,已从所有参与者那里获得了书面知情同意书。
  3. 北京大学和深圳湾实验室伦理委员会批准了所有人体组织协议。
  4. 伦理批准还来自中国人民解放军总医院和广东省人民医院伦理委员会。
  5. 肿瘤和未受累的肺或结肠样本是从在中国人民解放军总医院和北京世纪坛医院接受切除术的患者手术标本中获得的。
  6. 胰腺肿瘤样本是从在广东省人民医院接受切除术的患者手术标本中获得的。
  7. 收集了配对的肿瘤和相邻正常组织样本,称重后,一半用于固定,另一半用于成纤维细胞的分离。
  8. 在之前的研究中,我们收集并分析了38名癌症患者的样本,用于单细胞分析,93,94,95,96,97并获得了相应伦理委员会的批准,且遵守了所有相关的伦理规定。

Method details

方法细节

scRNA-seq data generation

单细胞RNA测序数据生成

Para_01
  1. 肿瘤组织和相邻的非癌组织被切割成大约1-2立方毫米的小块,置于含10%胎牛血清(FBS,Gibco)的RPMI-1640培养基(Gibco)中,并按照制造商的说明,用温和的MACS(Miltenyi)酶解在37°C的转子中消化60分钟。
  2. 随后,将解离的细胞通过一个100微米的Smart Strainer,并在400g下离心5分钟。
  3. 移除上清液后,将沉淀的细胞悬浮在红细胞裂解缓冲液(TIANDZ)中,并在冰上孵育1-2分钟以裂解红细胞。
  4. 用1×PBS(Gibco)洗涤两次后,将细胞沉淀重新悬浮在排序缓冲液(PBS中补充1% FBS)中。
  5. 单细胞悬液的浓度调整到大约500-1,200个细胞/微升。
  6. 所有后续步骤都按照标准制造商的说明进行。
  7. 纯化的文库使用Illumina Hiseq X Ten测序仪进行检测,该测序仪具有150个碱基对(bp)的配对末端读数。

Patient-derived fibroblast isolation and culture

患者来源成纤维细胞的分离与培养

Para_01
  1. 简要地说,组织被切割成0.1克的片断,然后放入5毫升的微管中。
  2. 用剪刀将切片切碎,并根据制造商的说明,在37°C的旋转器上用MACS肿瘤解离试剂盒(Miltenyi Biotec)进行30分钟的酶解。
  3. 通过加入含有DMEM/F12培养基(Gibco)和10%胎牛血清(Gibco)的8毫升成纤维细胞培养基来中止消化。
  4. 然后将半解离的细胞在400 g下离心5分钟。
  5. 去除上清液后,将沉淀的细胞悬浮在成纤维细胞培养基中。
  6. 将细胞在含有1.5% O2和5% CO2的湿化培养箱中接种在塑料盘上。
  7. 四天后,获得人源原代成纤维细胞,并使用Fc受体阻断溶液(Biolegend)进行封闭。
  8. 随后,在补充有2% FBS的PBS中,使用抗体混合物(EPCAM,CD31,CD45)在4°C下进行细胞表面染色30分钟。
  9. 用含有2% FBS的PBS洗涤两次后,细胞在BD FACS AriaSORP上进行分选。
Para_02
  1. 对于MMP1+纤维母细胞(c19)的分选,首先收集原代纤维母细胞,然后按照上述方法进行染色,以区分活细胞和标记的死亡细胞。
  2. 为了染色细胞表面蛋白,细胞在4°C下与抗体混合液孵育30分钟。
  3. 抗体组合包括抗-CD45-APC-Cy7、抗-CD326–BV605、抗-CD31–PE-Cy7、抗-PDPN–BV421和抗-CD82–AF647。
  4. 根据EPCAM-CD31-CD45-PDPN+CD82+和EPCAM-CD31-CD45-PDPN-CD82-标记,使用BD FACS AriaSORP分别对MMP1+纤维母细胞(c19)和DN-ctrl进行分选。

Isolation of CD4+CD25+ T cells

CD4+CD25+ T细胞的分离

Para_01
  1. 外周血单核细胞(PBMCs)使用Lymphoprep(STEMCELL)进行分离,并用于通过BD FACS AriaSORP进行CD4+CD25+ T细胞分选。
  2. 用于分选的抗体面板包括抗CD8-APC、抗CD4-FITC和抗CD25-PE。
  3. 分选后的T细胞随后用于后续的共培养实验。

Quantification of FOXP3 expression on CD4+CD25+ T cells

CD4+CD25+ T细胞上FOXP3表达的量化

Para_01
  1. 流式细胞术被用于量化CD4+CD25+T细胞上FOXP3的表达。起初,PBMCs在500 g下离心5分钟,并在PBS中重新悬浮。
  2. 然后,细胞在4°C下用Fixable Viability Stain 510(BD, 564406)染色10分钟,以区分活细胞和死细胞。
  3. 用含有2%FBS的PBS洗涤后,细胞与针对细胞表面抗原的荧光素标记抗体一起孵育,包括抗CD3–PerCP-Cy5.5、抗CD4–FITC、抗CD8–APC和抗CD25–BV785,在4°C下孵育30分钟。
Para_02
  1. 随后,使用抗FOXP3-PE进行了核内染色,按照适当的制造商协议(eBioscience FOXP3/转录因子染色缓冲液套装,Thermo Fisher 00-5532-00)。
  2. 最后,对染色的细胞在BD LSRFortessa流式细胞仪上进行了分析。

Transwell migration assay

Transwell迁移实验

Para_01
  1. 对于迁移实验,我们将总共50,000个c19成纤维细胞或DN-ctrl细胞分别接种在含有500μl DMEM/F12培养基(Gibco公司)的5μm Transwell插件(Corning Transwell 24孔板)的下室中,并补充了1%的FBS。
  2. 在100μl DMEM/F12培养基中,含有1% FBS的200,000个CD4+CD25+ T细胞被置于上室中,并在37°C下过夜孵育。
  3. 在孵育24小时后,分别收集上室和下室中的T细胞。
  4. 使用细胞计数器进行T细胞计数,并以迁移百分比的形式表示,该百分比是通过计算下室中T细胞数量与总细胞数量的比例得出的。
  5. 为了研究CD4+CD25+ T细胞对特定趋化因子的化学趋化反应,以下浓度的重组人趋化因子(Peprotech公司)分别加入到下室中:10 ng/ml的CCL2,10 ng/ml的CXCL16和10 ng/ml的ICAM1。

In vitro stimulation of fibroblasts

体外刺激成纤维细胞

Para_01
  1. 患者来源的原代成纤维细胞按前述章节描述的方法进行分离和培养。
  2. 将2x104个成纤维细胞接种到24孔板中,静置过夜,然后用TNFα、IL1α、IL6、LIF、CXCL12、SPP1或DMSO对照进行刺激。
  3. 配体的浓度如下:IL1α(1 ng/mL)、TNFα(20 ng/mL)、IL6(10 ng/mL)、CXCL12(100 ng/mL)、LIF(10 ng/mL)和SPP1(100 ng/mL)。

Multi-color immunohistochemistry of human tissues and data analysis

人体组织的多色免疫组化及数据分析

Para_01
  1. 人类组织标本在肿瘤切除后30分钟内收集,并固定在10%的福尔马林中48小时。
  2. 按照常规方法进行脱水并嵌入石蜡中,之前已有描述。
  3. 这些石蜡块被切成4mm的切片,并附着在载玻片上。
  4. 然后将石蜡切片放在70°C的石蜡中1小时,之后在二甲苯中脱蜡,并重新水化。
  5. 使用Opal 7-color Manual IHC Kit (PerkinElmer) 根据制造商的协议确认成纤维细胞亚群的存在,之前已有描述。
  6. 抗原修复在pH 6.0的批评缓冲液中95°C进行30分钟,然后在3% H2O2中孵育15分钟,使用10%的正常山羊血清封闭后,加入一抗,室温下孵育1小时或4°C过夜。
  7. 加入辣根过氧化物酶标记的二抗(PerkinElmer),室温下孵育10分钟。
  8. 使用1:100稀释的TSA工作溶液在1x扩增稀释液中(PerkinElmer)室温下孵育10分钟进行信号放大。
  9. 然后,用之前描述的方法对同一张幻灯片进行漂白和复染。
  10. 根据组织大小,每张幻灯片选取10-15个视野。
  11. 多光谱成像由Mantra Quantitative Pathology Workstation (PerkinElmer, CLS140089) 收集,并使用InForm Advanced Image Analysis Software (PerkinElmer) v2.4和HALO 3.3 (Indica Labs)进行分析。
  12. 使用DAPI核染色进行细胞分割,并根据HALO软件进行细胞计数。
  13. 然后,将细胞计数归一化到选定组织区域中的总细胞计数,以确保无偏量化。
  14. 成纤维细胞被鉴定为PanCK阴性,并根据特定标记的表达进一步分类:PI16(PI16+成纤维细胞),FAP和LRRC15(LRRC15+成纤维细胞),以及MCAM和PDGFRB(周细胞),便于识别各种成纤维细胞亚群。
  15. 同样,巨噬细胞被鉴定为PanCK阴性,表达SPP1和CD68的细胞被归类为SPP1+巨噬细胞。
  16. 利用接近度和最近邻域分析评估成纤维细胞与SPP1+巨噬细胞之间的相互作用。

Spatial transcriptome data generation

空间转录组数据生成

Para_01
  1. 我们使用空间转录组数据评估了成纤维细胞的空间位置,包括内部数据集以及公共数据集(表S1)。
  2. 对于我们的内部数据,我们对一个PDAC样本进行了空间转录组测序。
  3. 我们从胰腺癌患者那里取得癌组织样本,将它们切割成4–5-mm3的小块,然后用冷的PBS轻轻清洗两次。
  4. 随后,OCT填充模具在冷异戊烷中快速冷冻。
  5. 使用Visium空间基因表达载玻片和试剂套件(10x Genomics)生成测序库。
  6. 切成10mm厚度的两个切片,并安装在Visium载玻片捕获区域上。
  7. 按照制造商的协议准备测序库,同时将苏木精染色时间调整为4分钟。
  8. 组织染色后,按照空间转录组学程序描述的,拍摄了明场图像。

Bulk RNA sequencing and processing

批量RNA测序与处理

Para_01
  1. RNA是按照制造商的说明使用RNeasy Mini Kit(QIAGEN)提取的。
  2. 为了进行批量RNA测序,使用VAHTS Universal V8 RNA-seq Library Prep Kit for Illumina(Vazyme)构建了文库。
  3. 样本在Illumina NovaSeq上进行测序。
  4. 批量RNA测序数据使用STAR与基因组参考hg38对齐,注释从NCI GDC(基因组数据公共库)下载。
  5. 使用featureCounts软件,并设置参数‘-M -O–fraction -Q 30’计算基因特异性的读数计数。
  6. 使用DESeq2 R包(版本1.26.0)对患者组之间进行归一化和差异分析。
  7. 在配体刺激实验中,将P < 0.05和log2(折叠变化)> 0.25(配体添加组与对照组相比)的差异表达基因用作特定配体诱导反应的标志。

RT-qPCR

实时定量聚合酶链反应

Para_01
  1. 从细胞中提取总RNA使用的是RNA isolater Total RNA Extraction Reagent (Vazyme),并使用HiScript III RT SuperMix for qPCR (Vazyme)合成cDNA。
  2. 定量PCR是在The LightCycler® 480 Instrument II上使用ChamQ SYBR qPCR Master Mix进行的。
  3. 基因特异性引物序列在关键资源表中提供。
  4. 基因表达水平被归一化为内源性参考基因β-actin。
  5. 相对基因表达使用2-ΔΔCT方法计算,并以相对于对照组样本的倍数变化形式呈现。

Single-cell RNA-seq data collection, preprocessing and the identification of fibroblasts

单细胞RNA-seq数据收集、预处理以及成纤维细胞的识别

Para_01
  1. 含有成纤维细胞的单细胞转录组数据集,包括处理过的数据或处理过的CellRanger文件,已从公共存储库中收集(表S1)。
  2. 本次数据收集包含了来自多个组织和病理状态的30个公共单细胞RNA测序数据集。
  3. 此外,我们还纳入了来自4种不同癌症类型的38名患者的内部数据,旨在增加特定癌症类型中的成纤维细胞数量,以方便后续分析。
Para_02
  1. 我们生成的单细胞RNA测序数据使用Cell Ranger Single-Cell工具包(版本3.1.0)与GRCh38人类参考基因组对齐和定量。
  2. 初步过滤的Cell Ranger生成数据用于后续分析。
  3. 进一步的质量控制用于过滤掉以下低质量细胞:(1)表达基因少于200个(2)UMIs多于25,000或少于500个(3)线粒体基因计数超过20%。
  4. 我们使用了Scrublet方法来识别可能的双细胞,预计双细胞率为0.08。
  5. 预测的双细胞评分大于0.25的细胞被过滤掉了。
  6. 尽管环境RNA校正对处理单细胞转录组数据至关重要,但我们的数据集环境RNA率低,因此在后续分析中未受到影响(数据未显示)。
  7. 一旦过滤,得到的基因表达矩阵使用Seurat的NormalizeData函数进行归一化,默认参数。
  8. 随后,我们选取了前2000个高度可变基因(HVGs)进行主成分分析(PCA)。
  9. 主成分(PCs)的选择基于通过肘部图和Jackstraw图建立的标准。
  10. 使用Seurat R包中的FindClusters函数,我们识别了簇,允许分辨率为0.5到2的范围,并使用统一流形逼近和投影(UMAP)进行可视化。
  11. 通过Wilcoxon秩和检验,使用FindMarkers函数在不同分辨率下生成的簇之间进行差异基因表达分析。
  12. 当主要细胞类型以簇的形式出现在特定的分辨率下,但在较低分辨率下不出现时,确定了特定的分辨率。
  13. 将得到的簇注释为主要的细胞类型依赖于典型标记基因的表达模式,包括上皮细胞(EPCAM,KRT18,KRT19),T细胞(CD3D,CD3E),NK细胞(KLRF1,NKG7),B细胞(CD79A,CD79B,MS4A1),髓系细胞(CST3,LYZ,CD14,CD16,CD68,CD83,CSF1R,FCER1G),成纤维细胞(COL1A2,COL3A1,COL1A1)以及其他间质细胞(VWF,PLVAP,PECAM1,S100B,CDH5)。
  14. 选择性地选择了高表达成纤维细胞典型基因(VIM,COL3A1,COL1A2)的簇进行后续的综合分析。
  15. 为了进一步确定所识别的成纤维细胞能够与其他主要细胞类型良好分离,将所有数据合并并使用BBKNN算法处理,批次键设置为"数据集",批次内的邻居数设置为3。
  16. 我们使用20个主成分(PCA)作为输入进行批次校正。
  17. 得到的邻域图用于使用Scanpy中的scanpy.tl.umap函数创建UMAP嵌入,然后利用它通过Leiden算法识别簇。
  18. 然后根据典型的细胞标记对每个主要细胞类型进行注释。

Data integration and fibroblast subsets annotation

数据整合与成纤维细胞亚群注释

Para_01
  1. 在从每个数据集中提取成纤维细胞簇之后,我们的初步工作是整合按组织类型分类的成纤维细胞,以减轻成纤维细胞子集组织来源可能引入的任何潜在偏差。
  2. 在整合之前,排除细胞数量少于100的成纤维细胞样本。
  3. 我们使用Scanpy(v1.7.2)的scanpy.pp.highly_variable_genes函数,确定了3,000个高度可变基因,并使用这些基因进行PCA分析以减轻噪声。
  4. 为了校正批次效应,我们使用了BBKNN算法,该算法为每个细胞单独计算其各自批次中的最近邻,而不是将整个细胞群体作为一个整体来考虑。
  5. bbknn.bbknn函数的关键参数被设置为‘batch_key=‘sample’,n_pcs=50’’。
  6. 通过使用UMAP方法(scanpy.tl.umap函数,默认参数)实现了可视化。
  7. 此外,我们使用Leiden算法通过scanpy.tl.leiden函数识别成纤维细胞子集,并改变分辨率。
  8. 通过Seurat中的FindAllMarkers函数进行差异基因表达分析。
  9. 在差异表达基因上有大量重叠的簇被合并。
  10. 每个成纤维细胞子集至少需要展示20个显著差异表达基因(DEGs),调整后的P值<0.01且对数倍变化>0.25。
  11. 那些显著表达其他细胞类型的已建立典型标记物的簇被归类为双细胞,并在后续分析中排除。
  12. 在每种组织类型内确定的特定于各个成纤维细胞簇的标记基因主要反映了与成纤维细胞功能相关的转录组景观,这在不同的组织环境中表现出高度的一致性。
  13. 为了进行跨组织整合,我们合并了跨组织类型的成纤维细胞簇中的前50个差异表达基因(按对数倍变化排名),用于跨组织整合的全面基因列表创建。
Para_02
  1. 为了提高BBKNN在减轻批次效应方面的有效性,我们通过bbknn.ridge_regression函数对整合表达矩阵进行了岭回归处理。
  2. 这一步骤有效地移除了由样本和组织类型引起的技术变异,同时保留了先前定义的成纤维细胞簇内包裹的生物相关变异。
  3. 随后,在回归矩阵上执行PCA,并通过bbknn.bbknn函数保留前50个主成分以进行批次校正,使用的参数为"batch key = ‘sample', n_pcs=20"。
  4. 可视化是通过UMAP完成的,由scanpy.tl.umap函数辅助实现。
  5. 为了进行无监督聚类,我们采用了如前所述的scanpy.tl.leiden函数来描绘跨组织成纤维细胞簇,并使用不同的聚类分辨率来优化簇的粒度。
  6. 为了识别簇特异性标记基因,我们使用了如上所述的FindAllMarkers函数。
  7. 我们手动检查了每个簇的顶级标记,以与已知的生物学相匹配,并为进一步的分析选择了分辨率为3的设置。
  8. 根据它们在不同表达基因中的大量重叠和基于知识的标记检查,簇被合并。
  9. 排名前50的显著表达基因(按对数倍变化排名)被指定为簇特异性签名基因集,并用于后续分析(表S2)。
Para_03
  1. 为了验证整合方法的稳健性,我们还使用了scVI、Seurat和Harmony进行了整合,并按以下参数设置:1)scVI:我们将"Samples"设置为批次键,并使用配置为"Tissue"的categorical_covariate_keys以确保在不同实验条件下数据的准确协调。为了构建邻居图并在二维空间中可视化潜在空间,我们在由scVI推断的潜在空间上应用了UMAP方法(n = 30)。
  2. 2)Harmony:我们使用HVGs计算了一个具有30个成分的PCA矩阵,然后将其输入到Harmony R包的HarmonyMatrix()函数中。我们将"sample"指定为批次校正的技术协变量。
  3. 3)Seurat:我们首先使用FindIntegrationAnchors()函数识别整合锚点。在确定锚点之后,使用IntegrateData函数创建一个批次校正空间,从而实现数据集的无缝整合。在这个过程中,30个主成分(PCs)被用于IntegrateData函数的加权过程中。
  4. 随后,我们使用Leiden方法执行聚类,利用不同的聚类分辨率来优化聚类粒度。在检查了每个簇的顶部差异表达基因后,我们手动合并了在功能上相关且差异表达的基因高度重叠的簇,并注释了最终的簇。
  5. 我们使用了来自scib-metrics的一套指标来评估不同方法在我们数据集中的整体性能。具体来说,我们使用平均轮廓宽度(ASW)、孤立标签得分ASW和cLISI来评估生物学保守性。
  6. 为了去除批次效应,我们使用了批次ASW、iLISI、图连通性和kBET得分。需要聚类键的指标在本分析中未使用。这些数据整合方法在我们数据集中的整体性能列于表S3中。
Para_04
  1. 为了评估我们的聚类结果在表示成纤维细胞的转录异质性方面的充分性,并评估是否需要进一步的子聚类,我们使用了ROGUE指标——一种基于熵的指标。
  2. ROGUE指数接近1表示一个相对同质的子集,其内部聚类变异最小。
  3. 此外,我们使用了单细胞聚类评估框架(SCCAF v.0.0.10)来评估整体聚类的准确性,使用默认设置。

Calculation of gene signature scores

基因特征评分的计算

Para_01
  1. 如前所述,定义了簇特异的标志性基因。
  2. 基于上述方法,通过比较组合簇(c05和c03)与其他簇之间的前50个差异表达基因(DEGs),识别出成纤维细胞前体细胞的标志性基因。
  3. 已发表基因集的标志性基因来源于之前的研究(表S2)。
  4. 代谢途径的标志性基因来源于一个经过整理的数据库。
  5. 我们还定义了成纤维细胞的激活标志性基因,这是通过比较9种组织类型(不包括HNSC和滑膜)中所有成纤维细胞在健康(或如果没有健康样本则正常)与肿瘤样本之间的基因表达实现的,并使用我们之前提到的参数设置FindAllMarkers函数,选择在至少6种癌症类型中肿瘤样本中显著上调的基因。
Para_02
  1. 为了根据scRNA-seq数据计算基因签名得分,我们使用Seurat包中实现的AddModuleScore函数对单个细胞进行评分,该函数计算了在单细胞水平上选定基因的平均表达水平,并减去控制特征集的总表达量。
  2. 控制特征由从每个箱中随机选择的100个基因组成,所有特征根据平均表达量被分为24组。

Distribution of fibroblast clusters across tissues and phenotypes

纤维母细胞簇在组织和表型中的分布

Para_01
  1. 为了评估在不同表型之间成纤维细胞簇的分布情况,我们计算了在不同病理状态下样本中每个成纤维细胞簇占所有成纤维细胞的比例。
  2. 为了确保我们的估计可靠并避免潜在的偏差,我们排除了含有少于30个细胞的样本。
  3. 为了评估成纤维细胞簇在特定表型背景下显示的富集程度,我们计算了每种组织类型中成纤维细胞亚群观察到的细胞数与预期的细胞数之比(Ro/e)。
  4. 每个成纤维细胞簇的预期细胞数是通过卡方检验确定的。
  5. 如果相应的Ro/e超过1,我们则认为该亚群在特定表型内是富集的。
  6. 需要注意的是,为了简化分组,我们使用"发炎"和"非发炎"作为一般术语,涵盖了不同程度的癌前病变、炎症条件或纤维化疾病。
  7. 此外,我们通过计算每种组织中每个成纤维细胞簇的Ro/e值,扩展了我们的分析,这为我们提供了一个超越组织特定边界的全局表型富集视角。

Gene set enrichment analysis

基因集富集分析

Para_01
  1. 对成纤维细胞簇的基因集富集分析是通过使用clusterProfiler R包中的enricher函数进行的,参数设置为"qvalueCutoff = 0.05"。
  2. 基因集从分子签名数据库(MSigDB v7.3)中下载。

Pathway activity prediction by PROGENy

PROGENy 的通路活性预测

Para_01
  1. 我们应用了PROGENy(版本1.15.1)来推断成纤维细胞中的信号通路活动,参数‘top’设置为500,其他参数为默认值。
  2. 然后计算了每个成纤维细胞簇中细胞的PROGENy得分,对其进行平均并可视化。
  3. 通过与其他成纤维细胞亚群进行Wilcoxon秩和检验,确定了每个成纤维细胞亚群中差异激活的通路。
  4. 调整后的P值小于0.01的通路被认为显著失调。

Gene regulatory network analysis

基因调控网络分析

Para_01
  1. 我们使用了SCENIC19算法来识别在每个成纤维细胞簇中激活的基因调控网络(调控子),以原始计数矩阵作为输入。"," Sentence_02": "简而言之,共表达网络是通过GRNBoost2计算的,调控子是通过RcisTarget识别的。"," Sentence_03": "接下来,使用AUCell为每个细胞打分调控子活性。"," Sentence_04": "对于每个成纤维细胞簇,通过使用python函数regulon_specificity_scores按调控子特异性分数(RSS)对调控子进行排序。

Identification of conserved signature genes for fibroblast subsets

成纤维细胞亚群保守特征基因的鉴定

Para_01
  1. 基于元分析方法,确定了成纤维细胞簇的保守特征基因。
  2. 首先,对于每种组织类型,通过比较来自成纤维细胞簇的细胞与其他所有成纤维细胞簇的细胞,使用limma来识别差异表达基因。
  3. 其次,估计了调节效应量及其方差。
  4. 然后,计算了所有组织类型的效应量的加权平均值,即综合效应量,以及相应的p值和调整后的p值(Benjamini-Hochberg方法)。
  5. 成纤维细胞簇的泛组织特征基因被定义为具有大于0.15的综合效应量和调整后的P值小于0.01的基因。
  6. 保守特征基因中的转录因子列于表S2中。

Ligand prediction analysis

配体预测分析

Para_01
  1. 我们使用了NicheNet82算法来识别能够诱导特定成纤维细胞亚群标志性基因表达的潜在配体。
  2. 我们以不同成纤维细胞亚群的标志性基因为目标基因列表(表S2),通过predict_ligand_activities函数预测潜在配体。
  3. 排名前10的配体展示在图中。
  4. 为了识别驱动PI16+成纤维细胞(c05)向LRRC15+肌成纤维细胞(c04)分化,以及相反的分化的潜在配体,我们在所有组织类型中根据上述标准确定了这两组成纤维细胞之间差异表达的前100个基因。
  5. 然后,这些基因被用作后续NicheNet分析的靶基因集。

Fibroblast lineage trajectory inference

成纤维细胞系谱轨迹推断

Para_01
  1. 为了追踪成纤维细胞在整个肌成纤维细胞分化过程中的全球谱系轨迹,我们重点关注了在所有组织类型中普遍共享的10个成纤维细胞簇(图1F、3B和S3F)。
  2. 然后通过多种算法推断成纤维细胞的转变谱系轨迹,包括RNA速度,CellRank和PAGA。
Para_02
  1. 在RNA速度分析中,我们选择了具有原始测序数据的成纤维细胞。
  2. 使用Python包Velocyto(v0.17.17)统计了每个细胞中每个基因的拼接和非拼接UMIs。
  3. 后续分析由Scanpy(v1.7.2)和scVelo84(v0.2.5)完成。
  4. 应该注意的是,基因的选择深刻地影响着RNA速度分析的结果及其可解释性。
  5. 为了减轻技术偏差,并提高我们捕捉与成纤维细胞状态转变密切相关基因的能力,我们将高度可变基因定义为分析中涉及的成纤维细胞簇之间差异表达的基因。
  6. 此外,我们使用参数"min_shared_counts=20"的scvelo.pp.filter_genes函数进一步精炼了这一基因集。
  7. 对于每个细胞,我们计算了标准化拼接和非拼接计数的矩。
  8. 这是通过利用BBKNN方法促进的批次对齐邻域图实现的。
  9. 随后使用默认参数的scvelo.tl.velocity函数进行RNA速度的估计。
  10. 这些估计的速度被用来构建速度图,并通过scvelo.tl.velocity_graph和scvelo.pl.velocity_embedding_stream函数以流线的方式在UMAP中可视化结果。
Para_03
  1. 使用CellRank算法来映射成纤维细胞亚群的细胞命运。初始状态和终止状态是通过使用cellrank.tl.initial_states和cellrank.tl.terminal_states函数并设置参数"weight_connectivities=0.2"确定的。通过PAGA算法评估细胞向肌成纤维细胞进展的轨迹,这一过程使用scanpy中的scanpy.tl.paga函数按默认参数执行。然后比较两个亚群节点之间的边缘连通性,考虑到网络结构中的所有边缘。

Diffusion pseudotime analysis

扩散伪时间分析

Para_01
  1. 为了描绘成纤维细胞状态的转变,我们使用了扩散图算法。这种方法以其保持全局关系和伪时间细胞顺序的能力而闻名,使我们能够揭示分化的轨迹。
  2. 利用从BBKNN获得的批次对齐的邻域图,我们使用scanpy.tl.diffmap函数构建了扩散图。
  3. 基于在扩散图上由CellRank预测的根细胞的选择,通过scanpy.tl.dpt函数计算了扩散伪时间。
  4. 随后,我们使用广义加性模型将单个基因的表达谱与伪时间对齐。

Prediction of immune cell types using CellTypist

使用CellTypist预测免疫细胞类型

Para_01
  1. 为了便于在不同的癌症类型中将对成纤维细胞群与多种免疫细胞亚型进行相关性分析,我们使用CellTypist89算法对我们数据集中的免疫细胞进行了统一注释。
  2. 为此,我们利用来自我们之前研究的scRNA-seq数据集,训练了两个专用于髓系和T细胞的逻辑回归模型。
  3. 具体而言,我们聚焦于上述标准下在不同细胞子集中表现出显著差异表达的前150个基因,并使用这些基因在celltypist.train函数中设置参数"max_iter = 300"进行模型训练。
  4. 随后,我们将训练好的模型应用于我们研究中的数据集,以预测髓系和T细胞的身份。
  5. 这一预测步骤是基于celltypist.annotate函数,并设置参数"majority_voting = True"。
  6. 得到的注释为我们提供了成纤维细胞、髓系细胞和T细胞的一致性标签,这对于后续的分析和解释至关重要。

Identification of multi-cellular modules between fibroblasts and immune cells

在成纤维细胞与免疫细胞之间识别多细胞模块

Para_01
  1. 为了研究不同癌症类型之间的潜在多细胞共富集模式,我们计算了每个肿瘤样本中相应细胞室(成纤维细胞、T细胞和髓系细胞)中每个细胞亚群的比例。
  2. 使用corrplot R包中的cor.mtest函数对每一对细胞类型在不同肿瘤样本间进行了相关性分析。
  3. 然后使用ComplexHeatmap(v2.0.0)R包对相关性值进行聚类。
  4. 根据层次聚类结果,共识别出9个细胞模块,涵盖不同癌症类型的肿瘤样本。
  5. 对于每位患者,我们将来自同一细胞模块的细胞簇比例相加,并将最丰富的细胞模块指定为该患者的优势细胞模块。
  6. 为了计算每个CM亚型的分子功能特征表达签名,我们首先使用Seurat R包中的AverageExpression函数计算了每位患者中纤维细胞和免疫细胞中每个基因的平均表达量。
  7. 然后在之前描述的基础上,根据特征基因的平均表达量计算特征得分,并减去控制特征的聚合表达量。

Cell-cell interaction analysis

细胞-细胞交互分析

Para_01
  1. 我们使用了LIANA+框架,来推断在我们的研究包括的数据集中,成纤维细胞和各种免疫细胞类型之间的细胞-细胞相互作用。
  2. 细胞-细胞相互作用分析是针对不同数据集中的正常和肿瘤样本分别进行的,采用了CellPhoneDB配体-受体方法和Omnipath的全面配体-受体数据库。
  3. 然后,我们提取了显示出统计学显著性(P值<0.05)的预测配体-受体对。
  4. 这些显著的配对被进一步计数,并在我们的图示中进行展示以供阐明。

Analysis of spatial transcriptomics data

空间转录组数据的分析

Cell type deconvolution based on scRNA-seq data
Para_01
  1. 空间转录组数据通过Spaceranger(v.1.2.2)进行处理。为了完成在ST幻灯片中成纤维细胞和免疫细胞亚群的空间映射,我们将10x Visium数据与scRNA-seq数据相结合,使用cell2location包。
  2. 本质上,cell2location模型估计每个细胞群在每个空间位置的丰度。这是通过解析Visium数据中存在的mRNA计数来实现的,以参考细胞类型的独特转录组特征为指导。
  3. 细胞类型的参考签名是通过cell2location包中实现的负二项回归模型使用scRNA-seq参考数据集进行训练的。
  4. cell2location模型使用默认参数进行训练,然后估计每个点位每种细胞类型的细胞丰度的后验分布,这可以用于后续分析。
  5. 特定细胞类型的估计细胞类型比例是通过测量在ST幻灯片中选定的所有点位中,Cell2location测量的细胞丰度高于平均值的点位比例来确定的。
  6. 为了识别含有FAP+LRRC15+和FAP+LRRC15-肌成纤维细胞的点位,将所有肌成纤维细胞群中高于平均丰度的点位定义为肌成纤维细胞点位。
  7. 这些点位进一步根据一个点位的c04-LRRC15+肌成纤维细胞丰度是否超过所有点位的Cell2location测量的细胞丰度平均值来分类为FAP+LRRC15+或FAP+LRRC15-。
Cell type co-localization analysis
Para_01
  1. 为了研究纤维细胞和免疫细胞亚群在同一细胞模块中的空间共定位,我们在空间转录组学(ST)切片中使用了由cell2location算法生成的去卷积结果。
  2. 这些结果被用作Nebulosa R包中calculate_Density函数的输入。
  3. 这个函数使得计算不同细胞亚型在二维空间背景下的分布密度成为可能。
  4. 随后,我们使用了philentropy包中的KL函数来量化Kullback-Leibler(KL)散度,这提供了一个测量任意两个细胞亚群密度分布之间不相似性的度量。
Para_02
  1. 为了评估这些细胞亚群之间的空间共定位模式的统计显著性,我们构建了KL散度值的零分布。
  2. 这是通过反复洗牌细胞类型反卷积矩阵实现的,并选择两个随机组,每组由80%的位点组成,以计算密度和KL散度。
  3. 这一迭代过程进行了1000次。
  4. 经验p值被计算为观察到的KL散度大于零分布中对应值的实例的比例,除以排列的总数:N(null_d < x) / length(null_d)。
Para_03
  1. 利用LIANA+框架计算了配体-受体对的空间信息双变量指标。
  2. 具体而言,我们通过liana.ut.spatial_neighbors函数与参数"kernel=‘gaussian’"估计了每个ST幻灯片的空间连通性。
  3. 随后,使用Moran's R统计量通过liana.mt.lr_bivar函数与参数"function_name = ‘moran', n_perms = 1000, mask_negatives = True, add_categories = True"计算了配体-受体对的空间相关性。
  4. 在图示中展示了显示显著空间相关性(P < 0.05)的选择性配体-受体对。
Para_04
  1. 为了识别在感兴趣区域(ROIs)中表达升高的配体-受体对和功能基因集,我们计算了配体-受体对的签名分数和ROIs内外共表达情况。
  2. ROIs被定义为给定细胞子集的估计丰度超过群体平均值的位置。
  3. 签名分数是通过使用scanpy.tl.score_genes函数来计算的。
  4. 配体-受体对的共表达分数是通过计算两个基因的平均表达来确定的。
  5. 我们使用Wilcoxon秩和检验来评估其显著性。
  6. 同样,我们将ROIs的概念应用于成纤维细胞亚群(c04和c05)和癌细胞,计算了每个成纤维细胞亚群在其ROIs内每个点与相邻癌细胞的最小距离(以像素为单位)。
  7. 这些结果展示在图S4G中。

TCGA RNA-seq data analysis

TCGA RNA测序数据分析

Gene set enrichment analysis
Para_01
  1. 来自TCGA的表达数据是从UCSC Xena项目(http://xena.ucsc.edu)下载的,这些数据是通过一个标准的流程计算得出的。
  2. 对于每种癌症类型,样本是通过使用GSVA108 R包(版本1.34.0)中实现的基因集富集方法进行评分的,这反映了细胞类型的相对丰度。
  3. 纤维母细胞簇特异性特征、与TME相关的功能特征签名62和CM特异性特征被用于基因集富集分析。
  4. 不同患者组别之间特征评分的比较是基于Wilcoxon检验进行的。
Survival analysis
Para_01
  1. 为了模拟特定成纤维细胞亚群对总生存期的影响,我们使用maxstat R包中的maxstat.test函数根据特定成纤维细胞亚群的浸润水平对患者进行了二分法。
  2. 为了模拟两种成纤维细胞亚群相对丰度对总生存期的影响,我们通过两种成纤维细胞亚群之间的富集得分差异来分类肿瘤。
  3. 我们使用生存包中实现的Cox比例风险模型来检验患者组与总生存期的关联,并以年龄、性别和临床阶段作为每种癌症类型的协变量分别进行计算。
  4. 通过使用R包meta(版本5.5-0)中的随机效应模型进行元分析,将每种癌症类型的模型合并成一个泛癌症模型。
  5. 使用survfit函数构建Kaplan-Meier生存曲线,并使用R包survminer(版本0.4.6)绘制曲线以展示生存差异。
  6. 为了评估细胞模块(CMs)在不同癌症类型中的预后价值,我们使用多变量Cox比例调整风险模型来计算每个与CM相关的患者组在泛癌症水平上的调整后风险比,并为样本调整了年龄、性别、阶段和癌症类型。
Validation of cell type correlations within CMs
Para_01
  1. 我们使用了两种方法来验证特定CM中的成纤维细胞和免疫细胞亚群对在使用TCGA数据集时的相关性。
  2. 首先,我们计算了细胞类型特征分数在TCGA癌症样本之间的相关性。
  3. 特征分数是通过我们上述提到的簇特异性特征的基因表达均值来计算的。
  4. 其次,我们使用基于深度学习的方法Scaden对TCGA批量RNA测序数据集进行了细胞类型反卷积。
  5. 简而言之,我们使用了我们分析的每种癌症类型中包含的单细胞RNA测序数据作为训练数据集,然后我们分别为每种癌症类型单独构建了模型,使用了5000个训练步骤和1000个样本,并将模型应用于相同癌症类型的批量RNA测序数据。
  6. 然后,我们计算了TCGA数据集中每种癌症类型的患者中细胞类型对之间反卷积得到的细胞类型频率的相关性。
Fibroblast subset signature association with immunotherapy response
Para_01
  1. 为了研究成纤维细胞团与免疫疗法反应之间的关系,我们使用了来自三个不同癌症队列的公开可用数据,这些患者接受了抗PD-1或抗PD-L1免疫疗法(表S1)。
  2. 使用DESeq2 R包进行数据归一化,然后进行log2转换。
  3. 使用limma R包进行差异表达分析,这使得我们可以比较应答者和非应答者之间的基因表达谱。
  4. 根据t统计量对生成的基因列表进行排序。
  5. 通过选择上述提到的前100个差异表达基因(DEGs),选择了与成纤维细胞亚群相关的标志性基因。
  6. 我们进一步使用clusterProfiler包进行了基因集富集分析(GSEA)。
  7. 每个样本的标志性得分计算为上述提到的标志性基因的平均表达水平。
  8. 使用Wilcoxon秩和检验评估统计意义,并提供相应的p值。

Quantification and statistical analysis

定量与统计分析

Statistical analysis

统计分析

Para_01
  1. R 3.6.1/4.0.5 和 Python 3.7.10/3.9 用于所有的统计分析。
  2. 生存分析中应用了 Kaplan-Meier 方法。
  3. 本研究中使用的统计方法包括 Wilcoxon 检验和 t 检验,具体描述见图形的图例。