ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

张泽民老师系列研究成果全汇总 #1985

Closed ixxmu closed 2 years ago

ixxmu commented 2 years ago

https://mp.weixin.qq.com/s/-MpXbM05cmzEcras4W-DMA

github-actions[bot] commented 2 years ago

张泽民老师系列研究成果全汇总 by 生信人

1.前言
张泽民,想必很多医学科研界的研究者都或多或少了解过这位北大教授的传奇故事。同时,我们还能联想到的是一系列和张老师相关的特征:“生信大佬”,“单细胞测序技术”,“泛癌数据挖掘”等等。如今,作为很多人梦寐以求的科研圣地,张老师课题组平均每年都有好几篇CNS期刊成果发表。从2017年发表的第一篇国产Cell开始,张老师课题组一直致力于使用单细胞测序技术解决肿瘤微环境的相关科学问题,在短短5年时间内产出了许多具有重大意义的科研成果,因此,今天小编就借此机会来系统总结一下截至目前张老师所有的重要研究发现。

在解读相关科研成果之前,我们先来了解一下张泽民老师的科研生涯。张泽民老师在南开大学毕业后,选择到美国读博,随后就加入了罗氏公司,彼时的他每天都专注在肿瘤里找药物靶点。在这家世界领先的制药公司里,张泽民深耕了近17年,并最终做到癌症基因组学和生物信息学的首席执行经理,在多项癌症治疗药物的分子靶标的原创发现中做出了直接贡献,那时的张老师已经在圈内很有影响力,但拥有一颗爱国情怀的张老师之后,并没有选择一直留在美国。随后,在2014年,张老师应现任北京大学生物医学前沿创新中心主任谢晓亮之邀,正式加入北京大学担任教授。回国后的前几年里张老师并没有成果产出,而在2017年发表的第一篇Cell,让中国医学科研界彻底记住了他的名字。随后的每年里张老师都会有CNS主刊文章发表,特别是在2021年达到了学术顶峰,但相信未来张老师可能还会创造新的科研高峰。


在这需要说明的一点是,由于张泽民老师挂名的研究论文实在是太多了,但是其中很多都是合作课题的研究成果。为了方便大家学习张老师科研最精华的部分,本次小编只对张泽民老师作为末尾通讯的17项研究,并且分为10项“研究型科研成果”和7项“技术型科研成果”两大板块进行解读。

2.研究型科研成果汇总
首先介绍的是2017年张老师在Cell上发表了一篇名为“Landscape of Infiltrating T Cells in Liver Cancer Revealed by Single-Cell Sequencing”的文章。小编在做细胞类型注释时一直参考的就是这篇文章,想必很多小伙伴最开始也都是因为这项研究认识的张泽民老师,这项研究可谓是利用单细胞测序技术研究肿瘤免疫微环境的典范了。


这项工作是国际上首次大规模针对肿瘤相关T细胞的单细胞组学研究,提供了极有价值的数据资源,为多角度理解肝癌相关的T细胞特征奠定了基础。该项工作的数据积累、科学发现和理论推演有望促进已有的免疫治疗方案在肝癌中的临床应用,并有助于发现有效的针对肝癌治疗免疫治疗靶点,进而加速创立新的肝癌免疫疗法。同时,该项工作也为肿瘤免疫的图谱勾画做出了范式,为今后其他肿瘤开展类似的研究及各类肿瘤免疫的发展提供基础。

2018年张老师的另一项研究发表在Nature Medicine上,篇名为“Global characterization of T cells in non-small-cell lung cancer by single-cell sequencing”。这项研究,作者对来自14例非小细胞癌初治患者外周血、癌组织及癌旁组织的12,346个的T细胞进行了单细胞测序。


这项研究也给靶向抑制杀伤性免疫细胞的调节性T细胞(Treg)给免疫治疗提供了一条重要思路。过去的研究通常将肿瘤内部的Treg作为一个整体与癌旁和外周血中的Treg进行比较。而该研究发现,根据TNFRSF9(又称4-1BB)的表达可以从肺癌浸润Treg中区分出一群处于激活状态的Treg,该群Treg中抑制功能相关基因的表达水平更高,暗示其为肿瘤中真正发挥抑制功能的Treg细胞。同时,激活态Treg的比例与肺腺癌病人的预后相关,可作为又一可靠的临床标志物。

2018年张老师推出了一款新的追踪肿瘤中T细胞的动态变化的算法:STARTRAC,这项研究成果发表在Nature上,篇名为“Lineage tracking reveals dynamic relationships of T cells in colorectal cancer”。其对结直肠癌中的T细胞类群、功能及动态特征进行了深入探究,为进一步发掘新的治疗靶点和策略提供了契机。


这一结果有助于我们理解肿瘤微环境中这些丧失战斗能力的T细胞的来源,并为逆转其状态提供了新思路。此外,基于单细胞测序技术,研究人员在结直肠癌组织中发现了两群高表达干扰素相关基因的CD4+细胞,其中一类在微卫星不稳定结直肠癌病人中显著增加,可能与该类病人对免疫检查点抑制剂治疗的良好响应有关。进一步研究表明,具有未知功能的膜表面蛋白IGFLR1则可能是一种新的协同刺激因子,或可作为潜在的药物治疗靶点。

相比起2020和2021年,2019年可能是张老师过渡的一年,虽然说是过渡,也还是有一篇Cell见刊的。就是会有一些论文挤到一年发表,2020年出和2019年底可能并没有什么本质区别。这项研究名为“Landscape and Dynamics of Single Immune Cells in Hepatocellular Carcinoma”,小编觉得这也是一篇做肿瘤免疫的模板文章


本研究结合了SMART-seq2和10x Genomics Chromium 3’两种单细胞测序技术,并整合这两种平台的数据进行生物信息学分析,充分发挥不同数据类型的优势,获得高分辨率的肝癌免疫图谱。

2020年是张老师科研产出较高的一年,其中包括1篇Cell,1篇Nature,1篇Cell research和2篇Nature Communications。首先要介绍的就是这篇名为“Single-Cell Analyses Inform Mechanisms of Myeloid-Targeted Therapies in Colon Cancer”发表在Cell上的研究论文。


这项研究作者通过整合实验室自己产出的单细胞转录组测序数据及已发表的公共数据,构建了15个癌种内的髓系细胞图谱,并系统性地比较了各髓系细胞类群在不同癌种间组成、发育及功能上的异同。此外,本项研究首次通过泛癌分析刻画了肿瘤浸润髓系细胞在不同癌种内的特征图谱,并系统性地对比了各类髓系细胞类群在不同癌种内组成和功能上的差异。

2021年是张老师产出最多的一年,在这一年里发表了4篇重大研究,其中包括2篇Cell,1篇Cancer cell和1篇Genome Biology。首先要介绍的是另一篇纯单细胞数据挖掘就能发表在Cell杂志上的篇名为“A pan-cancer single-cell transcriptional atlas of tumor infiltrating myeloid cells”的文章。


肿瘤浸润性髓细胞(TIMs)是肿瘤进展的关键调节因子,但它们在不同肿瘤中的基本特性的相似性和差异性仍不清楚。在这项研究中,作者通过对15种人类癌症类型的210名患者的骨髓单细胞数据进行泛癌分析,确定了不同癌症类型TIMs的不同特征。其中鼻咽癌中的肥大细胞被发现与更好的预后相关,并且表现出具有高比例的TNF+/VEGFA+ 细胞的抗肿瘤表型。

另一篇Cell是做的新冠研究,之前还觉得张老师会不会对新冠不感兴趣,一直没有他在这方面大的文章,后来觉得是自己太浅薄,老师是想发大的!于是就有了下面这篇名为“COVID-19 immune features revealed by a large-scale single-cell transcriptome atlas”的Cell。


为了描述COVID-19的免疫特性,这项研究基于中国COVID-19单细胞联盟(SC4),对来自196名COVID-19患者和对照284个样品应用了单细胞RNA测序,并创建了一个拥有146万个细胞的全面免疫环境。大型数据集能够确定不同的外周免疫亚型变化与COVID-19的年龄,性别,严重性和疾病阶段等不同的临床特征有关。此外SARS-CoV-2RNAs存在于多种上皮和免疫细胞类型中,并伴随病毒阳性细胞内的转录组显着变化。S100A8/A9的系统性上调主要由外周血中的巨核细胞和单核细胞引起,可能导致重症患者中频繁观察到的细胞因子风暴。这项研究的数据为了解COVID-19的发病机理和制定有效的治疗策略提供了丰富的资源。

同年发在Cancer cell上的一篇名为“Single-cell analyses reveal key immune cell subsets associated with response to PD-L1 blockade in triple-negative breast cancer”的文章做的是三阴性乳腺癌的研究。


为了解析阿替利珠单抗联合紫杉醇药物的作用机制,这项研究对来自22例晚期的TNBC患者(11例接受阿替利珠单抗联合紫杉醇化疗,11例接受紫杉醇单药化疗)治疗前和治疗后的78例配对样本进行scRNA-seq、scTCR-seq和scATAC-seq,通过比较联合用药患者中响应组与非响应组患者的肿瘤微环境及外周血免疫特征,发现高水平的CXCL13+T细胞与巨噬细胞的促炎特性相关,可以预测联合治疗的有效反应。而紫杉醇化疗显著降低了肿瘤微环境中的CXCL13+T细胞,使具有免疫抑制功能的巨噬细胞富集。因此,在联合治疗时影响了阿替利珠单抗的治疗效果。此研究提示进一步系统地评估不同化疗药物与免疫治疗联合使用的分子机制,为寻找有效的联合治疗方案提供了新的思考。

前不久,张泽民老师联合北京世纪坛医院外科彭吉润老师合作在另一项肿瘤研究领域的顶级期刊Cancer Cell上以Article形式在线发表了题为Immune phenotypic linkage between colorectal cancer and liver metastasis的另一篇研究论文。


这项研究作者收集了17个未经治疗的结直肠癌肝转移(CRLM)患者的包括原发肠癌及癌旁,肝转移及癌旁,肠系膜淋巴结和外周血在内的101例配对样本,通过多平台的scRNA-seq和T细胞受体(TCR)序列测序,构建了CRLM患者免疫细胞的高分辨率转录组图谱。进一步整合了18位原发结直肠癌(CRC)和16位原发肝癌(HCC)患者的100例配对样本,设计了PhenoAligner方法来量化niche和malignancy对免疫细胞表型的影响,定义了表型显著受到肿瘤细胞特征影响的免疫类群(M型)、表型显著受到器官微环境影响的免疫类群(N型)系统揭示了TME、癌症类型和器官微环境之间复杂的相互作用。

而在2022年张老师发表的最厉害的研究成果就是这篇SCIENCE,篇名为:Pan-cancer single-cell landscape of tumor-infiltrating T cells的文章。如果说其它大型实验室用了好多年,做了很多实验才能发SCIENCE,而这篇是一篇纯粹的只依赖于单细胞数据挖掘的文章,给予小编心理无与伦比的震撼,下面就来简单解读一下这项研究的主要内容。


在这项研究中,作者对各种癌症类型的患者的肿瘤、癌旁组织和血液样本进行了单细胞RNA测序(scRNA-seq)构建一种高分辨率的泛癌T细胞图谱,并收集了其他已发表的scRNA-seq数据集。在校正了混杂因素和批次效应后,对这些不同的数据进行了整合。该图谱由21种癌症类型的316名患者的scRNA-seq数据组成。将T细胞表面上的T细胞受体(TCR)序列与基因表达谱组合起来,以描述T细胞的扩增和动态。应用各种计算方法来研究不同癌症类型的T细胞的特征和丰度。

3. 技术型科研成果汇总
说完张泽民老师截至目前发表的以科学问题为导向的研究型科研成果,那么接下来我们就来从另一个角度认识张泽民老师,来学习一下他的团队这些年发表的技术型研究成果。作为一位生物信息学界的大牛,他带领着他的团队这些年还开发出了一系列高水平的生信分析工具/算法。而且,不同于其它只做生信工具开发的团队,张老师团队开发的工具更注重解决实际的生物学问题。

说到张老师开发的生信工具,首先要介绍的是早在2010年发表在Nature上的一篇名为“The mutation spectrum revealed by paired genome sequences from a lung cancer patient”的文章,这项研究全面揭示了肺癌患者的基因突变特征。


作者在该肿瘤中验证了530个体细胞单核苷酸变异,包括一个在KRAS原癌基因和391个其他编码区域,以及43个大规模结构变异。这些构成了一个大的新的体细胞突变集,并产生了大约17.7个每兆酶全基因组的体细胞突变率。值得注意的是,与非表达基因相比,这项研究的工作者观察到表达基因和所有蛋白编码基因上游高达5千碱基的启动子区域对突变的独特选择模式。此外,作者在激酶基因中观察到更高的氨基酸改变突变率。这项研究对单个肺肿瘤的体细胞改变提出了一个全面的图谱景观图谱,提供了关于肺癌突变选择的第一个科研证据,并揭示了在肿瘤环境中存在明显的选择性压力。

紧接着,是这一篇在2014年发表在Nature biotechnology上的篇名为“A comprehensive transcriptional portrait of human cancer cell lines”的研究论文。


肿瘤来源的细胞系已成为研究肿瘤生物学的重要模型,对肿瘤细胞系的研究有助于我们对癌基因功能和治疗反应的理解。虽然科研工作者已经做出了大量的努力来定义癌症细胞系面板的基因组组成,但转录组层面仍然有待进一步研究。这项研究描述了675个人类癌症细胞株的RNA测序和单核苷酸多态性(SNP)阵列分析。根据分析结果,这项研究提供了包括基因表达、突变、基因融合和非人类序列表达在内的转录组特征的综合分析。在2200个被编目的基因融合中,有1435个由以前在融合中没有发现的基因组成,这为进一步的研究提供了许多线索。此外,这项研究还以一种基于通路的方法结合多基因组和转录组特征,以增强对靶向治疗的反应预测。我们的研究结果为使用癌细胞系的研究提供了宝贵的资源。

我们都知道,张老师主要是以单细胞测序技术来解决实际问题,当然就少不了开发一系列的单细胞数据分析软件。首先这个就是在2020年发表的这篇“An entropy-based metric for assessing the purity of single cell populations”,这项研究作者提出了一种单细胞类群纯度评估新方法。


研究者拓展了之前开发的E-test方法,使用微分熵(differential entropy)来描述单细胞数据的基因表达分布,进而建立表达熵模型(S-E model)以刻画微分熵与基因表达量均值之间的联系。在无监督聚类、交叉验证等一系列评估中,表达熵模型均显著优于之前发表的无监督基因选择方法,可以准确有效地鉴定出高变异基因(highly variable genes)。他们进而基于该模型设计了ROGUE这一统计量以评估给定细胞类群的纯度。

同年发表的另一篇是篇名为“SciBet as a portable and fast single cell type identifier”的研究论文,这是一款单细胞细胞类型注释软件。


由于SciBet算法采用了简洁的参数模型,除了速度优势及可解释性强之外,其训练后的模型在存储上也非常高效,并且仅依赖细胞类型个数。如一个普通的拥有数十种细胞类型的数据集的SciBet模型大小不足1MB。基于这一”便携“特性,本项目还发布了近一百个高质量数据集的SciBet预训练模型,这些模型均可以直接导入SciBet的R软件包中。除此之外,本课题还提供了基于JavaScript实现的在线版SciBet(http://scibet.cancer-pku.cn/)。这使得用户无需上传自己的数据到服务器,而仅需在线加载预训练模型或本地加载自定义训练集即可在浏览器中快速完成测试集中的细胞类型鉴定,并得到可视化分类结果。任仙文副研究员表示:“作为面向未来超大规模数据集的单细胞快速注释方法,SciBet将会对单细胞测序领域产生重要积极影响。”

发表在Cell research 上的这篇名为“Reconstruction of cell spatial organization from single-cell RNA sequencing data based on ligand-receptor mediated self-assembly”的文章是scRNA-seq结合空间转录组的应用,用来研究组织/器官的空间组织结构及胞间相互作用。


这项研究中,研究人员将深度学习算法与空间转录组和组织学影像结合起来,在乳腺癌样本中捕获高分辨率的基因表达异质性。这个工具叫做细胞空间组织作图器(Cellular Spatial Organization mapper, CSOmap),旨在利用scRNA-seq的信息来重建组织的空间结构。在经过验证步骤后,CSOmap可用于重构人和小鼠多个器官中的空间细胞组织结构。这种重要方法在临床转化中具有巨大的潜力,可以快速分析靶点相关的转录谱中空间和局部的改变、基因和蛋白质的表达,并提高临床分子病理学的质量和水平。

另一项是篇名为“Genomic basis for RNA alterations in cancer”的研究论文,也在这一年发表在Nature杂志上。在文章中研究者们提出了一个跨越27种不同的肿瘤类型的全面的RNA水平变化目录,在基因组背景下,这种RNA改变为鉴定与癌症相关的功能基因和机制提供了丰富的资源。


这项分析里研究人员们分析了1188个转录组的数据,发现拷贝数变异仍然是癌细胞中驱动基因表达变化的主要因素,但数百个单核苷酸突变也会影响到周围基因的表达。此外,癌细胞里的一些突变还会引起转录信息的变化,如产生新的蛋白编码序列等。本项研究结果也深刻证明,将RNA和DNA测序分析整合在一起,将在癌症研究中发挥强大作用。

最后一篇是发表在Genome Biology上,篇名为“iMAP: integration of multiple single-cell datasets by adversarial paired transfer networks”的研究。这项研究是张老师课题组开发的一个用于单细胞数据整合的工具:iMAP,不过它是基于python语言编写的,对大多数只使用R语言的小伙伴来说并不友好,但是功能还是很强大的。


iMAP首先构建了一种新的自编码器结构来提取细胞的低维表示特征,该特征能够一定程度上消弭批次效应的影响,同时保留不同数据集之间真实存在的生物学差异,进而通过构建rwMNN细胞对,形成有效的自训练数据指导后续GAN网络进行正确的细胞基因表达分布混合。

与其他方法相比,iMAP既能匹配不同批次数据集中相同类型的细胞的基因表达分布,又能识别各个数据集上特定的细胞类型。他们在十多个不同规模、不同测序技术产生的数据集上论证了iMAP方法的有效性与可靠性。与其他基于深度学习的方法相比,iMAP在大规模数据集上具有显著的速度优势。他们也将iMAP应用于肿瘤浸润免疫细胞数据集的分析,通过整合分别由Smart-seq2和10x Genomics技术产生的数据集发现了肿瘤微环境中新的细胞间相互作用。

4.说在最后
好啦,看到这,我们已经把张泽民老师主要的研究成果都学习完了。本篇推文可以说是截止到目前对张泽民老师所有科研成果进行的最系统、最全面的总结了,如果有小伙伴想去张泽民老师实验室,需要提前了解张老师的研究领域,那么读这篇推文就够了。同时,如果有想全面了解国内使用单细胞测序探索肿瘤微环境的研究历程,那也只需要读这篇推文就够了,因为张泽民老师的研究就在很大程度上代表了国内这个领域的研究。

其实很久之前小编就已经总结过张老师的研究,但都没这次全。如今,作为在世界范围内都有很大知名度的教授,张老师的文章投到哪个杂志都会被给予很高的评价。我们知道很多大佬在功成名就后,都喜欢做一些所谓的“套路”性研究,即一个科研思路或者设计换成不同的肿瘤进行复制,这样不仅发文快,而且损耗小,更容易出成果。而不同于那些人,张老师一致不断挑战自己,不断从新的角度解决在实际临床肿瘤治疗中最迫切需要处理的问题。因此,小编每次看完老师新发表的研究成果都像吃一顿大餐一样,可谓十分享受,十分舒适。从上面的一系列研究成果中,我们也很难发现其中某两个很相像。因此,张老师身上这点对科研未知问题的执着追求是值得我们每一个科研人学习的,衷心希望未来的中国医学科研界能出现越来越多像张老师这样的大科学家,这才是我国医疗科学事业长足发展的保障!

更多生信分析问题咨询: 18501230653(微信同号)

生信分析好文推荐



01
肿瘤免疫风云莫测:NATURE重磅带来的全新启示
02
MC综述:肿瘤缺氧微环境中的外泌体
03
Cancer Cell综述:微生物与癌症
04
别让“铜死亡”成为你的“痛点”
05
22年一定要掌握的十大生信发文路线