ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
124 stars 30 forks source link

单细胞测序 | 10x Genomics 转录组测序原理简单整理 #4718

Closed ixxmu closed 8 months ago

ixxmu commented 8 months ago

https://mp.weixin.qq.com/s/w_o3kwMZtfi7tlFR0DRGeQ

ixxmu commented 8 months ago

单细胞测序 | 10x Genomics 转录组测序原理简单整理 by 被炸熟的虾

基础回炉,防止被锤。粗糙的回顾一下(不是,新学一遍)。

单细胞测序技术是指在单个细胞水平上,对基因组、转录组、表观组等遗传信息进行高通量测序分析的一项技术。

图片出处:Therapeutic Targeting of the TumorMicroenvironment. Cancer Discov.

2021 Apr; PMID: 33811125.

自2009年汤富酬老师团队首次开发单细胞转录组测序技术以来,各种单细胞测序平台相继产生,单细胞技术的应用出现了爆发式的增长,为解释科学问题提供了新的角度。

图片出处:一图追踪scRNA-seq近15年的发展历程

单细胞测序与传统的混合测序(Bulk sequencing)的最大不同之一就是:单细胞测序需要额外的捕获/分选步骤,测序文库是建立在一个细胞而非一群细胞上的。我们以最常见的10x Genomics为例:

10x Genomics 单细胞平台由于其成本优势和通量优势,在市场上处于绝对优势。10x Genomics利用液滴法的原理,通过微流控、油滴包裹和Barcode标记等技术,实现大规模的单细胞分离、标记,主要流程包括以下步骤:

  • Step0、Prepare your sample(样品制备):酶解样品,制备单细胞悬液

  • Step1、GEM generation(生成油包水结构体系)

  • Step2、Construct your 10x library(文库构建):构建用于测序的cDNA文库

  • Step3、Sequencing(测序):illumina测序

  • Step4、Analyze your data(数据分析):10x提供下机数据的分析软件Cell Ranger,可以提供质控报告和表达矩阵

  • Step5、Visualize your data(数据可视化)

其中,第二步可谓核心中的核心。文库构建完后,后续的测序依旧是传统的二代测序。


核心硬件

10x Genomics平台的主要设备外观如下,在微流控芯片的配合下制作油包水乳浊液(Step1 GEM Generation & Barcoding):

微流控芯片(展示两个版本)

微流控芯片是一个“4行8列”的结构,“4行”是指每一行需要执行一种不同的功能,“8列”是指每片芯片可以同时对八个样品进行处理。每一行的具体功能如图标注:

Sample Well:在1号孔中加入细胞悬浮液(Cell Suspension);

Gel Beads Well:在2号孔中加入凝胶珠(Gel Beads);凝胶珠需要先进行离心,保证其中没有气泡且液面平均。

Oil Well:然后,在3号孔中加入用于隔开单个细胞的油(Partitioning Oil);

上述三步完成之后,经由微流体交叉系统三者混合形成GEM(nanoliter-scale Gel Beads-in-emulsion,油包水结构体系),每个GEMs就是一个反应体系。

一个油滴/GEMs = 一个细胞反应体系 = 一个独立RNA-seq

凝胶微珠(Gel Beads)是每个反应体系的核心。Beads是一种微小的凝胶珠,表面上有非常多特定的DNA片段,这些Beads可以在细胞裂解时捕获片段,并在cDNA合成阶段引入设计序列。以3'转录组为例:

  • Read1:一段已知序列,cDNA扩增时的引物模板。

  • Barcode(条形码)16个碱基的DNA片段,用于区分不同的细胞或样本。一个凝胶微珠对应一个Barcode,任意两个beads的Barcode之间相差两个或两个以上碱基。Barcode可以将测序数据中来自不同细胞的RNA分子区分开来,从而实现单细胞水平的分析。

  • UMI(Unique Molecular Identifier,唯一分子标识):UMI是一段随机序列,磁珠上的每一个DNA片段都有自己的UMI序列。12个碱基长的UMI序列有100多万种序列的变化,可以确保同一个分子不被重复计数。后续定量时,如果序列UMI相同,我们认为这种序列是在测序过程中由PCR扩增而产生的。因此UMI可以帮助排除PCR扩增过程中由于扩增效率不同所产生的误差(即排除PCR扩增效率的偏好性)。

单个细胞里的DNA或RNA含量仅仅处在皮克(picograms)级水平,远远达不到现有测序仪的最低上样需求。从单细胞RNA到文库意味着核酸的扩增量要达到百万倍以上,而在这个高的扩增量不引入PCR偏差一直是个较大的问题。我们可以想一下,如果两个样本基因表达量是相同的,但扩增效率A是99%,B是97%,在扩增30个循环后,两者在扩增后的表达就有了1.84(0.9930/0.9730)倍的差异。而当我们分析差异基因的时候如果选1.5倍作为差异基因的标准,那么本来没有差异的基因也会出现差异。
  • Poly(dT):一长段的T(胸腺嘧啶)序列(约30个碱基长度),这段序列可以与mRNA的Poly(A)尾结合进而捕获mRNA,同时作为逆转录的引物,逆转录出cDNA来。
In addition to the poly(dT) primer that enables the production of barcoded, full-length cDNA from poly-adenylated mRNA, the Single Cell 3ʹ v3.1 Gel Beads also include two additional primer sequences (Capture Sequence 1 and Capture Sequence 2), that enable capture and priming of Feature Barcoding technology compatible targets or analytes of interest.Only the poly(dT) primers are used in this protocol for generating Single Cell 3ʹ Gene Expression libraries.

文库制备

紧随着GEM体系生成,细胞裂解,Gel Beads自动溶解释放大量引物序列,在3'转录组分析中,Poly(dT)与带有PolyA的mRNA结合进行逆转录,生成带有Barcode和UMI信息的cDNA第一链。

TerminalTransferase (末端转移酶):在cDNA末端添加一定数量的C碱基,以便识别cDNA库的末端并进行正确的数据分析和拼接
TSO(TemplateSwitching Oligo)是一段特殊引物,末端的3个G碱基可以与上一步添加的C碱基互补配对,这有助于避免RNA片段的丢失和提高cDNA合成的完整性,也可以作为后续模板转换与扩展的引物模板。

5'转录组测序反转录原理类似:

cDNA扩增:以已知序列Read1(正向引物)和TSO(反向引物)设计引物,进行cDNA的扩增,以获得足够数量的DNA用于文库的构建。

然后将扩增后的cDNA进行酶切片段化,筛选合适长度片段,通过末端修复、加A、接头连接Read2测序引物,构建含有P5和P7接头以及index的表达谱文库(见下图):

自此,单细胞转录组文库构建完成,接着就该进行illumina测序。


参考文章:

  • https://www.10xgenomics.com/cn/support/single-cell-gene-expression/documentation/steps/library-prep/chromium-single-cell-3-reagent-kits-user-guide-v-3-1-chemistry-dual-index

  • https://www.10xgenomics.com/cn/support/single-cell-immune-profiling/documentation/steps/library-prep/chromium-single-cell-5-reagent-kits-user-guide-v-2-chemistry-dual-index

  • https://mp.weixin.qq.com/s/8wZsNI34CZ_Ui26sSre-ag

被炸熟的虾
自己的摸索,发现问题麻烦告诉作者,光速回来改正