ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
106 stars 30 forks source link

如果一只小鼠的每一个细胞都可以溯源? #448

Closed ixxmu closed 3 years ago

ixxmu commented 3 years ago

https://mp.weixin.qq.com/s/ijpXIg9ZBvAR9xy2PhHBNA

github-actions[bot] commented 3 years ago

如果一只小鼠的每一个细胞都可以溯源? by 果子学生信

所见即所得,现在人们在想尽办法能看到真实的生物学变化过程,尤其在微观世界。在发育学领域,人们想尽办法想要“看到”细胞分化发育的轨迹。单细胞技术的发展,将发育领域的分辨率降低至单细胞级别,1细胞期-8细胞期等超早期的胚胎发育情况得以研究。

但单细胞测序也不是万能,一是贵;二是虽然10X已经可以分析上千个细胞,但对于组织、器官甚至个体来说,测序通量以及深度远远不够;三是只能通过生物信息学的方法依据某些biomarker去推论lineage tracing和发育轨迹,却没有直接的证据证明上一个时间点的哪一个细胞群是下一个时间点的progenitor。

今天介绍的文章试图解决这个问题:Developmental barcoding of whole mouse via homing CRISPR

开始之前,关于PAM的疑问

有好几次听过这样一个问题,既然CRISPR是细菌的“免疫力”,为什么CRISPR-Cas9细胞的gRNA不切自身的基因,而只针对外来生物,细胞自身CRISPR上不也有gRNA的target序列吗?

这个问题其实还是和CRISPR-Cas9的作用机制有关。我们来回忆一下整个故事:

(1)在风和日丽的某天,一个细菌遭受到了噬菌体的侵入,Cas1/Cas2复合物识别并将侵入者核酸的特定片段剪切,存入自己的黑名单(CRISPR)中;接着CRISPR位点可转录出CRISPR RNA (crRNA),crRNA随后结合Cas形成一种蛋白质-RNA复合物, 该复合物可识别并降解与crRNA互补的入侵核酸。这就是人不犯我我不犯人,人若犯我,这个仇我能记到基因里。

(2)细菌辨别敌我的主要方法是PAM(protospacer adjacent motif )序列。上面我们提到的Cas1/Cas2复合物,他们的作用就是寻找特定的侵入者序列,并塞到自身基因组中,其机制仍然是先找到PAM序列,而后把PAM序列后的序列插入到基因组中 [1]。对于Cas9来说,其可识别的PAM序列是NGG,在CRISPR序列中并不存在NGG这样的PAM,因此Cas9无法对自身CRISPR序列造成杀伤。

那么问题来了,加入自身CRISPR中真的存在PAM,那么Cas9是否会攻击自身?这个答案是肯定的,而这种“自我伤害性”也被用来开发成hgRNA(homing guide RNA),而我们要讲的这篇文章,就是基于hgRNA的barcode小鼠的故事

1. 研究背景和设计

使用核酸酶诱导突变的barcode是一种记录生物信息的强大方法,包括发育谱系。然而,它在哺乳动物系统中的应用一直受到限制。作者在小鼠体内使用多个gRNA进行barcode,每个gRNA可产生数百个突变等位基因,多个gRNA组合可产生指数多样性的barcode。(1)如下图设计板块显示,在Cas9缺失的小鼠中,hgRNAs处于休眠状态,当与Cas9小鼠杂交后,Cas9启动条码,hgRNAs被激活,从而产生不同的突变。(2)通过分析barcode的相似性,由此可追溯细胞的发育轨迹。(3)其原理就是上面提到的PAM介导的Cas9切割当PAM被组装在自身基因组中时,Cas9也可攻击自身基因组。(4)每种gRNA可产生数百突变,多个gRNA结果组合可产生指数级结果,仅用10个hgRNAs就可以产生大约10的23次方个不同的条形码组合。

小问题:这样的hgRNA library,你会倾向于使用何种方式转入小鼠基因组中?在本文中,作者使用的是piggyBac系统,这样做有什么好处?

2. 实验方法

作者首先构建包含有4中长度的hgRNA piggyBac library(为何要长度不同),然后将hgRNA piggyBac library在转座酶的帮助下转入小鼠胚胎干细胞中(mES),然后将这转染后的mES显微注射入小鼠胚胎的囊胚阶段(为何选择囊胚阶段),接着将胚胎移植到代孕母鼠子宫中,最后在诞下的小鼠中选出合适基因型的小鼠,即为MARC1(Mouse for Actively Recording Cells 1)小鼠。

虽然是寥寥数笔,但几乎每一步都相当艰难:

(1)构建hgRNA library要经过大量的计算和评估,具体感兴趣可见该文章的补充材料部分。

(2)设计4个不同长度hgRNA则是因为随着个体发育,细胞会不断的自我切割,当PAM前序列过短,该hgRNA将快速失效,因此短hgRNA可用于早期监测,而长hgRNA则用于个体后期发育监测。

(3)小鼠胚胎干细胞转染后显微注射到囊胚中,显微注射存在一定的技术壁垒;我大胆猜测选择囊胚阶段胚胎的原因是,胚胎干细胞的来源就是囊胚时期的inner cell mass,此时打入同时期的mES可以直接融合到inner cell mass中并参与后续的胚胎发育,并且此时囊胚有一个腔隙,使得mES有处可去。

(4)系统的设计和构建要经过非常精密的计算,每一步都不能有差错,我们自己无法做出这样的工具,但是如果经费允许,可以购买(这些小鼠有卖的)。在工具小鼠被创造出来之后,文章使用了很大的篇幅去验证工具的可靠性,在这里便不再细说。

3. 作者应用:脑轴发育

胚胎神经系统及其祖细胞开始于原肠期(E6.5),到E8.5时,大脑前后A-P轴和左后L-R轴均在神经管中建立。而哪个轴首先被建立仍然未知。由于在形态水平上,它们同时发生变化,且之前在体外进行的单细胞标记和追踪实验并没有充分解决这个问题。为了研究脑部轴线发育的次序,作者采集两组1岁龄小鼠前后A-P轴和左右L-R轴的样本,经hgRNA测序后发现,小鼠的左右轴hgRNA的相似度高于前后轴,因此推测小鼠脑发育次序是先发育前后再发育左右。

这可以算是一篇非常经典的基因编辑小鼠的文章了,补充材料有非常详细的实验及数据处理方法,尤其是hgRNA设计方法和计算,如果感兴趣,这将是一份非常好的学习材料。

在看这篇文章之前听说有这样的小鼠,我们第一反应是可否使用单细胞测序去追踪某种特定细胞的发育路径,目前看来由于hgRNA loci非常小而且表达量未必很高,对于测序深度不够的10X,实则很难达到。而hgRNA 测序无论如何也是一个pool,因此要追踪发育则需要非常精准的分离出所需的样本,这是本人考虑到的难点之一。优秀的工具是进步的关键,我们虽然可能无法用上,但没吃过猪肉也要试着见过猪跑。欢迎留言讨论idea。

Reference:

  1. Wang J, Li J, Zhao H, et al. Structural and mechanistic basis of PAM-dependent spacer acquisition in CRISPR-Cas systems[J]. Cell, 2015, 163(4): 840-853.