Closed ixxmu closed 3 years ago
很多团队的leader对生物信息有偏见,觉得生信是华而不实的技能。
而我理解的生信是高通量的实验。
我拿他莫昔芬耐药的机制研究来举个例子,
首先课题组获取了莫昔芬耐药的乳腺癌细胞株,这个事情是明确的。
接下来,我们要做的事情是,搞清楚他为什么会耐药,以及如何打破耐药,研究好了就可以博士毕业了。
那通常我们是怎么做的呢?可能有这么些情况。
1.看文献:找到一篇高分文献,里面研究了一个跟耐药十分相关的分子A,所涉及的通路跟乳腺癌既往耐药的有交集,准备拿过来试试
2.课题组基础:前期已经找到了一个分子A跟耐药相关,但是师兄没有研究清楚机制,我准备接着做
3.课题组强行指定:研究分子A,因为咋们课题组就是研究分子A 的,什么都得往上靠,以后写国自然都可以算作前期基础。
4.放养,等死。
现在是,我们拿到这个分子A,对他进行敲减过表达,然后再看看是否能够打破耐药,如果影响耐药,咋们就往经典通路靠,最后能发一个3-5分的文章,顺利毕业。
这种情况,在多个课题组轮番上演,他们最终都说自己发现的分子A,B,C,D都跟耐药相关,做是做不完的,因为人类的编码基因就有2万个。
那么有没有什么方法,可以一次性并行完成2万个基因的耐药实验呢?
有的,就是今天介绍的CRISPR screening的技术。
这个技术,我个人觉得未来会是科研人员的标配。有了它,研究的原创性就有了保障,对于理解疾病和发现机制是神器。值得花时间研究。
哪怕不做,也要了解一下。
某天晚上我和师妹在微信上描述CRISPR screening实验时,她表示惊叹说,师姐这难道不是精准的大海捞针吗?
因此本期我们的文章标题使用了师妹非常精辟的描述。
在平时,我们要研究某基因的功能只能通过单独敲低/敲除、过表达的方式,
而CRISPR screening允许我们同时进行上万个这样的操作,一次搞定基因组范围的基因编辑,确可谓:精准大海捞针。
高通量是新时代生物技术的标配,从能一次完成超过5万个基因的PCR(RNA-seq)到细胞谱系追踪(barcoding),在不影响研究精准度的情况下,大大的降低科学研究时间和成本。依据我们前面的介绍,sgRNA将Cas9蛋白靶向至目的序列,Cas9结合到DNA上后剪切DNA,那么以下这几种情况则非常好理解:
(1)Cas9 + 1个sgRNA:针对一个基因进行编辑;
(2)Cas9 + 2个sgRNA:可针对两个基因进行编辑,或者可敲除两个sgRNA之间的大DNA片段;
(3)Cas9 + 多个sgRNA:可同时对多个基因进行编辑;
(4)Cas9 + 上万个sgRNA:同时对上万个基因进行编辑。
针对第3、4种情况,这多个sgRNA的合集被称为CRISPR文库(CRISPR Library),文库的大小可从几十个sgRNA到十几万个sgRNA。
文库的出现使得我们可以同时对上万个基因进行编辑,再筛选出对某特定表型有明显作用的基因集,用于指导下一步研究,这一过程称为CRISPR screening,
举例如下图:
从上图中可以看出,CRISPR Library是包含sgRNA的pool(A-C),
并通过慢病毒转导的方式转入Cas9稳定表达或野生型细胞(D),pool sgRNA感染的细胞经过特定特征(耐药性等)区分后,通过NGS测序鉴定与特定特征相关的基因集。
除了常规流程的展现,我们还需要注意到构建pool library的工作量是相当大的,如张峰教授组的GeCKO v2 Library可针对19,050个编码基因,而为了提高编辑效率,每个基因都设计了至少6个sgRNA,因此整个library包含有123,411个sgRNA,每个sgRNA都要构建出相应质粒,整个library的构建花费不菲,而我们只需要用500美元即可从Addgene上购得,能够使用这样的工具,真得感谢这些巨人们。
CRISPR Library的类型也根据实验目的、物种、文库大小和投递方式分类,具体信息可以在Addgene网页上可以查看,还需要注意CRISPR Library不仅仅可以针对编码基因,对于非编码基因如LncRNA等也是有library的。
在设计CRISPR screening实验之前需要思考以下问题:
(1)CRISPR Library的扩增需要用电转的方法,并需要NGS测序来确定文库丰度,尽管目前已经有一些library可以选用化学感受态细胞进行扩增,但大部分还是需求使用电转感受态细胞;
(2)CRISPR screening实验需要大量的细胞,因此对于一些无法扩增、数量有限且非常珍贵的细胞、,如原代细胞等,CRISPR screening则可能不适用;
(3)大多数CRISPR文库需要使用慢病毒将gRNA/Cas9传递到目标细胞,需确认实验室能否操作慢病毒这样生物危害的实验。
使用者需充分考虑课题组的条件是否达到以上要求,一旦确定实验条件符合,
那么下一步就是library的选择,在选择文library时,也需要考虑以下几点:
(1)基因修饰的类型:敲除、激活还是抑制目标基因;
(2)gRNAs的数量:CRISPR Library可以针对整个基因组或某一类特定的基因,例如张峰组的GeCKO是针对基因组的,而最近报道的用于增强CRT T细胞在实体瘤中活性的TCR pool knockin CRISPR Library,只有36个目的基因;
(3)物种:特定的CRISPR Library中的gRNAs对于特定生物体的基因组是唯一的,并且文库只与来自该生物体的细胞兼容,例如人类的library只能用于人类细胞,小鼠则只能用于小鼠;
(4)library骨架:如骨架中已有Cas9,则直接使用即可;如骨架中无,需要搭配使用Cas9质粒或者要求细胞本身就表达Cas9,这将增加实验周期和难度。
大部分的CRISPR Library都需要使用慢病毒投递系统,一般人类library都类似这俩种骨架:LentiCRISPR和lentiGuide-Puro(如下图)等,区别在于前者的骨架中已带有Cas9,因此是一个质粒系统;而后者需要叠加使用一个Cas9质粒或者要求细胞本身就稳定表达Cas9。
在文章TSC1 and DEPDC5 regulate HIV-1 latency through the mTOR signaling pathway 中,
作者为探讨调控HIV病毒潜伏的关键基因,作者首先构建HIV的荧光报告细胞(HIV-1 proviral DNA+GFP),
当HIV病毒复制的时候,GFP也同时表达,因此可以通过绿色荧光来观测HIV病毒的活动情况。
在HIV-GFP报告细胞中,转入sgRNA library进行大规模基因敲除,一定时间后用FACS分选出强绿色荧光表达细胞,经过4个循环后则得到了低荧光(HIV潜伏)和高荧光(HIV活动)两组细胞,通过NGS测序发现两组细胞中的sgRNA丰度情况,经过3次重复后得到257个基因对HIV病毒活动有正向作用,最后通过数据分析筛选出TOP的gene集。后续可针对TOP基因集进行针对性的验证。
通过这个例子,我们还可以想象,把GFP细胞换成肿瘤药耐药细胞如厄洛替尼,将FACS分选换成给药+不给药两组,一定时间后检测两组细胞的sgRNA丰度差别,则可以找到厄洛替尼耐药相关的基因。
除了需要一个非常明显的可以作为区分的特征之外(即非常好的模型),例如荧光报告细胞、重要药物耐药等,还需要注意以下一些细节问题:
(1)需要注意骨架中的启动子是否适合自己的目的细胞,例如CMV启动子非常广谱,但对于人胚胎干细胞的效率则非常低,需要选用带有EF1α启动子的骨架。
(2)部分library要求细胞本身就表达Cas9,这本无可厚非,但部分细胞在高表达Cas9的情况下非常脆弱,这时候需要考虑使用inducible Cas9 system,而这个系统的构建本身就是有难度的实验,因此在设计可提前一定要做好全面分析。
(3)Library扩增工作量非常大,需要尽可能的严格按照protocol进行,并且配备质粒超大提试剂盒,部分Library要求使用特殊的感受态细胞,而该细胞只有国外出售并且非常昂贵(我们还不一定能买到)。
(4)由于Library非常庞大,慢病毒的包被也是大批量的,如果使用Lipo3000或者Roche的转染试剂则花费非常大,此时可以考虑使用PEI40000等便宜且效果又好的转染试剂。
(5)此外,慢病毒的包被需要选择状态好且代数低的293T细胞,如果有293FT细胞则效果更佳(关于293的选择,公众号有一篇专门阐述:团队作案HEK293,史上最强搬砖细胞)。
(6)考虑筛选标记的冲突,例如目的细胞是通过慢病毒转染的方法稳定表达Cas9,且筛选标记是puromycin,那么几乎所有的Library的抗性筛选基因都是puromycin,这就冲突了。
具体更多的细节还需要我们去发现。
https://mp.weixin.qq.com/s/OcJzZd4xSq3mK69Nf0HC0Q