Closed ixxmu closed 1 year ago
高通量染色体构象捕获技术(High-throughput chromosome conformation capture,Hi-C)是一种用于研究基因组中染色体的三维结构分子生物学技术。它通过对DNA进行特殊的修饰和捕获,然后对修饰后的DNA进行测序,来确定基因组中不同区域之间的相互作用。这种技术可以帮助研究人员了解基因的功能和调控,以及在染色体中的不同位置的基因之间相互作用。
Hi-C技术的基本原理是通过对细胞内的染色体进行特殊的化学修饰,使得相邻的染色体片段之间的特殊碱基对在经过特殊条件下可以连接在一起。然后,将修饰后的染色体分解成较小的片段,并使用高通量测序技术来测定这些片段在染色体中出现的频率。根据这些信息,研究人员可以推断出染色体中基因之间的相对位置关系,并建立染色体构象图。
Hi-C技术可以用于研究多种生物学问题,包括基因调控、染色体组装和基因组结构的演化。已经成为分子生物学研究中的重要工具,在许多生物学领域都得到了广泛应用。
Hi-C最初是一种低分辨率、高噪声技术,构建100Mb大小的Hi-C库需要几天的时间,另外数据的输出和再现性都很低。然而,Hi-C数据为染色质构象以及基因组结构提供了新的见解,这些应用前景促使科学家在过去十年中持续努力改进这项技术。
在2012年至2015年期间,Hi-C方案进行了几次修改,如采用4-cutter分解或采用更深的测序深度以获得更高的分辨率。使用更频繁切割的限制性内切酶,或DNaseI和微球菌核酸酶也显著提高了该方法的分辨率。最近(2017年),Belaghzal等人报道了一种能够实现kb分辨率的Hi-C 2.0 protocol。关键改进是去除消化后的SDS增溶步骤,以保存核结构,并通过完整核内的连接来防止碎片染色质之间的随机连接,从而形成了原位Hi-C的基础。2021年,Lafontaine等人报道了Hi-C 3.0,通过与甲醛和戊二酸二丁二酰亚胺(DSG)的加强交联,实现了更高的分辨率。
迄今为止,已经出现了各种Hi-C的衍生技术,包括原位Hi-C、low Hi-C、SAFE Hi-C和Micro-C,这些技术与标准Hi-C有些许不同,但基本原理保持不变。
Hi-C技术的具体流程可能会有所不同,根据使用的测序平台和分析软件的不同,可能需要进行一些额外的步骤。
1、甲醛固定
先加入甲醛将基因组中参与染色质互作作用的蛋白质凝固。一般将活体样本在室温用 1-3%的甲醛处理 10-30min,但是此步骤会减少限制内切酶对DNA序列的消化效率,需要严格控制。
2、酶切序列
用限制性内切酶切割基因组,打断后的片段大小会影响测序分辨率,一般有两种酶可供选择:6bp 的限制性内切酶,4bp 的限制性内切酶。
3、末端修复
得到的片段具有平末端或粘性末端,然后将末端补平修复,加入生物素。
4、连接及解交联
使用 T4 DNA连接酶连接互作片段,形成环状。将连接DNA片段的蛋白质消化掉,得到交联片段。
5、序列打断
使用超声波或其他方式,再次打断片段。
6、上机测序
用磁珠将带生物素的捕获,制作文库,上机测序。
HiC的高通量数据也带来了生物学假设的多样性和复杂性,需要严格的计算和统计方法来解释这些数据集。Genome Biology上的综述Analysis methods for studying the 3D architecture of the genome总结了处理Hi-C 数据的计算工具。
目前比较成熟的数据分析流程大致包含6个步骤:
参考
https://mp.weixin.qq.com/s/U5Nx3Mhg2Z-ml9xCZWp8XQ