表观遗传分析5 HI-C by 生信菜鸟团

表观遗传分析5 高通量染色体构象捕获技术（HI-C）

HI-C简介

高通量染色体构象捕获技术（High-throughput chromosome conformation capture，Hi-C）是一种用于研究基因组中染色体的三维结构分子生物学技术。它通过对DNA进行特殊的修饰和捕获，然后对修饰后的DNA进行测序，来确定基因组中不同区域之间的相互作用。这种技术可以帮助研究人员了解基因的功能和调控，以及在染色体中的不同位置的基因之间相互作用。

Hi-C技术的基本原理是通过对细胞内的染色体进行特殊的化学修饰，使得相邻的染色体片段之间的特殊碱基对在经过特殊条件下可以连接在一起。然后，将修饰后的染色体分解成较小的片段，并使用高通量测序技术来测定这些片段在染色体中出现的频率。根据这些信息，研究人员可以推断出染色体中基因之间的相对位置关系，并建立染色体构象图。

Hi-C技术可以用于研究多种生物学问题，包括基因调控、染色体组装和基因组结构的演化。已经成为分子生物学研究中的重要工具，在许多生物学领域都得到了广泛应用。

HI-C历史

Hi-C最初是一种低分辨率、高噪声技术，构建100Mb大小的Hi-C库需要几天的时间，另外数据的输出和再现性都很低。然而，Hi-C数据为染色质构象以及基因组结构提供了新的见解，这些应用前景促使科学家在过去十年中持续努力改进这项技术。

在2012年至2015年期间，Hi-C方案进行了几次修改，如采用4-cutter分解或采用更深的测序深度以获得更高的分辨率。使用更频繁切割的限制性内切酶，或DNaseI和微球菌核酸酶也显著提高了该方法的分辨率。最近(2017年)，Belaghzal等人报道了一种能够实现kb分辨率的Hi-C 2.0 protocol。关键改进是去除消化后的SDS增溶步骤，以保存核结构，并通过完整核内的连接来防止碎片染色质之间的随机连接，从而形成了原位Hi-C的基础。2021年，Lafontaine等人报道了Hi-C 3.0，通过与甲醛和戊二酸二丁二酰亚胺(DSG)的加强交联，实现了更高的分辨率。

迄今为止，已经出现了各种Hi-C的衍生技术，包括原位Hi-C、low Hi-C、SAFE Hi-C和Micro-C，这些技术与标准Hi-C有些许不同，但基本原理保持不变。

Hi-C技术流程

收集样本：首先，需要收集需要进行Hi-C测序的生物样本，通常是细胞或组织。
分离DNA：需要从样本中分离出DNA。这可以通过使用化学试剂将细胞中的核酸溶解出来，或者使用机械方法将组织中的DNA提取出来。
制备Hi-C文库：需要将分离出的DNA进行特殊的化学反应，使其形成特定的DNA双螺旋结构，这是Hi-C测序的关键步骤。
测序：最后，使用大规模基因组测序平台测序Hi-C文库中的DNA片段。
分析数据：接下来，使用计算机分析测序数据，确定基因的相对位置和调控关系。

Hi-C技术的具体流程可能会有所不同，根据使用的测序平台和分析软件的不同，可能需要进行一些额外的步骤。

制备Hi-C文库

1、甲醛固定

先加入甲醛将基因组中参与染色质互作作用的蛋白质凝固。一般将活体样本在室温用 1-3%的甲醛处理 10-30min，但是此步骤会减少限制内切酶对DNA序列的消化效率，需要严格控制。

2、酶切序列

用限制性内切酶切割基因组，打断后的片段大小会影响测序分辨率，一般有两种酶可供选择：6bp 的限制性内切酶，4bp 的限制性内切酶。

3、末端修复

得到的片段具有平末端或粘性末端，然后将末端补平修复，加入生物素。

4、连接及解交联

使用 T4 DNA连接酶连接互作片段，形成环状。将连接DNA片段的蛋白质消化掉，得到交联片段。

5、序列打断

使用超声波或其他方式，再次打断片段。

6、上机测序

用磁珠将带生物素的捕获，制作文库，上机测序。

数据分析流程

HiC的高通量数据也带来了生物学假设的多样性和复杂性，需要严格的计算和统计方法来解释这些数据集。Genome Biology上的综述Analysis methods for studying the 3D architecture of the genome总结了处理Hi-C 数据的计算工具。

目前比较成熟的数据分析流程大致包含6个步骤：

前期raw reads过滤
序列比对
定位酶切位点。比对寻找到reads pairs在基因组物理位置之后，通过插入片段大小的限制搜索reads pairs两端每条read所对应的最近的酶切片段。酶切片段的位置代表了DNA交互产生的大致位置。
筛选出有效的比对片段(配对的reads位于酶切位点两端且mapped的方向相反)
整合DNA 片段交互强度
DNA片段交互矩阵标准化

参考

Jin, Fulai; Li, Yan; Dixon, Jesse R.; Selvaraj, Siddarth; Ye, Zhen; Lee, Ah Young; Yen, Chia-An; Schmitt, Anthony D.; Espinoza, Celso; Ren, Bing (14 November 2013). "A high-resolution map of three-dimensional chromatin interactome in human cells". Nature. 503 (7475): 290–294. 2013Natur.503..290J. doi:10.1038/nature12644.
Dixon, JR; Selvaraj, S; Yue, F; Kim, A; Li, Y; Shen, Y; Hu, M; Liu, JS; Ren, B (11 April 2012). "Topological domains in mammalian genomes identified by analysis of chromatin interactions". Nature. 485 (7398): 376–80. 2012Natur.485..376D. doi:10.1038/nature11082.
Sexton, Tom; Yaffe, Eitan; Kenigsberg, Ephraim; Bantignies, Frédéric; Leblanc, Benjamin; Hoichman, Michael; Parrinello, Hugues; Tanay, Amos; Cavalli, Giacomo (3 February 2012). "Three-Dimensional Folding and Functional Organization Principles of the Drosophila Genome". Cell. 148 (3): 458–472. doi:10.1016/j.cell.2012.01.010. ISSN 0092-8674.
Dixon, Jesse R.; Jung, Inkyung; Selvaraj, Siddarth; Shen, Yin; Antosiewicz-Bourget, Jessica E.; Lee, Ah Young; Ye, Zhen; Kim, Audrey; Rajagopal, Nisha; Xie, Wei; Diao, Yarui; Liang, Jing; Zhao, Huimin; Lobanenkov, Victor V.; Ecker, Joseph R.; Thomson, James A.; Ren, Bing (February 2015). "Chromatin architecture reorganization during stem cell differentiation". Nature. 518 (7539): 331–336. Bibcode:2015Natur.518..331D. doi:10.1038/nature14222.
Ay F, Noble WS. Analysis methods for studying the 3D architecture of the genome. Genome Biol. 2015 Sep 2;16:183. doi: 10.1186/s13059-015-0745-7. PMID:26328929; PMCID: PMC4556012.

ixxmu / mp_duty

表观遗传分析5 HI-C #3022