ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
89 stars 24 forks source link

造血系统细胞分化过程的分子标记物图谱的构建 #325

Closed ixxmu closed 3 years ago

ixxmu commented 3 years ago

https://mp.weixin.qq.com/s/EZVIDsA7IX7-j84Okwv4sQ

github-actions[bot] commented 3 years ago

造血系统细胞分化过程的分子标记物图谱的构建 by 东林的扯淡小屋

项目名称

造血系统细胞分化过程的分子标记物图谱的构建

项目研究的目的和基本思路:

目的:在确定造血系统发育的上下游细胞的基础上,通过找到标记物分子来进行细胞分型,理论上只要选择的分子足够多,我们可以对机体的所有细胞进行分类。

思路:

1获取数据:通过pubmed等等数据库(http://www.ncbi.nlm.nih.gov/pubmed)查阅文献,以及利用已有的生物信息学数据库如GEO数据库(https://www.ncbi.nlm.nih.gov/gds/?term=)等等来找到差异表达基因作为marker(选择显著差异表达的前几十个marker),找到造血发育过程中上下游细胞的特异性表达分子,以特异性表达的分子作为细胞分类的依据。

2分析方法:利用相关的生物信息学分析软件进行分析,我们推荐使用一站式的功能注释软件funrich(http://www.funrich.org/)以及相关的R语言包biocondutor(www.bioconductor.org/).首先,将找到的所有差异表达基因做venn图,以找到几个类型的细胞差异表达基因/标记物分子的共同分子。然后,通过做热图,找到可能在细胞状态变化的过程中起到更重要作用的差异表达基因,作为细胞分型的依据。在这里,上调的和下调的基因可能都具有重要意义。在这个基础上,将得到的结果基因进行GO和KEGG通路功能分析,找到起到更大作用的通路,从而找到对细胞分型起到更大作用的marker。同时也可以构建PPI等等网络,通过找到具有更大的degree度的中心节点hub(基于巴拉巴西所述:生物网络具有幂律分布的特点,即少数中心节点具有更大的意义,如攻击这些节点可能造成网络的崩溃Barabási A: Network biology: understanding the cell's functional organization. Nature Reviews Genetics 2004, 5(2):101.),这些中心节点可能在细胞分型中具有重要的生物学意义。

接着,通过聚类分析(http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm),我们可以利用分子特征来构建如同进化树的细胞分化关系,类似于Waddington’s landscape多能性的不断下降,能够根据表达特征构建发育系谱树。

通过降维的技术如t-SNE(https://cran.r-project.org/web/packages/Rtsne/index.html)来将细胞分为更简单的细胞亚群,通过距离来发现其分化关系(如同能量最低化,假设细胞更可能分化为距离相近的细胞,即分子模式更加相近的细胞),聚类降维等等方法可以使得这些关系更加可视化,易于被我们人类理解。根据特异细胞的标志物进行降维分析,从而进行细胞分群,与已有细胞分型方法比较,看是否发现了新的亚群,并且可能校正以往分群方法

3预期结果:我们期望能找到一定数量的marker来作为鉴定特定种类细胞的一种高维数据,通过降维最后得到的低维数据就能代表该种细胞,从而做到用简单的低维数据代表的marker的复杂变化来表示一种类型的细胞的分化过程。在这个过程中,如果发现已有数据在这个连续变化的过程中有所缺失,可能预示着一种新型细胞的发现。根据不同发育阶段的特异表达基因,进行各种通路分析,判断发育过程中有哪些生物学通路的变化,可能会寻找发育某一阶段发挥重要作用的基因,并且进行体外验证能够得到确定的表型变化。



项目的前沿性、学术性及独特之处:

这是人类细胞图谱Human Cell Atlas的一个细小分支的实现,专注于造血系统造血干细胞-髓系和淋巴系干细胞-红细胞和T/B淋巴和吞噬细胞的分化全过程。

理想是做到如下图所示的对生殖干细胞分化过程的通路层次的理解:不同分化阶段的细胞伴随着一定的信号通路的变化,理论上能够找到最相关的成线性过程的信号通路。

这是人类细胞图谱Human Cell Atlas的一个细小分支的实现,专注于造血系统造血干细胞-髓系和淋巴系干细胞-红细胞和T/B淋巴和吞噬细胞的分化全过程。

理想是做到如下图所示的对生殖干细胞分化过程的通路层次的理解:不同分化阶段的细胞伴随着一定的信号通路的变化,理论上能够找到最相关的成线性过程的信号通路。

Reference:Chromatin and Single-Cell RNA-Seq Profiling Reveal Dynamic Signaling and Metabolic Transitions during Human Spermatogonial Stem Cell Development

创新点:我们希望利用算法如层次聚类以及t-SNE降维算法来构建新的细胞关系图谱,前者层次聚类的结果可能代表一定细胞分化关系,即根据表达特征构建发育系谱树;后者降维的结果可能就代表细胞分化的上下游关系(从干细胞到成体细胞)。理论上算法的计算结果能够与现实的基于生物学分型的结果构建一定的对应关系,但是我们希望能够发现原先错误分型的细胞,或者发现细胞分化缺失的环节。本质上是通过数据挖掘来发现生物学机制。而且我们希望把造血细胞的分化的全过程的每一种细胞都找到足够多的marker来表示,从而为后面的研究提供参考。更重要的是,我们希望能够通过算法来进行新的细胞分型,其结果能够验证已有的细胞分型的正确性,从而能够证明t-SNE降维算法在生物学机制发现的潜力,为将来其他算法的应用打下基础。



项目的应用价值和现实意义:

血液系统的分化是胚胎发育过程中至关重要的一环,通过对造血细胞分化的发生发展过程更加详细具体的分析,来理清血液系统更加详细具体的分化发生过程。希望能够对生命的基础单位细胞有更深的理解,从而能够更好地理解疾病,可能对疾病诊断,监控,预后判断和治疗有一定的启发。我们假设这些差异表达基因可能在细胞分化过程中起到更大的作用,通过生物信息学分析,可能能够找到优化的策略,能够提高干细胞分化为成体细胞的效率。

我们选择研究十分成熟的血液系统来做以上的生物信息学分析,其实并没有抱太大期望发现别人没有发现的东西,虽然理论上还是有很多机制没有弄清楚的,说不定算法能够发现这些缺失的部分。更重要的是,我们希望验证能够通过算法来挖掘一定的生物学机制的假设,为将来其他算法的应用打下基础。



项目已有研究成果:

进行先期文献调研,找到造血细胞的不同marker:

淋巴系细胞分化:HSC造血干细胞:c-myb,GATA2;T细胞祖细胞:ikaros; T细胞:rag1;NK细胞:TCL-1;B细胞:PAX5,E2A,igm;

髓系细胞分化:髓样祖细胞:SCL,C/EBP,spi1;红细胞:GATA1,hbbe3;巨核细胞:GATA1,NFE2;粒细胞:mmp9;单核细胞:C/EBP,lyz,;肥大细胞:GATA1;

Reference:Zebrafish as a model for leukemia and other hemotopoietic disorders



项目研究的未来工作安排(主要研究内容、进度安排及拟解决关键问题):

1,主要研究内容:足够数量的marker收集,进行高维数据分析以降维,得到一定的细胞分型,与已有的基于生物学分型的细胞进行比较,观察是否有一定的差异,可能可以对已有分型进行验证;在这个基础上找到的新的模式可能就对应于之前没有发现过的生物学机制

2进度安排:文献调研和数据库搜集数据。基础生物信息学分析。聚类和降维算法的使用,以及与已有细胞分型结果进行比较。得到预期结果后则开始撰写论文。在时间资金充足的情况下可以考虑进行生物学实验来验证。

3拟解决关键问题:通过降维的技术如t-SNE来发现细胞是否更可能分化为距离相近的细胞,即分子模式更加相近的细胞;验证是否能够通过算法来挖掘一定的生物学机制;在细胞分化过程中起到更大的作用的这些差异表达基因是否能够作为优化的策略,提高干细胞分化为成体细胞的效率。



预期成果形式和效益:

1找到各个阶段的造血细胞的特异性表达基因,更加可能作为流式分选,以及免疫荧光的标记物。

2寻找更好的细胞分化策略,提高分化效率,可能应用于组织工程。

3在理解造血系统血液细胞发生发展的全过程的基础上,我们可以进一步探究白血病等等血液系统疾病的发生发展过程,为找到可能的治疗靶点提供依据。

4为将来其他算法挖掘生物学机制提供依据,尤其是机器学习算法,可能发挥强大的模式识别能力。