Closed ixxmu closed 9 months ago
Nature 文章截图(第一作者:黄树嘉,刘斯洋,黄铭曦和何健荣;通讯作者:邱琇和夏慧敏)
完整构建了广州出生队列(BIGCS)自然人群的基础遗传图谱;
从群体遗传学的角度,把南方中国人(主要是粤语人群)的遗传历史讲得更清楚了;
母婴性状 GWAS 研究以及年龄特异性遗传效应的发现;
实现母婴遗传效应分离的方法并建立跨代孟德尔随机化分析方法。
疾病是环境和基因互作的一个结局。基于大规模前瞻性的出生队列基因组研究将是一个好的策略,它是理解基因和环境如何互作从而影响人类健康的重要策略。但这样的研究在中国乃至整个亚洲都是稀缺的。
胎儿生长发育受到母体宫内环境和胎儿自身遗传的影响,但是,宫内环境和遗传效应对胎儿的生长发育到底起怎样的作用尚不清楚。
*目前 ilus 已经到了版本 2.0,除了 GATK 最佳实践之外还兼容了 Sentieon,并且可以进行 WES 或者其他捕获型测序策略的数据分析流程的构建。如果可能的话,我特别推荐你用 Sentieon。
第一,项目刚开始时,我也想将焦点集中在 GWAS 上,但我做了功效分析(Power analysis)之后,很快就意识到风险太大了,样本量不足,恐怕只能发现一些别人发现过的信息(而且还不一定可以看全)。初看我们有四千多个样本,似乎不少,但实际上如果要做 GWAS,母子需要分组,这样一来,母亲组和小孩组分别就都不到两千人了,结果会如何我没有信心。所以,最好是能有其他的突破口,这个时候人群的群体遗传研究就成了一个重要的选择,而且这恰好是南方中国人群,此前研究并没有很好覆盖到,那么做得好的话是有可能有新发现的,填补一些空白也将是有意义的。
第二,作为潮汕人,我其实非常好奇南方中国人的群体遗传特征,特别是广东省三个主要方言人群之间是否有什么有趣的特点。我们的随访数据也有很好的方言信息,刚好适合做这个事情。
图 6. ADMIXTURE
人体中排入肠道的各种胆汁酸 95% 以上是要被重吸收的。重吸收的胆汁酸经门静脉入肝,肝细胞再重新摄取,转化为结合型胆汁酸再次排入肠道,形成胆汁酸的肠肝循环(enterohepatic circulation)(图10),每天6-10次[4]。 图 10. 胆汁酸肠肝循环示意图。图源: https://www.mdpi.com/1422-0067/22/3/1397
值得一提的是这四个年龄特异的遗传效应位点,并不是靠肉眼看的,而是在关注到这个情况之后,通过两样本 t 检验(twosample-ttest) 把所有可能的位点过了一遍,最后才定位出来。而且我还分别对它们做了回归分析,才比较有把握地做出这个判断。
1. 母婴遗传效应分离和 PRS 计算
2. 跨代孟德尔随机分析方法
3. 年龄特异遗传学效应分析方法
4. 快速全基因组测序数据分析流程:ilus
5. 突变数据系列质控方法
5. 基于 DNA 测序数据拷贝数差异的性别判断算法:rx_identifier 和 X/A ratio test
6. 完整的 GWAS Power 和 MR Power 分析程序
7. 出生队列基因组学网站 Genomics API tools:GDBIGtools (用于 GDBIG 网站)
8. 突变位点连锁不平衡程度计算程序:Pairwise LD calculation(用于 GDBIG 网站)
9. 基因填补流程(用于 GDBIG 网站)
10. GWAS 荟萃分析流程(用于 GDBIG 网站)
*该项目已通过伦理审查,符合国家法律法规及伦理规范,并严格保护参与者隐私及数据安全,并通过中国科技部人类遗传资源管理办公室的批准。
https://mp.weixin.qq.com/s/kxMBXTXEV_OZyFpo01r_-A