Closed ixxmu closed 2 years ago
变异的有害性、致病性和ACMG分类
有几点容易混淆的地方,在此明确一下:
(2)变异的致病性。上述软件的预测结果,与ACMG(美国医学遗传学与基因组学学会,American College of Medical Genetics and Genomics)给出的变异致病性指南中的分类术语(包括良性、可能良性、意义不明确、可能致病、致病:Benign、 Likely Benign、uncertain significance、Likely Pathogenic、Pathogenic),是两个完全不同的分类系统。ACMG是序列变异临床解读的标准和指南,涵盖除了生信程序预测外,更多其它因素与证据(如下图),包括:人群变异频率,Case-Control突变频率的差异、果蝇反向遗传筛选等基因功能研究(链接)、家系表型-基因型的共分离和新发变异等。
文献中的相关方法与软件
1)关于SIFT、PolyPhen-2和CADD等生物信息学计算预测的研究方法,可参考下面这篇文章的描述:
Possible functional effect of the rare variants using in silico prediction tools.
2)上述程序只预测了变异的有害性,是定性的“影响”(Tolerated/Benign、Deleterious、Possibly damaging、Possibly damaging),研究更具体的问题(例如蛋白磷酸化、亲水性、GTP结合位点、表面电荷和三维结构的改变)需要使用其它软件:
PLOS Genetics | https://doi.org/10.1371/journal.pgen.1007394 July 12, 2018
NetPhos:预测突变对蛋白磷酸化位点的影响;
DictyOGlyc:预测突变对蛋白糖基化位点的影响;
SMART:预测蛋白有哪些结构域;
PSIPRED(纽普生物有在线工具):预测蛋白二级机构,如α-螺旋、β折叠;
SWISS-MODEL/Phyre2/AlphaFold:从头预测野生及突变蛋白三维结构(模型);
PyMOL/Chimera/POLYVIEW-2D:蛋白模型的可视化、结构比较。
PDB文件:PDB即protein data bank,一般把蛋白质的三维结构信息用pdb文件保存(后缀为.pdb),信息包括:作者,参考文献,结构(二硫键、螺旋、片层、活性位点等)说明;每一行信息称为一个记录(record),类型包括:标题、一级结构、杂因子、二级结构、连接注释、晶胞特征及坐标变换、原子坐标、连接信息、簿记。
下图PDB文件中,Residue表示氨基酸残基;Chain的A表示α螺旋,三维坐标系用于呈现三维结构。
PDB File Format - E-Learning@VIB
PyMOL软件:py代表python,即主要由python编译的开源软件(可运行于Windows系统,可含命令行);mol代表molecule,主要用于(大)分子结构可视化软件,可展示发表级的静态或动态分子结构图,可自定义颜色、风格、突出显示、电子密度、表面静电、在原PDB文件上自定义突变、两个蛋白的结构对比。PyMOL官方资料:https://pymolwiki.org/index.php/。
更下游的高级工具,如分子对接:主要研究分子间相互作用,并预测其结合模式和亲合力的一种理论模拟方法。例如:突变对蛋白复合物结构的影响;通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计,涉及分子之间的空间匹配和能量匹配。此后再谈,相关内容见:分子对接教程
蛋白质结构和功能的相关背景知识
Function | Example |
---|---|
多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,不涉及氨基酸残基侧链。主要形式包括α-螺旋、β-折叠、β-转角和无规卷曲,维持此些结构的主要作用力为氢键。
http://quizlet.com/13611888/ct-macromolecules-part-1-flash-cards
球状蛋白非常脆弱,可以通过加热、有机溶剂或强离子溶液等方式失活(变性);纤维蛋白帮助形成骨骼、软骨、肌腱(将肌肉固定在骨骼上)、韧带(将骨骼固定在其他骨骼上)和我们内脏器官周围的囊。
PyMOL的蛋白静电势图 vs 泊松-玻耳兹曼静电图
部分文献,例如基因突变与脑瘫发生风险(文献解读,Nature Genetic,2020),使用的是泊松-玻耳兹曼静电图:Poisson–Boltzmann electrostatic maps。但PyMOL默认使用的所谓蛋白接触电势图:(Vacuum Electrostatics)Protein contact potential (local)。二者有什么区别与联系?
以下内容来自PyMOL官方文档(https://pymolwiki.org/index.php/Protein_contact_potential)的解释:
蛋白质接触电位(Protein contact potential)可在PyMOL中自动表示,即在蛋白质上显示虚拟的(false)红/蓝电荷光滑表面。如下图(上):
APBS-generated potential
关于PyMOL内部“蛋白质接触电势”的经验法则(rule of thumb)是,如果关心它的工作原理,那么应该使用真正的泊松-玻耳兹曼静电解算器(Possion-Boltzman electrostatics solver),如APBS。
以实例介绍蛋白结构相关软件的使用
1. 首先从Biomart(Ensemble)下载基因、转录本(及长度)、与蛋白ID的各种转换(很重要):
Biomart给出的ID对应关系:
在PyMOL>处输入代码,回车:
bg_color white
将α螺旋(h)改为红色:
color red , ss h
将β折叠(s)改为蓝色:
color blue , ss s
将无规则卷曲(小写L)和其他结构(+以及一个双引号)改为黄色:
color yellow , ss l+"
接下来看一个经典的单一氨基酸取代后,导致疾病的案例:镰状细胞性贫血。该病是一种常染色体显性遗传血红蛋白病,因β-肽链第6位氨基酸谷氨酸被缬氨酸所代替,构成镰状血红蛋白,取代了正常血红蛋白。突变基因为HBB基因。
该病临床表现为慢性溶血性贫血、易感染和再发性疼痛危象引起慢性局部缺血从而导致器官组织损害。主要通过输血、药物治疗等方法进行治疗。纯合子患者预后较差,杂合子患者预后相对较好。2018年5月11日,国家卫生健康委员会等5部门联合制定了《第一批罕见病目录》,镰刀型细胞贫血病被收录其中。(葛均波,徐永健,王辰.内科学(第九版):人民卫生出版社,2018)
该疾病更具体的介绍及其机制:
撰写:宋红卫 校对:叶明皓
https://mp.weixin.qq.com/s/yqepdosnpYL45X2MFYWutA