随着大规模基因组测序的发展,科学家逐渐意识到基因变异与遗传疾病之间的关系比想象中更复杂。与单一高外显率基因导致的孟德尔病不同,许多复杂疾病表现出显著的表型异质性,同一变异在不同个体中可能引发不同程度或类型的症状。这种差异往往源于多个遗传因素的叠加,包括个体同时携带多个致病变异或受修饰变异影响,从而改变疾病表现。研究者提出了“multi-hit”模型,认为主要致病变异使个体对疾病敏感,而其他稀有或常见变异决定最终表型。然而,特定变异类别如何改变不同确定性和原发性变异的临床特征还不完全清楚。
近日,来自美国宾夕法尼亚州立大学的Santhosh Girirajan课题组在Cell上发表了研究论文Genetic modifiers and ascertainment drive variable expressivity of complex disorders。在本研究中,作者综合分析了数千名携带不同原始变异个体的表型与基因组数据,揭示变异与表型的关系取决于主要与次要变异的组合及取样背景。
以16p12.1缺失为代表的复发性拷贝数变异为研究这种可变外显性提供了理想模型。16p12.1 缺失已知常由父母遗传、表型可变,作者想弄清这类主要变异之上是否叠加了能放大或改变表型的次要变异,以及这类负荷在家系内如何累积。为此,作者在以发育迟缓(DD)患儿为主的家系(124 个家系、442 人)中系统整理表型(IQ、社会反应量表与多系统临床特征)与遗传信息,刻画 16p12.1 缺失携带者的临床谱系,并比较患儿与家属(携带/不携带)之间的差异。分析发现,相比携带缺失的父母,患儿表型更为严重,发育显著迟缓,其中约93%患儿为遗传性缺失。约三分之一患儿还带有可独立致病的变异,如已知致病的拷贝数变异(CNV)、功能缺失型变异(LoF)等。并且,患儿相较父母携带更多受约束基因的错义/LoF变异及更高的精神分裂症评分,三代家系显示变异负荷与表型严重度跨代递增。这些次要变异富集于脑表达、受进化约束、突触后致密区高表达基因,且在胎儿期前额皮层/海马表达偏高,与16p12.1区域基因在神经前体细胞中共表达模块显著相连。这些结果表明,16p12.1 缺失患儿的重症表型并非由单一变异解释,而是与家系内累积的多类次要变异共同作用,符合“multi-hit”模型。
作者推测16p12.1内各基因可能分属不同功能模块,那么不同个体携带的次要变异可能通过不同机制产生各异的临床表型。为了验证这个假设,他们用蛋白互作网络(STRING)与GO富集,追踪16p12.1基因到各患儿次要变异基因的最短路径,比较与16p11.2区域的连通性,并用回归模型把次要变异类别与具体表型域和定量性状对应起来。研究发现,16p12.1各基因之间(以及通往次要变异)共享连接很少,提示它们扰动彼此不同的功能通路。相比之下,16p11.2内基因互联更紧密。不同患儿蛋白互作网络中的关键连接点不同,即使表型相近的患儿,网络拓扑亦可不同。作者还总结出变异类别与表型特异性的关联,例如罕见编码变异与神经系统及生长/骨骼特征有关,LoF与头围减小相关,以及次要 CNV 提高发育缺陷综合评分等。这些结果表明,16p12.1区域的多元功能使其更易与次要变异发生互作,具体哪类次要变异被调动、通过哪条通路影响表型,是个体化且表型特异的。
最后,作者想要回答:同样一个致病缺失,为什么在不同人群(病人和普通人)中表现差别这么大?他们通过多个不同来源(队列)的样本比较,发现这些差异其实与样本筛选方式(ascertainment)和次要遗传变异(secondary variants)密切相关。不同队列差异显著,例如在UK Biobank人群中(主要是健康人群),16p12.1缺失者同时携带的稀有变异更少,说明要保持健康就得遗传负荷低,而在疾病队列(AoU、MyCode)中,他们额外携带更多稀有变异。同时,作者还将这一研究推广到其他主要变异中,他们发现有些规律是互通的,例如大多数次要变异效应依赖于主要变异类型。如果没有主要变异存在,次要变异几乎不表现出关联,说明它们需要主要变异这个触发点才能显现作用。总的来说,该研究通过分析数千名携带16p12.1缺失及其他主要遗传变异的个体,发现疾病表型的差异源于主要变异与多种次要变异之间的相互作用,并受到样本筛选方式的显著影响。研究揭示,主要变异为“first hit”增加疾病易感性,而次要变异和多基因风险则决定临床表现的类型与严重程度。这项工作阐明了复杂疾病中“multi-hit”模型的遗传机制,为理解可变外显性的分子基础提供了系统框架。

原文链接:https://doi.org/10.1016/j.cell.2025.09.012
