外显率和表现度有什么区别？影响因素是哪些？

思纠 2023-06-08 发布于云南

展开全文

有任何疑问、批评及指导，请毫不犹豫地私信作者！

在所有罕见病中，大约72%(Nguengang Wakap et al.2020)是由遗传物质变异引起的，其中大多数是单基因疾病(Haendel et al.2020)。已知罕见的有害变异可引起人类数千种不同的遗传病，6000多种单基因病的分子基础已经被发现。有超过20万个致病变异被发现，但仍有大多数罕见病的遗传基础有待确定。

基因型-表型关系的研究变得更加广泛，因为确定基因型如何导致表型是理解疾病机制的基本步骤。单基因基因型可以高度预测特定的个体疾病，但有时这种关系可能很复杂，因为一些有害性的显性单基因变异不遵循预期的孟德尔遗传模式。相同基因型的个体可以表现出明显不同的临床表型，甚至无临床症状。目前，在理解个体基因组变异如何影响表型、遗传变异如何发挥其功能性影响从而导致疾病方面，仍存在差距。

人类遗传多样性显示出相当大的变异性，个体基因组与参考基因组的差异有410~500万个位点(Auton et al.2015)。虽然大多数变异是常见的，并且预测为良性，但每个个体平均有85个杂合性和35个纯合性蛋白截短变异(protein-truncating variants, PTVs) (Lek et al.2016)。人群队列研究表明，平均每个人的基因组有约200个非常罕见的变异(Gudmundsson et al.2021)、54个之前被报告为致病的变异，包括7.6个单基因病中的罕见非同义编码区域变异(Lek et al.2016;Walsh et al.2017)。

外显率(penetrance)

当研究基因型和表型之间的关系时，重要的是统计一组已知基因型中表型的发生率。外显率是一种量化“基因型-表型关系”的统计学指标，这个数值是通过观察我们知道基因型的人群计算出来的，即外显率是指在某种特定基因型的群体中，表现出相关性状的比例。外显率=(出现相关性状的某种特定基因型的个体数/某种特定基因型的总个体数)*100%。

事实上，测量外显率需要大量的人群研究，外显率的研究有助于我们预测一个性状在那些携带潜在等位基因的人身上显现的可能性。

外显不全(incomplete penetrance)

外显率等于100%时称为完全外显(complete penetrance)，低于100%时则为不完全外显(incomplete penetrance)或外显不全。每个疾病相关基因中，不同基因型可以有不同的疾病外显率，此外，外显率的计算还可以限定特定人群或特定年龄。虽然外显率是根据已知基因型中某一表型的出现情况进行统计计算的数值，但不完全外显率只是对一组已知基因型的定性描述。

在显性和隐性遗传病中均可观察到不完全外显。

通过多种机制，不完全外显和表达度的差异广泛存在，这可以解释为什么表面上未患病的父母可以将致病变异遗传给患病的后代，为什么看似健康的个体的基因组可以包含大量可能有害的变异，却未受到任何明显的不良影响。

外显率取决于三核苷酸重复次数

表现度(expressivity)

与外显不全常混淆的有一个概念是“表现度”，表现度是指具有特定基因型个体之间表现出相关性状的差异性，如每个疾病症状的严重程度、发病年龄的差异。(Individuals with the same genotype can also show different degrees of the same phenotype)

表现度是描述个体间性状表达差异的程度。与外显率不同，描述的是个体的变量，而不是基因型人群中的统计变量。

基因型与表型之间的关系并不简单。有时，显性等位基因可以被其他基因影响而减少表型的出现。在某些情况下，基因表达以细微的方式改变，却对表型产生很大影响。

如上表，已知这些基因的有害变异可引起一系列表型，从重度到轻度亚临床效应。

不完全外显和表现度的差异广泛存在于人类，这可以解释为什么表面上未患病的父母可以将致病变异体遗传给患病的后代，以及为什么看似健康的个体的基因组可以包含大量致病变异。

基于WES/WGS变异数据和患者表型数据有助于研究这些变异的外显率和表现度。

大型人群队列研究表明，致病变异体的发生率远高于之前通过小型临床或家族队列研究估计的数值。

不完全外显和不同表现度对临床医师提出了挑战，特别是当偶然发现某个未知的变异时，而之前没有任何文献报道，因此不确定其是否会导致临床表型。

临床与人群队列的外显率比较：在临床队列中发现的遗传变异的外显率往往高于人群队列，人群队列可能表现为较早发病、较轻的疾病或较大比例的受累个体。由于这两类队列的固有纳入标准偏倚，在未经选择的一般人群中，基因变异的外显率可能介于两者之间。

一般认为，罕见的致病变异是在有类似单基因疾病且表型丰富的的小型临床队列中较常发现。对于几乎所有的人类遗传性疾病，个体表型的变异性都受到基因组背景变异的影响。

基因多效性(pleiotropy)

基因多效性是指一个基因决定或影响多个性状的形成、多个生物学特性和功能。

在多效性中，同一基因的不同变异可能导致不同的、可能不相关的表型，这些表型甚至可能被归类为不同的疾病。

外显率、表达度、多效性是三个不同的概念，但在生物学上它们的总体效应往往重叠，尤其是在难以确定表型多样性的人群队列中。

外显率、表现度和多效性的概念表征。方框表示具有相同基因型的个体，阴影方框表示个体显示相关的表型，非阴影方框表示个体未显示相关的疾病表型。行一显示不完全外显，其中60%的个体显示相关表型。行二显示所有个体都表现出相关的表型，从严重的表现到较轻的表现。行三显示不完全外显率和表现度，其中基因型在表现的严重程度和在人群中的外显率方面均有差异。第4行显示了多效性，即不同的表型是由一个基因的变异体(由不同的形状表示)引起的

外显率和表现度的影响因素

(A)单基因致病变异总体外显率和表现度的不同生物机制的例子。(B)影响整个基因组外显率和表现度的因素：全基因组修饰因子、基因表达类型，基因变异类型。

基因变异类型

基因组变异可通过以下几种方式使个体易患疾病：破坏基因通路对表型产生巨大(单基因致病变异)，或通过不同基因通路，累积许多微小效应(多基因变异的累积效应)(Fahed et al，2020)，或者上述两者效应的组合。

在人群队列中，对于大多数疾病来说，单基因变异携带者的外显率估计平均为60%或更低(Goodrich et al, 2021)，这表明携带已知的具有高外显率的单基因致病变异的人从未出现相应的表型(Chen et al.，2016)。

70%的健康老年人队列(全部80岁以上，没有任何慢性病)均携带次要发现(ACMG指南列出的)中的一个杂合性有害基因变异(Erikson et al.， 2016)。同样，在APSREE试验研究中，75名健康老年人中有1名(1.3%)携带之前确定的致病变异(包括Lynch综合征和家族性高胆固醇血症基因)，但没有出现相关表型(Lacaze et al.，2020)。这些病例表明，携带这些致病变异并不一定会导致相关疾病，其他机制可能有助于保护人类健康。

更多内容👉那些被认为是“有害性”的基因变异，其外显率是多少？

对于遗传异质性单基因疾病，不同基因或变异之间的外显率和表现度可能不同，同一表型也可能由多个基因的多个不同变异引起。即使在同一基因内，某些有害变异也可能表现出完全外显，而一些有害变异则表现出不完全或低外显。例如，遗传性血管性水肿具有临床表型多样性，即使在同一个家族的成员之间也是如此，而且携带错义变异的个体通常比携带PTVs患者表现的症状较轻，且发病较晚(Speletas et al,. 2015)。相比之下，BMPR2基因的错义变异比同一基因的PTVs引起的肺动脉高压更早、更严重(Austin et al., 2009)。

致病性PTVs通常通过无义介导的衰变(NMD)降解RNA而导致功能丧失(LoF)导致疾病(Lu et al,. 2021)。NMD是一种mRNA监测通路，它识别并降解受损的mRNA转录本，这些异常的转录本会产生折叠错误或长度缩短的蛋白质，这些蛋白质可以在细胞中积累并启动内质网(endoplasmic reticulum, ER)应激反应(Haeri et al,. 2012)。异常蛋白的产生可以通过细胞中毒性蛋白的积累而加重疾病的严重程度(Nguyen et al,. 2014)，也可以通过提供剩余蛋白来减轻杂合子状态下的单倍剂量不足介导的疾病表型严重程度，这意味着NMD的发生会根据疾病的机制影响表型的严重程度。PTVs也可能通过异常剪接引起LoF (Cummings et al.， 2020)，这也受NMD调控。在某些情况下，包含致病变异基因的5′和3′端NMD边界的位置可以解释携带同一基因不同PTVs的个体之间的表型差异。

错义变异也可由于蛋白质功能或稳定性大幅降低而导致LoF (Høie et al,. 2022)。虽然许多错义变异的影响很小或没有影响，但它们可导致蛋白空间构象变化、蛋白质错误折叠增加、蛋白质转运异常，从而引起细胞内异常蛋白蓄积或滞留、内质网应激增加、未折叠蛋白反应激活或促凋亡信号传导和凋亡增加(van Moorsel et al,. 2021)。

一些错义变异、小的插入/缺失和基因重复可引起功能获得(gain of function, GoF)效应：如蛋白活性增加(Niday et al,. 2018)、蛋白质产量增加(Stefl et al,. 2013)或蛋白质产物获得新的有害功能(Li et al,. 2018)，同一基因内，一些GoF变异导致的临床表型可比LoF变异更严重。例如，相比LoF变异，KCNA2基因的GoF变异与更严重的癫痫表型相关(Syrbe et al,. 2015)。

变异所在基因中的位置可以影响疾病机制，例如变异是否位于翻译后修饰的位点、三级和四级结构的关键位点、蛋白-蛋白相互作用位点、配体结合位点，或功能域的内部和外部。例如，与位于氨基末端或配体结合结构域的GRIN2A基因错义变异相比，位于跨膜或连接结构域的错义变异与重度发育表型的关联更频繁(Liu et al,. 2021)，可观察到从正常到轻度癫痫，再到重度发育表型和癫痫性脑病(Strehlow et al,. 2019)。因此，了解蛋白质结构和相互作用域的功能有助于阐明特定变异对临床表型的影响。

有少数但报道数量不断增加的致病性非编码变异已被确定为单基因疾病的病因。这些变异可以通过LoF或GoF机制改变基因或异常转录本表达来发挥作用。例如，PTF1A基因增强子的双等位基因变异通过组织特异性LoF导致隐性胰腺发育不全。MEF2C基因的5 '非翻译区(UTR)的新发LoF变异可以解释约1/4与该基因相关的发育障碍(Wright et al.， 2021)。然而，要证明非编码区变异的致病性通常比编码区变异要困难得多，因此，对这些变异的外显率和表现度的研究可能滞后。

重复次数

重复扩展疾病(repeat expansion disorders)是由基因组短串联重复序列(short tandem Repeat, STR)扩增引起的，该扩增会影响基因表达或蛋白质序列(Paulson et al,. 2018)，其外显率和表现度受重复次数的影响。由于重复序列周围的分子不稳定性，在每一代的遗传过程中，重复长度都会增加，导致疾病发病更早，严重程度增加。目前仍缺乏有效证据表明遗传因素会导致发病年龄的差异。

基因表达

选择性等位基因(含有致病变异的)的差异表达可能影响具有相同基因型个体的表型特征，这种机制主要用于解释单倍剂量不足引起的显性遗传病。例如，Lynch综合征、肥厚型心肌病(hypertrophic cardiomyopathy, HCM) ，等位基因变异可能导致野生型等位基因的高表达，从而补偿单倍剂量不足，导致外显率降低，或者引起野生型等位基因的低表达，从而加剧单倍剂量不足，导致外显率升高。

在人类组织中，多达88%的基因有等位基因变异，可能由遗传修饰因子或随机因素引起(Aguet et al., 2017)，并且在小鼠模型中发现了组织特异性和全基因组的等位基因变异。结构变异，例如与致病性LoF变异形成反式位置的重复，可提供一个额外的野生型基因拷贝，从而使得基因表达正常水平，减轻由单倍剂量不足引起的临床表型，这个现象在DiGeorge综合征中能观察到(Servetti et al,. 2021)。

mRNA非翻译区中的变异可能影响翻译效率，而且不同组织之间的基因表达也可能有很大差异，这凸显出对疾病相关组织进行测序在解读遗传变异方面的重要性。

与同义变异相比，在许多组织中的，罕见的错义变异会使得等位基因表达显著降低，这与其预测的致病性成比例，这表明有害的变异会从高表达的单倍型中减少。例如，遗传异质性的单基因眼病表现出不完全外显和表现度差异，并且在整个人群中也表现出基因表达水平的显著性变异(Green et al.，2020)。

等位基因的差异表达也可能导致隐性遗传病以显性方式呈现。例如，Zellweger谱系障碍(zellweger spectrum disorder，ZSD)。ZSD是由13个PEX基因中的任何一个的有害变异引起的常染色体隐性遗传病，最常见的变异是PEX1基因或PEX6基因变异。杂合子携带者虽然没有第二个致病变异，但也表现为ZSD，与野生型相比，所有杂合子均表现出变异的等位基因过表达。在HCM中，变异等位基因产生的肌小节蛋白比例可随等位基因表达而变化，30%~80%的肌小节结构由功能降低的蛋白组成，导致总体的表型严重程度发生变化。

正常细胞和发育过程中的随机变异(stochastic variation)可能会被致病变异放大，因此在不完全外显和可变的表现度中发挥作用。随机单等位基因表达(random monoallelic expression, RME)仅一个等位基因转录，可以是组成型的，也可以是所有细胞都表达相同的等位基因(如印迹基因)，也可以是体细胞的，单个细胞的表达水平存在差异。细胞群体中RNA的总体水平趋于稳定，但通过RME的动态等位基因波动可以呈现出基因表达的差异性。RME少的基因大多是表达水平较高的管家基因。虽然疾病性状的差异性尚未明确与体细胞RME相关，但从概念上讲，它可以通过基因剂量的改变或变异等位基因的较高表达来解释临床表型的差异性。胚胎发育期间的RME与发育障碍有关(例如Holt-Oram综合征)。

模式生物研究表明，基因表达过程中的随机变异会影响变异基因型的表达。在秀丽隐杆线虫中，有20%的基因会导致具有明确遗传背景的两种不同分离株的表型变异(Vu et al., 2015)。在具有明确遗传背景的近交系小鼠和同卵双胞胎中也观察到表型的变异性，这表明随机分子事件对表现度差异的影响。

对于二倍体生物来说，每个基因有两个拷贝，一个来自父本，一个来自母本，这些成对的基因被称为等位基因(allele)，即位于一对同源染色体相同位置上控制同一性状不同形态的基因。英文原文为'allele' (由希腊文ο ένας τον άλλον 而来，代表each other的意思)。如果一个基因在遗传给子代的过程中，两个等位基因都表达，称为双等位基因表达(biallelic expression)；如果两个等位基因中的一个等位基因表达就称为单等位基因表达(monoallelic expression)，如印记基因(imprinted genes)，即仅一方亲本来源的等位基因表达,而来自另一亲本的不表达。研究发现在人类和鼠中，单等位基因的表达还具有是随机性，称为随机单等位基因表达(random monoallelic expression, RME)。

转录本变异

不同转录本的产生也可能导致性状的差异表达，这解释了为什么在人群队列中能发现单倍剂量不足基因的有害变异。基于单倍剂量不足基因的不同亚型的转录本注释信息，发现23%的LoF变异位于表达水平不足的外显子，并且与同义变异具有相似的表达效应。例如，巨大肌联蛋白LoF变异引起的单基因心肌病，未受影响的人群队列中发现的LoF变异主要发生在缺失的某个外显子的高表达转录本中，因此不会引起与有害变异相关的表型效应。类似的，TCF4基因的单倍剂量不足会导致高渗透的Pitt-Hopkins综合征，在未患病个体中发现的这个基因的PTVs均位于表达最低的外显子，这表明即使在这些有害性变异存在的情况下，也可以生成功能性蛋白。

组织特异性转录本的表达也可影响基因型的外显率，可能导致不同的疾病亚型。例如，CACNA1C基因与有两个临床表现亚型相关，可解释两种不同形式的Timothy综合征。在广泛表达的转录本中的致病变异会产生多系统疾病(1型)，而主要在心脏中表达的转录本的选择性外显子中的致病变异则罕见得多，会导致更严重的心脏特异性缺陷(2型)。

顺式和反式作用的遗传修饰因子

基因调控区域的变异可以通过改变基因表达和调节蛋白编码区的有害变异来影响疾病的表型，从而影响单基因变异的外显率和表现度。

顺式作用元件(cis-acting element)位于基因旁侧序列中能影响基因表达的DNA序列。顺式作用元件包括启动子、增强子、调控序列和可诱导元件等，它们的作用是参与基因表达的调控。顺式作用元件本身不编码任何蛋白质，仅仅提供一个作用位点，要与反式作用因子相互作用而起作用。而反式作用因子是与顺式作用序列结合从而影响基因表达的蛋白质或元件。这些非编码区中的变异可通过与这些元件或作用因子的相互作用而产生多种下游效应。

在分子遗传学领域，相对同一染色体或DNA分子而言为“顺式”（cis）；对不同染色体或DNA分子而言为“反式”（trans）。

转录因子结合或表达中的微小变化可导致调节失调，影响同一调节网络中的多个基因，从而可能改变最终的临床表现。已经发现顺式调节变异可改变编码区变异的外显率。在一般人群中，致病编码区变异会在具有顺式调节变异的高表达单倍型中减少，这提示有疾病表型的个体，顺式调节变异的数量增加，从而增强致病等位基因表达；而无症状的个体，“保护性”调节变异数量增加，从而降低致病等位基因表达和外显率。

上游开放阅读框(upstream open reading frames, uORFs)是在蛋白质编码基因的5'UTR区发现的一种组织特异性的蛋白质翻译顺式调节因子。多项研究表明，uROF可以通过多种调控机制降低对下游基因翻译的起始效率或引起mRNA降解对蛋白质的表达产生抑制的作用。uORFs可能会影响有害编码区变异对疾病表型效应。uORF的活性翻译可通过多种机制使下游蛋白水平降低多达80%，包括产生一种阻止翻译的核糖体的肽。因此，引入或移除uORF起始或终止密码子的变异可能影响临床表型，而且uORF变异也可能在疾病机制中发挥作用。

下游3'UTR区域的变异可通过改变mRNA的稳定性或翻译效率在基因表达调控中发挥作用。在不同人群队列中发现，已鉴定的多态性位点与疾病严重程度之间没有关联(Kolder et al,. 2015)，这提示在临床队列和一般人群研究中，试图识别罕见病的非编码区修饰因子的困难性。

在人类基因组中已发现约400,000个候选增强子区域，平均每个基因约有20个增强子。增强子区域内的非编码变异可能通过改变基因表达导致临床表型多样化。虽然识别影响疾病表型的非编码变异非常困难，但也有一些值得注意的例子。一项大型研究发现，RET基因内含子增强子中的一个SNP似乎增加了先天性巨结肠的外显率。在Stargardt病患者中，内含子变异可影响编码区变异的外显率，而深度内含子变异已被证明是ABCA4基因最常见的致病变异的主要顺式作用修饰因子。

基因通常通过拓扑相关结构域(topologically associated domains, TADs)与多个顺式调节元件作用。这些结构域会影响基因表达，并通过染色质的3D构象介导顺式和反式调节因子效应。因此，这些结构域的变异可影响基因型的外显率和表现度。虽然一些基因的表达已被证明不受TADs变化的影响，但新的TADs的产生与罕见的重复的致病性有关。TADs内部和之间的3D染色质结构改变可导致基因、增强子和沉默子的错配，影响基因表达的转录调控。TAD环(TAD loop)的变异可能对健康个体没有影响，但可影响携带单基因变异患者的疾病表现。

在顺式调节域中常见的遗传变异会影响基因的表达，并且已经发现罕见的变异会破坏顺式调节域的结构，两者都可能通过改变基因调控的上游机制，导致同一个编码区变异的临床表型差异。

影响转录因子结合的结构变异可导致功能性基因表达变化。如在EPHA4基因座中所见，与TAD边界重叠的缺失或重复可导致严重的肢体畸形，而整个基因座的缺失则不会，这可能与差异基因增强子有关。

体细胞嵌合

细胞分裂期间发生的合子后新生突变可导致细胞之间不同的体细胞变异，这就是体细胞嵌合。在嵌合体中，单基因疾病的严重程度通常低于组成性表达相同变异的个体，而且根据包含致病变异的细胞或组织，嵌合体可能导致无外显率或表达降低。体细胞嵌合体可能比通常检测到的更广泛常见，尤其是当只检测可能包含或不包含临床相关变异的单个组织样本时，尽管NGS可识别较低水平的嵌合性变异。

嵌合体细胞变异比生殖细胞系变异在人类疾病的真实多样性(比如具有致死性的变异)和变异范围等方面更具有代表性。嵌合体可以表现出与携带同一基因生殖细胞系变异的个体不同或较温和的表型。

嵌合变异也可能不完全外显。在原发性免疫缺陷的个体中，80%的嵌合体临床无症状，其余20%表现出部分临床症状。在人群中，染色体非整倍体嵌合已被证明是不完全外显的，与非嵌合基因型相比，具有45,X/46,XX嵌合的女性具有正常的生育寿命和出生率，且无心血管并发症。

携带嵌合性致病变异的未患病父母可将其基因型作为生殖细胞系变异传给后代，因此这一代中不完全外显的疾病或较轻的疾病可能会在下一代中引起完全外显的疾病。

体细胞嵌合还可以通过细胞逆转(降低表型的表达)来挽救个体免于疾病。例如，DOCK8双等位基因变异引起的免疫缺陷个体的几个细胞系中观察到体细胞逆转，包括纠正或移除生殖细胞系PTVs，以及通过基因重组减弱或移除一个等位基因的有害变异。这些体细胞逆转改善了总生存时间，但不能完全消除疾病表型。

表观遗传修饰

表观遗传修饰是在不改变DNA序列本身的情况下，改变基因表达的分子可遗传改变，包括DNA甲基化、组蛋白修饰、microRNA(miRNA)。

携带相同致病基因型个体之间的不完全外显和表现度差异可能存在表观遗传修饰。DNA甲基化在控制组织特异性基因表达、选择性剪接、预防选择性启动子的隐性转录起始、X染色体失活方面很重要，所有这些均已被证明影响疾病表型。表观遗传学可以弥补有害变异的存在，并经过几代分离而没有任何不良影响，直到表观遗传修饰不再具有功能。

然而，表观遗传学研究通常比遗传学研究更具挑战性，因为变异可能具有组织和时间特异性，因此更难阐明表观遗传机制是如何影响这些基因型的外显率。

表观遗传学变异可能影响单基因疾病外显率的另一种机制是通过miRNA，即调节基因表达的小的非编码RNA。一个miRNA可影响多个基因，而一个基因可受到多个miRNA的影响，这提示一个miRNA的变异可能会导致多个下游表型效应。遗传变异可导致miRNA的差异表达，而miRNA的变异可影响等位基因的表达，从而改变单基因疾病的外显率或表现度。例如，许多miRNA的表达可能影响遗传性乳腺癌和卵巢癌(HBOC)的外显率和表现度。不完全外显和依赖年龄的外显率在BRCA1和BRCA2致病变异的携带者中常见。

疾病模型阈值

疾病阈值模型：一些有害的单基因变异不需要任何遗传修饰因子就可单独引起疾病表型。而一些单基因变异可能不完全外显，只有当伴随其他遗传或非遗传因素，使其超过疾病表现的临床阈值时，才显示出疾病表型。在后一种情况下，个体可能具有相同的潜在致病变异，但根据其修饰因素的不同，其临床表型也不同。

临床疾病表型需要达到一个阈值才能表现出来，对于不同的疾病和不同的个体，遗传和其他因素在达到这一阈值方面的相对贡献可能不同。例如，Dravet综合征(DS)是由SCN1A基因的新发LoF变异引起的一种高外显率的儿童癫痫(Ding et al.， 2021)。虽然DS在家族内表现出相当大的临床异质性，并且严重程度可能与背景遗传变异相关，但目前尚无已知的修饰因子可影响主要的致病变异。仅LoF变异就足以使个体超过疾病阈值，而其他变异只能改变超过这个阈值的表型的严重程度。

在单基因变异就能超过疾病模型阈值而引发疾病表型的情况下，携带该基因或其他相关基因的多个PTVs会加重临床表型。例如，单基因多囊肾病，携带致病基因(PKD1和PKD2)的患者比携带只有一个PTV的患者，其病情要严重得多。已发现许多单基因致病变异体具有影响其相关临床表型严重程度的次要基因或位点。

第二个潜在的遗传变异位点影响的单基因疾病表型的例子

一些单基因致病变异可能耐受，不引起临床表型，并在未患病的一代中遗传而不被发现，直到它们在其他促发因素的情况下超过疾病阈值而表现出临床表型。例如，CNVs是神经发育障碍性疾病的重要遗传学病因。一些CNVs(如复发性16p12.1缺失)遗传自未患病的父母。在这种情况下，携带者如果再出现第二种变异，那么该CNVs则可引发临床症状，这种理论称为“二次打击(two-hit)”模型。同样，CNTNAP2和LRRC4C的有害变异不足以单独引起疾病，但共同联合作用可损害突触的发育，这提示存在双基因调控疾病表型机制。

多基因风险

基因型的外显率和表现度受整个基因组中许多常见遗传变异的累积影响。多基因是复杂性状遗传的一个因素。

全基因组关联性研究(genome-wide association studies, GWAS)发现了数百种疾病相关的数千个易感位点，这表明多基因背景既可以使个体易患疾病，也可以保护个体免受疾病的影响。

多基因背景可以量化为多基因风险评分(polygenic risk score, PRS)，并可作为单基因和多基因疾病总体风险预测的工具。PRS强调了影响单基因疾病严重程度的多基因成分的额外风险，多基因风险在单基因变异携带者和一般人群中共同存在。在一系列单基因疾病(包括多种家族性癌症综合征)中，PRS可有助于提高对致病变异外显率的临床解读能力。对于携带致病BRCA1或BRCA2变异的个体，乳腺癌的外显率估计值为45% ~ 85%，卵巢癌的外显率估计值为10% ~ 65%，其中一些可以用PRS解释。利用乳腺癌GWAS生成的PRS，单基因变异携带者在PRS十分位数的顶部和底部之间的风险差异超过10%。

与乳腺癌相关的多基因风险SNP变异位点，大多数是调控区内常见的非编码变异，其靶基因与其他已知的体细胞癌症驱动基因重叠。

多基因风险可对表型多样性产生重大影响，即使是携带已知的单基因变异的个体也是如此，这表明许多疾病的遗传结构可被视为一个谱系(spectrum)，而不是将其分为有临床症状和无症状两类。虽然在携带单基因变异的个体中，多基因对疾病表型的总体贡献可能较弱，但在预测总体外显率和风险分层方面，多基因对疾病表型的贡献是有用的。

遗传补偿效应

遗传补偿(genetic compensation)效应是实现生命系统稳健性的重要途径，即基因网络中的另一个或多个基因可以功能补偿LoF变异，据推测该现象在人类的不完全外显中发挥作用。相关基因或通路的上调或代偿等位基因的差异表达有助于抑制疾病表型，比如要么通过少量的代偿机制，要么改变整体基因表达。

基因的功能冗余和重组变异基因网络可影响相应表型的外显率和表现度，而单个致病变异的临床效应可受到全基因组变异的影响，这也解释了为什么某些个体可以耐受某些LoF变异。单倍剂量不足可以影响同一基因网络中其他基因的表达，以维持内环境稳态或抑制疾病表型。一个基因的功能缺失可通过功能冗余(functional redundancy)来补偿。研究发现，在一般人群队列中，与包含已知致病性PTVs的基因相比，包含大量pvs的基因属于较大的基因家族，因此不太可能引起不良表型

在一般人群队列研究中发现，有大量致病PTVs的基因，不太可能引起临床表型，这类基因属于较大的基因家族。这表明功能冗余是影响基因型外显率的一个机制。但需要进一步研究，寻找这一机制的有力证据。

NMD

无义介导的mRNA降解(nonsense-mediated mRNA decay，NMD）作为真核细胞中重要RNA监控机制，识别并降解开放阅读框中含有提前终止密码子（premature termination codon，PTC）的mRNA，以避免因截短的蛋白产物积累对细胞造成毒害。NMD还调控正常生理基因的表达，暗示其在真核细胞中扮演重要角。NMD途径的关键是PTC的识别。

NMD的效率在个体之间是不同的，NMD可作为潜在修饰因子，影响PTVs的外显率和表现度。密码子、基因、细胞和组织之间NMD效率的差异会影响疾病机制。在模式生物的研究中，导致较轻表型的变异等位基因是那些表现出更多NMD的变异等位基因，NMD效应减少与更严重的表型相关。在这种情况下，NMD可帮助触发补偿机制或者单倍剂量不足，以防止截短蛋白累积，产生更轻的临床表型。目前已发现，与调控NMD机制相关的基因变异与神经发育障碍性疾病和智力障碍综合征相关，如UPF、UPF3、EIF4A3、SMG8、、RNPS1等基因变异。NMD通路中的常见多态性可导致了NMD效率的差异，这有助于解释单倍剂量不足引起的疾病的表型差异，其严重程度与它们是否引发NMD相关。个体间NMD效率的差异具有改变遗传变异表现度的能力，可将引发疾病表型的机制从显性负效应转换为单倍剂量不足，或反之亦然。例如，携带相同的DMD基因PTV的两例患者可表现出不同的临床表型，1例为Duchenne型肌营养不良，另1例为较轻的Becker型肌营养不良；造成表型差异的原因认为是表型较轻的患者中有较弱的NMD效率，仍可产生部分功能性DMD蛋白。

家族史

家族史可被视为疾病表型的遗传和环境因素的综合效应，一个粗略但有效的替代指标。在单基因疾病中，变异的致病性和外显率只有通过对有多个患病个体的大家系的研究才能确定，但这可能使我们难以弄清不同修饰因子的相对作用。

众所周知，家族史是遗传性癌症综合征的主要危险因素，而患病亲属的数量增加了致病变异携带者患癌症的风险。目前在无家族史的个体中估算外显率的证据基础非常有限，但认为携带一种遗传性单基因疾病的致病变异的个人，而无家族史，其外显率可能低于有家族史的个体。

已有研究表明，与轻度临床表型或无症状的携带者父母相比，患严重临床表型的单基因神经发育障碍性疾病的个体还携带其他的有害遗传变异，而这些额外的遗传变异富集在脑内和神经发育通路相关的基因中。同样，22q11.2缺失综合征患儿的智商评分也表现出广泛的变异性，且与其直系亲属的评分高度相关。22q11.2缺失综合征个体的智商呈正态分布曲线，与一般人群相似，仅低30分。父母的智商和子代的智商之间存在显著关联，与智力相关的遗传变异可能减轻22q11.2缺失对临床表型的一些有害影响。智力的遗传度可受许多常见的微小变异的累积影响或由少数罕见的高效变异驱动。

类似地，携带16p11.2缺失的个体，其临床表型多样化，并且经常出现在“健康”的一般人群队列中，尽管这些患者都没有达到传统的临床诊断阈值水平，但也有一系列认知和神经精神障碍。在这些携带者中，临床表型的最佳总体预测指标是其亲代表型的平均值，个体则表现出与其家庭背景相关的临床表型效应。

年龄

如果没有指定年龄限定，可以认为外显率是一个几乎没有意义的概念，许多疾病直到晚年才表现出来。随着年龄的增长，整个基因组的基因表达和染色质结构发生变化，会增加疾病的外显率或表现度。例如，GRIN2A和GRIN2B这两个基因的表达水平不同，NMDA受体中两个蛋白质亚单位的相对比例会随着年龄的增长而改变，这两个基因可以改变这些基因中有害变异的临床表型；产前表达的GRIN2B与出生后的严重认知缺陷有关，而出生后表达的GRIN2A与儿童期癫痫和成人精神分裂症有关。年龄相关的外显率可以解释一些致病变异可以出现在无症状的个体中。外显率随年龄增长的典型例子，如癌症易感综合征，如Li-Fraumeni综合征、Lynch综合征等，这些疾病的外显率受随时间累积的DNA损伤影响。荟萃分析研究表明，BRCA1和BRCA2致病变异携带者到70岁时的乳腺癌累积风险分别为57%~ 65%和45%~49%。

认知表型的年龄依赖性外显见于异常蛋白缓慢累积引起的疾病，异常蛋白的变异可影响蛋白质累积的速率。例如，视网膜色素变性(RP)是由错误折叠的蛋白质滞留引起，这导致编码促凋亡机制的基因上调，并导致光感受器细胞凋亡，随着时间的推移累积损伤，最终达到疾病阈值并引起疾病。年龄依赖性外显也可通过神经元的逐渐丧失引起，当存活细胞数量下降到一定阈值以下或克服大脑可塑性时，引起相关的疾病表型。例如，DNMT1变异患者的进行性和迟发性神经系统表现可能源于DNA甲基化随时间推移的逐渐丧失，从而影响成人的神经形成。因此，早期识别有风险的个体有助于监测疾病进展并及时采取干预措施。

性别

性别可影响遗传病的外显率和表现度，最明显的是当有害的遗传变异发生在X染色体上时，半合子男性比杂合子女性临床表型更为严重。在多种疾病中，遗传变异的外显率因性别而异，但除了X染色体上的变异，性别依赖性外显率的作用机制大多未知。

基因表达存在性别差异，因此性别依赖性外显率差异也可能普遍存在。女性被诊断为神经发育障碍的可能性低于男性，被诊断为孤独症谱系障碍(ASD)的男性人数是女性的四倍，这表明可能存在一种女性保护作用，影响了此类疾病的外显。被诊断为ASD的女孩比被诊断为ASD的男孩可有更多数量的CNVs，并且与父亲相比，无症状的母亲(有ASD的孩子)可有更高的有害变异的遗传负担。当女性的临床表型更为严重时，女性的确诊频率与男性更接近，这提示由于性别间表型不同，临床确诊存在一些偏倚，携带相同常染色体变异的男性比女性更有可能接受基因检测，这一事实支持了这一偏倚。

环境

环境可以以消极和积极的方式影响疾病的外显率或表现度，其中包括饮食、药物、酒精摄入、体力活动、紫外线、子宫内暴露、教育和社会经济地位等许多因素。表观遗传因素在环境和基因表达之间提供了一种机制联系。对人类微生物组的研究也可以解释基因型-表型关联中的一些极端例子。然而，尽管基因-环境相互作用可能广泛存在，但往往很难证明，因为几乎不可能完整和系统地收集个人的环境，而且除了遗传数据之外，很少有详细的相关暴露数据。

晚发型单基因疾病的外显率也可能受到环境的影响，如包括结直肠癌在内的几种癌症综合征，在这些癌症综合征中，遗传变异与饮食变量和BMI相互作用。

癌症易感性也可通过基因-环境相互作用(如吸烟或晒伤)而改变，可加速肿瘤发生的体细胞变异的积累。暴露于香烟烟雾、空气污染和其他空气中毒素可引起未折叠或错误折叠蛋白质的积累，影响慢性肺疾病的外显率或表现度。携带有害单基因变异的个体也可能更容易受到某些环境影响，而这些环境暴露可影响表型的严重程度。例如，囊性纤维化的特征是肺部进行性损害，非遗传因素可解释高达50%的临床变异。吸烟、空气污染物、温度和高脂饮食等环境因素均已被证明会影响疾病的严重程度和进展。

环境因素也可影响原发性特应性疾病(通常被视为单基因变态反应性疾病)的疾病表现，其中饮食、上皮-环境界面的微生物组、感染的存在程度以及心理应激均可影响相关表型的外显率或表现度。

总结

不完全外显和表现度差异是正确解释遗传变异和诊断遗传病的一个重要问题。正确估计外显率和表现度具有挑战性，临床队列和人群研究都为外显率的量化提供参考。从机制上理解不完全外显和表现度差异是如何发生的，将有助于疾病诊断和预后监测、临床管理以及准确的遗传咨询。