【原】Brain：教育程度、结构性脑储备和阿尔茨海默病：一项孟德尔随机化分析

思影科技 2024-10-21 发布于重庆

展开全文

较高的教育程度与较低的阿尔茨海默病风险存在观察性关联。然而，这种关联背后的生物学机制尚不清楚。教育对阿尔茨海默病的保护作用可能是通过增加大脑储备来介导的。我们使用双样本孟德尔随机化方法探讨了教育程度、以 MRI 表型为代表的结构性大脑储备和阿尔茨海默病之间潜在的因果关系。

我们从全基因组关联研究中获得了教育程度 (n = 1,131,881)、迟发性阿尔茨海默病（35,274 例病例，59,163 例对照）和 15 项源于结构性或弥散性 MRI 的灰质或白质宏观或微观结构测量指标 (nmax = 33,211) 的汇总统计数据。我们进行了单变量孟德尔随机化分析，以研究： (i) 教育程度和阿尔茨海默病；(ii) 教育程度和影像学表型；以及 (iii) 影像学表型和阿尔茨海默病之间的双向关联。多变量孟德尔随机化方法用于评估大脑结构表型是否介导了教育对阿尔茨海默病风险的影响。

遗传预测的教育程度与阿尔茨海默病呈负相关（遗传预测受教育年限每增加一个标准差，比值比 = 0.70，95% 置信区间 0.60, 0.80）。遗传预测的教育程度与四项皮质指标呈正相关[影像学表型每增加一个标准差，遗传预测受教育年限的变化（标准差单位）：表面积 0.30（95% 置信区间 0.20, 0.40）；体积 0.29（95% 置信区间 0.20, 0.37）；内在曲率增加0.18（95%置信区间为0.11至0.25）；局部脑回指数增加0.21（95%置信区间为0.11至0.31）；并与皮层细胞内体积分数呈负相关[-0.09（95%置信区间为-0.15至-0.03）]，以及白质高信号体积减少[-0.14（95%置信区间为-0.23至-0.05）]。通过基因代理的表面积、皮层体积和内在曲率水平与教育程度呈正相关（相应基因预测的影像表型每增加一个标准差，受教育年数的标准差单位变化分别为：0.13（95%置信区间为0.10至0.16）；0.15（95%置信区间为0.11至0.19）和0.12（95%置信区间为0.04至0.19））。我们未发现基因预测的影像衍生表型与阿尔茨海默病之间的关联。在多变量分析中，调整影像衍生表型后，基因预测的教育程度与阿尔茨海默病的负相关性并未减弱。

我们的结果支持教育程度对阿尔茨海默病风险的保护性因果效应，以及教育与大脑宏观和微观结构之间潜在的双向因果关系。然而，我们没有发现这些结构性标志物会影响阿尔茨海默病风险的证据。教育对阿尔茨海默病的保护作用可能是通过本研究未包括的其他大脑储备指标或通过其他机制介导的。本文发表在Brain杂志。

关键词：孟德尔随机化，阿尔茨海默病，大脑储备，教育程度，MRI

主题：表型，磁共振成像，阿尔茨海默病，教育状况，脑，影像诊断，认知储备，孟德尔随机化分析

引言

尽管大量的观察性流行病学证据支持教育是阿尔茨海默病的保护因素，但这种关联背后的生物学机制尚未得到充分证实。教育程度 (EA) 预防阿尔茨海默病风险的一个潜在机制是通过增加或维持个体潜在的“大脑储备”。大脑储备是指大脑解剖和结构特征的个体差异，使一些个体即使存在神经病理学也能保持其认知和功能状态。阿尔茨海默病中淀粉样蛋白-β和tau蛋白病理的进展与大脑的几种结构改变有关，包括进行性皮质变薄、皮质和皮质下区域广泛的灰质萎缩以及白质束完整性和组织的损伤。许多这些结构特征可以通过体内结构性或弥散性MRI进行测量，因此，它们在病前的水平可以作为大脑储备能力结构基础的有用指标。与大脑储备假说一致，对认知完整的较老年人的观察性神经影像学研究提供了证据，证明教育与几种与阿尔茨海默病相关的脑宏观和微观结构的MRI测量指标之间存在关联。例如，较高的教育水平与全脑和局部灰质体积增加、皮质厚度增加以及海马和杏仁核中易受阿尔茨海默病病理影响的亚区域表面积的增加有关。对于教育水平与认知正常老年人白质微观结构之间的关联，也有类似的发现；受教育程度更高的个体在几个具有阿尔茨海默病特征性病变的脑区显示出白质纤维束完整性的增加。

鉴于观察到的教育与大脑储备结构标志物之间的关联，可以假设大脑结构的变化可能通过决定个体潜在的大脑储备来介导教育对阿尔茨海默病风险的保护作用。然而，将这些观察性关联解释为教育、大脑结构和阿尔茨海默病风险之间存在因果关系的证据依赖于几个无法检验且可能不合理的假设，包括不存在残留和/或未测量的混杂因素和反向因果关系。例如，教育与大脑结构指标的关联可能会被生命早期因素混淆，这些因素是教育程度和大脑结构的共同预测因素，例如儿童社会经济地位、出生体重、儿童认知能力和孕期母亲吸烟。混杂因素也可能影响MRI结构性大脑储备标志物与阿尔茨海默病风险之间的关系。阿尔茨海默病和其他痴呆症的几个已知风险因素（例如吸烟、高血压、糖尿病、过量饮酒和缺乏运动）已被证明与社区居民大脑宏观和微观结构的各个方面有关。因此，可能是这些因素，而不是病前结构性大脑健康状况不佳，导致了阿尔茨海默病风险的增加。此外，即使观察到的关联反映了因果关系，因果关系的方向（即从暴露到结果，反之亦然）也无法使用观察方法明确确定。例如，教育与大脑结构之间的观察性关联可能是由于较长的教育时间导致大脑结构指标发生变化，或者具有较好结构性大脑健康状况（例如较大的脑容量或皮质厚度）的个体寻求较长的教育时间（或两者兼而有之）的结果。反向因果关系也可能影响MRI大脑储备标志物与阿尔茨海默病之间的关联。具体而言，虽然更大的结构性大脑储备（以MRI指标为代表）可以预防神经病理学进展和阿尔茨海默病诊断风险，但也可能这些结构标志物的变化是对临床前阿尔茨海默病的反应（例如痴呆临床表现之前脑容量或皮质厚度减少）。

孟德尔随机化（MR）是一种评估教育、大脑结构和阿尔茨海默病之间假定因果关系的有用方法，因为它克服了经典流行病学研究中的常见限制，如混杂因素和反向因果关系。通过使用与假定暴露直接相关的遗传变异作为工具变量，MR可以推断暴露对结果的因果效应。由于等位基因在受孕时的随机分配，与特定暴露相关的遗传变异的分布基本上独立于传统观察性分析中可能混淆暴露和结果关联的因素。因此，孟德尔随机化的估计值受环境混杂因素的影响较小，比经典流行病学研究更能可靠地揭示风险因素与疾病结果之间的因果关系。

此外，个人的基因型在受孕时已确定，且不会被后续的疾病结果改变，因此因果关系的方向始终是从遗传变异到目标性状，消除了反向因果的可能性。因此，孟德尔随机化在回顾性环境（如病例对照研究）中特别有用，即使遗传变异是在疾病结果发生后测量的，也能获得可靠的因果推断。例如，虽然无法可靠地测量阿尔茨海默病患者的MRI结构性大脑储备标志物（因为疾病可能扭曲测量结果），但与大脑结构相关的遗传变异不会被疾病事件改变，因此可作为阿尔茨海默病患者发病前大脑结构的可靠指标。

近年来，越来越多的孟德尔随机化研究发现了遗传预测的教育程度与阿尔茨海默病风险呈负相关的证据。然而，教育保护作用背后的机制仍相对未被探索。基因分型和多模态神经影像技术的最新进展促进了大规模前瞻性队列研究中这些数据的收集，从而能够使用比以前更大的样本量发现与大脑结构相关的遗传变异。本研究旨在扩展以前的工作，通过使用孟德尔随机化来研究教育程度、MRI 测量的大脑结构和阿尔茨海默病风险之间的假定因果关系。此外，我们旨在探讨是否有任何证据支持大脑结构改变位于从教育到阿尔茨海默病的因果路径上的假设（即大脑储备假说）。我们使用源于结构性或弥散性 MRI 的灰质和白质宏观和微观结构的影像学生物标志物来代表结构性大脑储备（有关这些影像学表型的描述和选择，请参见“方法”）。我们的主要目标是：

(i) 使用最新的全基因组关联研究 (GWAS) 数据，重复之前的孟德尔随机化发现，以支持教育程度对阿尔茨海默病风险的保护性因果效应；

(ii) 评估教育程度是否对大脑宏观和/或微观结构有因果效应；

(iii) 评估大脑宏观和/或微观结构表型是否会对阿尔茨海默病风险产生因果影响；

(iv) 使用多变量孟德尔随机化（单变量孟德尔随机化的扩展，可用于研究中介关系）评估教育程度对阿尔茨海默病风险的保护作用是否通过大脑宏观和/或微观结构的变化来介导。图 1 展示了本研究中探讨的假定因果效应的有向无环图。尽管我们的主要假设是之前陈述的以及图 1 所示的方向，但我们测试了每对变量之间双向的因果效应（即双向或互惠孟德尔随机化），因为这是一种确定两个变量之间因果效应方向（如果有的话）的有用方法。

图1 有向无环图（DAG）展示了本研究中考察的假定因果关系。源自影像的脑结构测量被探索为教育年限（EA（教育程度），暴露）对阿尔茨海默病（AD，结果）影响的潜在中介。

GX 表示 EA 的工具变量集合。GM 表示源自脑影像的表型1,..., N 的工具变量集合。参数 a 表示 EA 对源自影像的表型1,..., N 的直接因果效应。参数 b 表示源自影像的表型1,..., N 对阿尔茨海默病的直接因果效应。参数 c' 表示 EA 对阿尔茨海默病的直接因果效应。参数 a 和 c' 使用变异集合 GX 进行估计，参数 b 使用变异集合 GM 进行估计。图中省略了混杂变量。

材料和方法

数据来源

本研究基于两样本孟德尔随机化分析策略，这是孟德尔随机化的一种扩展，其中遗传工具对暴露和结果的影响是从两个独立的数据集中获得的。为了最大限度地减少由于人群分层造成的混杂可能性，所有数据来源均限于欧洲血统的个体。用于获取每种表型汇总统计数据的GWAS列于表1。补充材料中提供了数据来源的详细描述。

表1：用于获取MR分析汇总统计数据的数据来源

所有遗传关联估计值均来自对合并的发现和复制队列进行的全基因组关联研究 (GWAS)。请注意，某些表型的暴露和结果数据集的样本量存在差异。这是因为，对于一个或多个荟萃分析队列（例如 23andMe），完整变异集的汇总统计数据未公开，或者最终全基因组显著变异列表所基于的完整复制分析仅在早期发现阶段达到预先指定显著性阈值的变异子集上进行。在这种情况下，所有将表型作为暴露的分析均基于最大分析样本的全基因组显著变异（以最大限度地提高选择工具的效力）。在将表型作为结果的分析中，汇总统计数据来自为完整变异集提供关联估计值的数据集。

通过 Lee 等人对约 110 万人的 GWAS 荟萃分析获得了与受教育程度 (EA) 的汇总级遗传关联估计值。EA （受教育程度）定义为至少 30 岁时完成的受教育年限 (YOS)。阿尔茨海默病的遗传变异关联估计值来自国际阿尔茨海默病基因组学项目进行的临床上诊断的迟发性阿尔茨海默病（发病年龄 > 65 岁）的最大可用 GWAS 荟萃分析。基于英国生物银行2020 年初发布的组合遗传和多模式脑成像数据，从三个独立的数据源获得了成像衍生表型的汇总统计数据。尽管可以从英国生物银行 MRI 数据生成数千个成像衍生表型，但许多表型高度相关，并且对所有成像衍生表型的分析可能会导致虚假结果或在控制多重比较方面面临挑战。我们的策略是专注于 15 个成像衍生表型（图 2 和补充材料），其中大多数反映了先前显示与 EA （受教育程度）和/或阿尔茨海默病在表型上相关的全脑测量值。我们还选择研究白质高信号的总体积，作为与年龄相关的认知能力下降密切相关的指标，因此是结构性大脑健康的一个假定标志物。补充材料中提供了对选择成像衍生表型的基本原理的更详细解释。为了生成与全脑皮质宏观结构（表面积、体积、皮质厚度、内在曲率、平均曲率、局部脑回指数）和微观结构表型（平均扩散率、分数各向异性、细胞内体积分数和方向分散指数）的遗传变异关联估计值，我们使用最新的英国生物银行数据版本进行了内部 GWAS （补充材料）。白质微结构表型的遗传变异关联估计值来自 Zhao 等人最近发表的关于弥散 MRI 数据的 GWAS。在本研究中，我们使用了全局分数各向异性和平均扩散率表型的汇总统计数据，这些数据是跨 21 个预定义的大脑白质束进行平均的。对于海马体积和白质高信号的总体积，我们从 Smith 等人最近发表的关于 3913 个成像衍生表型的 GWAS 中获得了遗传变异关联估计值。皮质宏观/微观结构和白质微观结构表型未针对颅内容积 (ICV) 或总脑容量进行校正，因为这些都是全局测量值，并且与全脑容量高度相关。但是，对于局部表型（海马体积和白质高信号的总体积），我们使用了针对 ICV 校正的遗传关联估计值。所有遗传关联估计值均来自对合并的发现和复制队列进行的 GWAS。

本研究调查的脑成像衍生表型的概述。结构性大脑储备由 15 个脑成像衍生表型代表。这些包括：10 个全局皮质表型（6 个源自 T1 加权结构 MRI 的宏观结构指标和 4 个源自弥散 MRI 的微观结构指标）、2 个白质微观结构表型（在全脑 21 个主要白质束处测量）、双侧海马体积和脑中白质高信号的总体积（源自 T2 加权 MRI）。

图 2：本研究调查的脑成像衍生表型的概述。结构性大脑储备由 15 个脑成像衍生表型代表。（描述同上）

选择遗传工具和数据协调

对于每个孟德尔随机化（MR）分析，我们选择了所有在全基因组显著性阈值（P < 5 × 10^−8）下与感兴趣的暴露相关的单核苷酸多态性（SNP）作为工具变量。然后，使用连锁不平衡（LD）阈值 r² < 0.001，跨越10,000千碱基对范围，对所得的工具变量进行修剪，以实现近乎独立性。

我们使用了1000基因组计划参考数据集中欧洲超级人群的LD（连锁不平衡）参考面板，该面板仅限于次等位基因频率大于0.01的二等位SNP。我们从每个暴露和结果的全基因组关联研究（GWAS）中提取了以下汇总级别数据：SNP的rs编号、效应等位基因和其他等位基因、效应等位基因频率、样本量、病例/对照数量（如适用）、标准化的β系数、标准误和P值。

当某个工具SNP在结果数据集中不可用时，我们使用LDlink在与目标SNP具有连锁不平衡（r² > 0.8）的SNP中识别一个替代SNP。然后，我们对暴露和结果的GWAS数据集进行了协调，以确保遗传变异的关联估计对应于相同等位基因的效应。我们使用等位基因频率信息来推断暴露和结果GWAS中等位基因的方向。具有次等位基因频率大于0.42的回文SNP被从分析中剔除。

每个孟德尔随机化分析中用作工具的SNP的详细信息（包括在结果数据集中不可用的SNP的替代SNP）可在补充材料中获得。对于每个分析，我们使用了Burgess的在线功效计算器来估计在多重检验校正的显著性阈值下，我们有80%功效可检测到的最小因果效应（详见后面的“多重检验校正”部分）。功效计算结果列于补充表1。

统计分析

双向单变量孟德尔随机化

我们进行了单变量MR分析，以估计以下每个总因果效应：（i）EA（教育程度）对阿尔茨海默病的影响；（ii）EA对15种成像衍生表型的每一种的影响；以及（iii）成像衍生表型对阿尔茨海默病的影响。为了检验关联方向并调查反向因果关系的可能性，我们还以与最初假设相反的方向估计了每个因果效应（即双向孟德尔随机化（MR））。根据Burgess等人的建议，我们使用具有乘法随机效应的逆方差加权(IVW) MR （孟德尔随机化）作为主要分析方法，因为它提供了变异特异性比率估计的最有效组合，并解释了从单个变异获得的因果估计的异质性。

多重测试校正

为了考虑为检验教育对大脑结构和大脑结构对阿尔茨海默病的双向影响而进行的MR（孟德尔随机化）分析的数量，我们应用了Lord等人描述的多重测试校正方法。考虑到所考虑的各种MRI指标之间的相关结构，应用简单的Bonferroni校正可能过于保守。因此，我们使用主成分分析方法（https://github.com/hagax8/independent_tests）从成像衍生表型之间的平方表型相关矩阵（补充材料和补充图1）估计检验的独立假设的数量。我们首先计算了在矩阵中解释99.5%方差的主成分数量为n = 13。然后将平方相关矩阵中的单个检验数量计算为T = (n × n - n)/2 (=78)，并使用T的平方根(=8.83)来确定最终要校正的单个成像衍生表型的数量。因此，EA（教育程度）与成像衍生表型之间以及成像衍生表型与阿尔茨海默病之间的双向关联在多重测试校正阈值P < 0.006 (=0.05/8.83)下被认为是显著的。为了检验EA与阿尔茨海默病之间的双向因果关系，我们将统计显著性设为P < 0.05。

请注意，多重测试校正的目的是控制每个目标(i)-(iv)内的家族错误率，而不是控制执行的单变量MR（孟德尔随机化）分析总数(即62)的家族错误率。如果我们对全局零假设（即所有感兴趣的零假设的交集假设）感兴趣，那么控制所有62个检验的家族错误率将是合适的。鉴于每个感兴趣的目标都是不同的（即我们有兴趣检测教育与阿尔茨海默病、教育与大脑结构以及大脑结构与阿尔茨海默病之间的假定因果关系），我们将多重测试校正应用于每个目标内的假设数量。

敏感性分析

对于使用IVW（逆方差加权）方法检测到因果效应的每个单变量MR分析，我们使用以下四种方法来评估该发现对潜在违反MR假设的稳健性：污染混合法、加权中位数MR、MR-Egger 和MR多效性残差和异常值(MR-PRESSO)方法。选择了这四种稳健的方法，因为它们在不同的假设下都能对暴露对结果的因果效应进行有效估计（补充材料中描述了每种方法的假设）。

除了稳健的MR方法外，在使用IVW（逆方差加权）方法检测到因果效应的情况下，我们还进行了一系列其他敏感性分析。首先，我们使用Cochran的Q统计量评估了变异特异性因果估计值之间的异质性。其次，我们生成了变异特异性因果估计值的精确度与其估计值本身的漏斗图。漏斗图预计关于IVW（逆方差加权）估计值是对称的，更精确的估计值具有更小的变异性。漏斗图中存在不对称性表明存在方向性多效性和总体因果估计值中的偏差。第三，我们进行了留一法敏感性分析，以识别每个暴露工具中的影响数据点，并评估因果效应估计值对单个遗传变异的依赖性。最后，为了确定暴露和结果之间因果关系的方向，我们使用了Steiger方向性检验，它是两样本MR的扩展，可以检测与结果的关联强于与暴露关联的变异。如果有来自Steiger检验的证据表明某些遗传工具与结果的关联更强，则我们重复分析，但不包括这些变异。

在审查过程中，我们使用最近发表的关于整个生命周期中大脑结构纵向变化的GWAS的汇总统计数据进行了额外的敏感性分析（详见补充材料和补充表7）。

多变量孟德尔随机化检验中介作用

我们进行了多变量孟德尔随机化（MR）分析，以研究脑结构在教育程度（EA）和阿尔茨海默病之间关系中的潜在中介作用。多变量MR允许将与主要暴露和次要暴露（中介）相关的遗传变异作为工具变量纳入分析，并可用于将暴露对结果的总因果效应分解为通过中介的间接效应，以及暴露对结果的非通过中介的直接效应（即通过其他因果途径或其他中介；补充材料和补充图2）。单变量MR估计暴露对结果的总因果效应，而多变量MR估计暴露对结果的直接效应，同时调整中介因素。然后，可以通过从总效应中减去直接效应来估计暴露对结果的间接（中介）效应。这与传统的基于非工具变量回归的中介方法中使用的系数差异法大致相同。

使用这种方法，我们估计了EA（教育程度）对阿尔茨海默病风险的直接因果效应，同时依次调整了15个影像衍生表型中的每一个。EA对阿尔茨海默病的总因果效应估计值（来自单变量MR）与直接因果效应估计值（来自包含影像衍生表型的多变量MR模型）之间的差异表明该脑结构表型在教育到阿尔茨海默病的因果路径上的中介作用。对于每个多变量MR（孟德尔随机化）分析，我们选择了所有与主要暴露（EA，教育程度）或中介（感兴趣的影像衍生表型）相关的SNP作为工具变量。基于与这两个性状中任何一个相关的最低P值，将合并的SNP集合 clumped （基于LD的SNP筛选）到成对连锁不平衡（LD）（r2 < 0.001），范围超过10,000千碱基对。从阿尔茨海默病GWAS中提取汇总水平数据、协调暴露和结果数据集以及识别缺失SNP的代理，遵循与之前描述的单变量MR相同的程序。

所有统计分析均在R软件中进行。我们使用“TwoSampleMR”包（v.0.5.6）进行数据提取和协调，“ieugwasr”包进行clumping（基于LD的SNP筛选，即去除连锁不平衡的SNPs。），以及“LDlink”包（v.1.1.2.9）提取LD（连锁不平衡）代理。所有MR分析均使用“MendelianRandomization”（v.0.5.1）和“MRPRESSO”（v.1.0）包进行。

结果

遗传预测的教育程度与阿尔茨海默病风险呈负相关

在所有MR方法中，遗传预测的EA与阿尔茨海默病之间存在强烈的负相关证据（图3和补充图3）。主要IVW（逆方差加权）分析的结果表明，遗传预测的受教育年限（YOS）（约4.2年）每增加一个标准差，阿尔茨海默病的几率降低30%（OR = 0.70，95% CI 0.60，0.80）。加权中位数和MR-PRESSO方法提供的估计值与IVW分析相似，而在污染混合物和MR-Egger分析中观察到更大的负估计值（图3）。

图3.MR估计遗传预测的EA（教育程度）与阿尔茨海默病之间关联的图。估计值代表晚发性阿尔茨海默病的比值比（95% CI），遗传预测的YOS（受教育年限）（约4.2年）每增加1个标准差。

Cochran 的 Q 统计量没有提供证据表明变异特异性因果估计值的异质性比偶然预期更大（补充表 2）。使用 MR-Egger 截距检验没有发现定向多效性的证据（补充表 3），漏斗图中没有偏离对称性的证据（补充图 4），留一图中也没有失真（补充图 5）。Steiger 方向性检验表明，332 个与教育相关的 SNP 中有 24 个 (7%) 解释了阿尔茨海默病的变异比 EA 中的变异更多。当这些变异从分析中排除时，仍然有强有力的证据表明遗传预测的教育与阿尔茨海默病呈负相关 (ORIVW = 0.72, 95% CI 0.62, 0.83；补充表 4)。

在相反的方向上，正如预期的那样，遗传预测的阿尔茨海默病与受教育年限之间没有关联。IVW （逆方差加权）估计值（代表阿尔茨海默病几率每增加一倍，YOS（受教育年限）的标准差变化）为 0.00（95% CI 0.00, 0.01，P = 0.145）。

遗传预测的教育程度与大脑结构的关联

在校正多重检验后，遗传预测的 EA （教育程度（与四项皮质宏观结构测量指标呈正相关（图 4 和补充图 6）。在 IVW（逆方差加权）分析中，遗传预测的 YOS （受教育年限）每增加一个标准差，表面积增加 0.30 个标准差（95% CI 0.20, 0.40），皮质体积增加 0.29 个标准差（95% CI 0.20, 0.37），内在曲率增加 0.18 个标准差（95% CI 0.11, 0.25），局部脑回指数增加 0.21 个标准差（95% CI 0.11, 0.31）。此外，观察到与细胞内体积分数 (βIVW = −0.09, 95% CI −0.15, −0.03) 和白质高信号总量 (βIVW = −0.14, 95% CI −0.23, −0.05) 呈负相关。多效性稳健方法的结果与 IVW （逆方差加权）分析基本一致（补充图 6）。对于局部脑回指数、细胞内体积分数和白质高信号体积，MR-Egger 估计值周围的置信区间包括零值。然而，点估计值仍然在同一方向，所有其他稳健方法都与 IVW（逆方差加权）分析一致。

图 4 EA 和脑影像衍生表型之间双向关联的 MR 估计值

左：遗传预测的 EA（教育程度）与影像衍生的脑结构表型之间关联的 IVW MR（逆方差加权孟德尔随机化）估计值。估计值代表遗传预测的 YOS（约 4.2 年）每增加 1 个标准差，影像表型的标准差变化。

右：遗传预测的脑结构表型与 EA 之间关联的 IVW MR 估计值。估计值代表每个影像衍生表型的遗传预测水平每增加 1 个标准差，YOS（受教育年限）的标准差变化。标有星号的估计值在校正多重检验后具有显著性。SNP 列代表独立性和数据协调后剩余的 SNP 数量。LD 修剪后，FA（皮质）表型没有显著的 clumps（基因组上位置相近的SNPs组）。

CT = 皮质厚度；FA = 分数各向异性；HC = 海马体；IC = 内在曲率；ICVF = 细胞内体积分数；LGI = 局部脑回指数；MC = 平均曲率；MD = 平均扩散率；ODI = 定向离散指数；SA = 表面积；Vol = 体积；WM = 白质；WMH = 白质高信号。

所有分析都表明变异特异性因果估计值存在显著的异质性证据（补充表 2）。皮质表面积的漏斗图显示略微偏离对称性，但所有其他漏斗图都关于 IVW 估计值对称（补充图 7-12）。MR-Egger 截距检验在任何分析中均未显示定向多效性的证据（补充表 3），并且在任何留一图中均未出现失真（补充图 13-18）。解释影像表型变异比 EA 更多的与教育相关的 SNP 的比例范围从细胞内体积分数的 14% 到白质高信号体积的 30%（补充表 4）。在从每次分析中排除无效变异的敏感性分析中，所有估计值都向零值衰减，并且与局部脑回指数和白质高信号体积的关联不再具有统计学意义（补充表 4）。

遗传预测的大脑结构与教育程度的关联

在校正多重检验后，三种皮质宏观结构表型（表面积、体积和内在曲率）的遗传预测水平与教育程度呈正相关（图 4 和补充图 19）。IVW （逆方差加权）估计值表示影像衍生表型的遗传预测水平每增加 1 个标准差，YOS（标准差单位）的变化，表面积为 0.13（95% CI 0.10, 0.16），体积为 0.15（95% CI 0.11, 0.19），内在曲率为 0.12（95% CI 0.04, 0.19）。对于皮质表面积和体积，所有稳健方法都提供了与 IVW 分析相似的估计值，但 MR-Egger 估计值周围的置信区间比其他方法宽得多，并且包含零值（补充图 19）。遗传预测的内在曲率与教育程度之间关联的 MR-Egger 估计值为负值，而该关联的所有其他估计值均为正值。然而，MR-Egger 估计值的置信区间仍然与所有其他点估计值重叠（补充图 19）。

使用 Cochran 的 Q 统计量，我们发现所有三项分析中都存在异质性的证据（补充表 2）。然而，漏斗图几乎没有显示出偏离对称性的证据（补充图 20-22），并且 MR-Egger 截距项在任何分析中均与零无显著差异（补充表 3）。在留一敏感性分析中，排除任何变异后，总体 IVW 估计值没有变化（补充图 23-25）。Steiger 方向性检验在任何分析中均未识别出比影像表型解释更多教育程度变异的 SNP（补充表 4）。

遗传预测的阿尔茨海默病与大脑结构的关联

使用主要的 IVW 分析方法，我们没有发现遗传预测的任何影像衍生表型水平与阿尔茨海默病之间存在关联的证据（图 5）。然而，遗传预测的阿尔茨海默病与四项大脑结构测量指标相关（图 5 和补充图 26），即皮质定向离散指数降低 [βIVW = −0.02（遗传预测的阿尔茨海默病几率每增加一倍的标准差单位），95% CI −0.03, −0.01]，白质平均扩散率增加 (βIVW = 0.02, 95% CI 0.01, 0.04) 以及两个半球的海马体体积减少（左半球：βIVW = −0.02, 95% CI −0.03, −0.01；右半球：βIVW = −0.02, 95% CI −0.04, −0.01）。对于左右海马体体积，所有稳健方法都提供了与 IVW 分析相似的估计值（补充图 26）。对于定向离散指数，污染混合估计值的 95% 置信区间包含零值，但点估计值与其他方法相同（补充图 26）。污染混合法和 MR-PRESSO 法都表明遗传预测的阿尔茨海默病与白质平均扩散率之间存在零关联（补充图 26）。

图5 脑影像衍生表型与阿尔茨海默病之间双向关联的 MR 估计值

左：遗传预测的影像衍生表型与阿尔茨海默病之间关联的 IVW MR 估计值。估计值代表每个影像衍生表型的遗传预测水平每增加 1 个标准差，晚发性阿尔茨海默病的几率。

右：遗传预测的阿尔茨海默病与大脑结构表型之间关联的 IVW MR 估计值。估计值代表遗传预测的晚发性阿尔茨海默病几率每增加一倍（增加 2 倍），每个影像衍生表型的平均变化（标准差单位）。标有星号的估计值在校正多重检验后具有显著性。SNP 列代表独立性和数据协调后剩余的 SNP 数量。LD 修剪后，FA（皮质）表型没有显著的 clumps。

CT = 皮质厚度；FA = 分数各向异性；HC = 海马体；IC = 内在曲率；ICVF = 细胞内体积分数；LGI = 局部脑回指数；MC = 平均曲率；MD = 平均扩散率；ODI = 定向离散指数；SA = 表面积；Vol = 体积；WM = 白质；WMH = 白质高信号。
我们发现了遗传预测的阿尔茨海默病与白质平均扩散率之间关联的变异特异性因果估计值存在异质性的证据（补充表 2）。此外，使用 MR-Egger 截距检验，在此分析中发现了潜在的水平多效性的证据（补充表 3）。漏斗图几乎没有显示出偏离对称性的证据（补充图 27-30）。在留一敏感性分析中，遗传预测的阿尔茨海默病与所有四种影像衍生表型之间的关联似乎完全由一个遗传变异 (rs12721046) 驱动。在每种情况下，从分析中排除该变异都会使 IVW 估计值趋向于零值（补充图 31）。为了进一步研究 IVW 估计值对该变异的依赖性，我们进行了事后单 SNP MR 分析，并使用森林图将结果可视化（补充图 32）。尽管 rs12721046 变异对任何影像衍生表型都没有离群的 MR 估计值，但其估计值的精度异常高，导致该变异在每种情况下都主导了更广泛的多基因信号（补充图 32）。在 Steiger 过滤敏感性分析中，所有工具都解释了阿尔茨海默病的变异比影像表型的变异更多（补充表 4）。

中介分析

在多变量 MR （孟德尔随机化）分析中，在调整了 15 种影像衍生表型的遗传预测水平后，遗传预测的 YOS （受教育年限）与阿尔茨海默病之间的关联几乎没有变化（表 2）。

表2 MR（孟德尔随机化）估计的遗传预测的教育程度与阿尔茨海默病风险之间的关联，在未调整和调整了遗传预测的脑影像衍生表型水平后进行估计。

每增加1个标准差的遗传预测受教育年限（约4.2年），阿尔茨海默病的比值比 (95% 置信区间) 估计如下：未进行调整（单变量IVW（逆方差加权）分析）和依次调整了每个遗传预测的脑影像衍生表型水平后（多变量IVW分析）。

讨论

我们使用大型全基因组关联数据集进行了双向单变量和多变量孟德尔随机化 (MR) 分析，以检验通过 MRI 测量的教育程度、大脑宏观和微观结构与阿尔茨海默病风险之间可能的因果关系。我们发现了强有力的证据支持教育程度对阿尔茨海默病风险的保护性因果效应，但没有证据表明存在反向因果效应。还有证据表明教育程度与皮质宏观和微观结构的几项指标之间存在双向因果关系。然而，我们没有发现任何证据支持本研究中检测的大脑结构表型对阿尔茨海默病风险的因果效应。此外，也没有证据表明教育程度对阿尔茨海默病风险的保护作用是通过改变这些结构标记来介导的。在相反的方向上，我们发现了遗传预测的阿尔茨海默病与海马体体积以及皮质和白质微观结构之间存在关联的证据。然而，这些效应似乎完全由 APOC1 基因区域中的一个变异驱动，因此可能代表该变异的水平多效性效应，而不是阿尔茨海默病对大脑结构的因果效应。

我们关于教育对阿尔茨海默病风险的保护性因果效应的发现与大量的观察性流行病学文献一致。在目前的研究中，IVW （逆方差加权孟德尔随机化）估计表明，每增加 4.2 年的受教育年限，阿尔茨海默病的几率就会降低约 30%。这种效应大小与剂量反应荟萃分析的结果基本一致，在该分析中，每增加一年的受教育年限，与全因痴呆的风险降低 7% 相关。我们的结果也与之前的 MR 证据一致，这些证据支持教育对阿尔茨海默病风险的因果保护作用。来自最近三项多变量 MR 研究的证据表明，教育程度对阿尔茨海默病的保护作用主要是通过其对后期智力的影响来介导的，而不是受教育年限的独立保护作用。教育程度和智力在表型和遗传上是相关的，尽管这两种性状的遗传预测因子之间存在一定程度的不重叠，但我们注意到，在我们的分析中用于代表教育程度的工具不太可能只与受教育年限相关。因此，本研究的结果可能并没有狭隘地告诉我们童年和青春期在正规教育中花费的时间，而是一种更广泛地反映教育程度（以及某种程度上，智力）的替代指标。我们将教育程度作为感兴趣的暴露因素，因为它是一个潜在的可改变因素，并且被认为是“迄今为止发现的用于提高智力水平的最一致、最稳健和最持久的方法”。事实上，一项对准实验研究的大型荟萃分析估计，每增加一年的教育与智商分数增加约 1-5 个标准点相关，这一结果在整个生命周期和广泛的认知能力类别中是一致的。如果像之前的多变量 MR 证据表明的那样，智力位于从教育到阿尔茨海默病的因果路径上，那么即使更高教育程度的保护作用完全由智力水平的提高所介导，增加受教育年限仍然可以成为降低阿尔茨海默病发病率的有效公共卫生策略。一项准实验研究的结果表明，1972 年英国提高离校年龄导致智商的提高以及一系列健康和福祉结果的改善，包括降低糖尿病和全因死亡率的风险。我们的结果表明，针对义务教育年限的教育政策改革也可能对人群水平的阿尔茨海默病的初级预防有效。

我们发现了教育程度与三个皮质形态的全局宏观结构标记（即体积、表面积和内在曲率）之间存在双向因果关系的证据。这些发现与现有的关于教育程度与大脑形态之间关联的观察性神经影像学文献以及教育程度与皮质宏观结构的 MRI 标记之间存在正遗传相关性的证据一致。为了研究这些关联中的因果方向，我们使用 Steiger 过滤进行了敏感性分析，其中我们排除了任何在结果中解释的变异多于在暴露中解释的变异的 SNP。尽管在去除这些 SNP 后，所有分析中的效应大小都减弱了，但所有因果效应估计值仍然具有统计学意义。我们注意到，当双向 MR （孟德尔随机化）分析表明两个方向都存在因果效应时，很难确定这些是否真正代表相互因果关系，或者可能反映了共同的病因，即在两种分析中用作工具变量的遗传变异预测了两种性状的共同原因。因此，虽然我们所有的敏感性分析都表明教育程度与这些宏观结构标记之间存在明显的双向因果效应，但也可能存在共同病因的解释。我们还发现了教育程度对局部脑回指数和白质高信号总体积的因果效应的证据。然而，当我们去除在结果中解释的变异多于在暴露中解释的变异的变异时，这些效应不再具有统计学意义，这表明它们可能可以用反向因果关系或水平多效性来解释。由于白质高信号主要出现在老年人中，因此在这种情况下反向因果关系不太可能，与教育程度的关联可能反映了水平多效性。

观察到的教育程度（EA）对这些宏观结构指标的因果效应可能源于教育对儿童/青少年神经发育的有益影响，以及/或其对成年/老年神经退化的保护作用。由于我们使用了在中老年期横断面测量的大脑结构的全基因组关联分析（GWAS），我们无法在本研究中区分这两种假设。然而，有几项观察性研究试图区分教育对神经发育和神经退化的影响。例如，最近一项研究通过检查发育期和成年期队列中EA与总灰质体积和颅内体积（ICV）的关联来探讨这个问题。灰质体积在整个生命周期中表现出显著变化，在儿童早期随着皮质表面扩张而大幅增加，并在成年期随着皮质厚度和皮质下体积的减少而减少。另一方面，ICV（颅内体积）一直增加到青春期中后期，之后几乎没有观察到任何变化，因此可以作为最大神经解剖体积的指标。如果教育与儿童/青少年时期大脑成熟增强相关，我们预期受教育年限与ICV密切相关。然而，如果教育对衰老具有神经保护作用，我们预期在控制ICV后，更高的EA与成年/老年期灰质体积之间存在特定关联。该研究发现，在发育期和成年期，教育与ICV之间都存在一致的正相关关系，但没有证据表明教育与老年队列中ICV校正后的灰质体积相关，这表明教育的主要发育作用是在生命早期建立的，而不是对衰老神经退化的保护作用。这一发现也与最近关于教育与成年和老年期认知/大脑衰老率之间关联的观察性证据相符。例如，一项对超过2000名个体的纵向神经影像学研究发现，没有证据表明教育水平与易萎缩皮质区域或海马体积损失的纵向速率之间存在关联。同样，最近一项审查EA对认知衰老影响的研究得出结论，虽然有强有力的证据表明教育与认知功能水平之间存在正相关关系，但教育与衰老相关的认知衰老速率之间的关联可以忽略不计。总的来说，这些发现更符合这样的说法：教育对大脑结构和认知功能的影响主要是在儿童/青少年时期神经发育过程中建立的，并且很大程度上保留到老年，而不是基于对认知/大脑衰老的神经保护作用。换句话说，EA较高的个体在认知/大脑储备方面可能具有初始优势，这种优势会持续到成年/老年期。正是这种优势，而不是大脑结构和认知的纵向变化减弱，降低了受教育程度较高的人被诊断为阿尔茨海默病的风险（即教育在整个生命周期中的截距效应，而不是对斜率/变化率的影响）。

在所检查的15个横断面影像衍生表型中，我们没有发现任何证据表明大脑结构对阿尔茨海默病风险有因果效应，也没有发现这些大脑结构表型在教育程度到阿尔茨海默病的因果通路中起中介作用。然而，基于这些发现，我们不能排除大脑结构的变化通过决定个体潜在的大脑储备来介导教育对阿尔茨海默病风险的保护作用的可能性。捕捉大脑储备的神经基础可能需要比本研究中使用的更精细和更具体的MRI指标。我们推断，教育对阿尔茨海默病风险的任何假定的保护作用不太可能仅以高度区域特异性的方式表现出来，因此决定主要研究全局而不是局部影像表型。然而，本研究中使用全局影像指标可能掩盖了大脑宏观或微观结构对阿尔茨海默病风险的任何显著的区域特异性因果效应。我们在正文中仅提供了基于横断面脑影像数据的分析，基于纵向变化的分析可能会有所不同——有关使用大脑结构纵向变化数据的初步分析，请参见补充材料第13页和补充表7。教育对阿尔茨海默病的保护作用也可以用相关的“认知储备”概念来更好地解释，该概念指的是大脑通过更有效地利用先前存在的认知网络或通过招募补偿性神经通路来应对病理的能力。认知储备是一个动态的、主动的适应过程，通常使用行为测试或功能性神经影像模式（例如，调节阿尔茨海默病理对认知的影响的静息状态或任务相关的大脑激活网络）来测量。虽然认知储备和大脑储备的概念并不相互排斥，并且被假设在调节阿尔茨海默病理对临床结果的影响方面协同作用，但教育对阿尔茨海默病风险的保护作用很可能是主要通过增加认知储备来介导的。因此，使用功能性MRI而不是结构性MRI，或认知/行为表型可能更适合捕捉这种中介效应。此外，教育对阿尔茨海默病风险的一些假定益处可能主要通过与大脑MRI指标关系最小的机制来介导，例如减少吸烟和改善血管健康，或通过我们的MRI指标无法很好捕捉的其他大脑过程（例如微观或细胞内或血管）。

在相反的方向上，我们发现了基因预测的阿尔茨海默病与皮质方向离散指数、白质束的平均扩散率和双侧海马体积之间存在关联的证据。然而，这些结果完全是由APOC1基因区域中的一个单一内含子变异（rs12721046）驱动的，该变异在最近的GWAS中与通过PET成像测量的脑淀粉样蛋白沉积相关。APOC1基因编码载脂蛋白C1家族的一个成员，该家族在脂质水平和代谢的调节中起着核心作用。它位于19号染色体上的一个簇中，距离APOE基因下游约5千碱基对，其中已知常见遗传变异对阿尔茨海默病风险有相对较大的影响。最近一项使用全基因组测序数据对APOE及其周围区域进行精细定位的研究确定了APOC1区域中的一组风险变异（包括rs12721046）作为阿尔茨海默病的潜在致病变异。发现这组变异会增加阿尔茨海默病的风险，而与APOE-ε4基因型无关。在所有四项分析中，rs12721046的变异特异性因果估计的精确度明显高于其余工具变量，导致该变异主导了IVW（逆方差加权）估计。当从分析中移除该变异时，总体因果效应估计值向零值衰减，并且不再显著。由于所有因果效应仅由rs12721046变异证明，它们可能代表了从该变异到大脑结构的水平多效性通路。因此，我们无法就阿尔茨海默病的遗传易感性对大脑结构的影响得出明确的结论。

局限性：

我们的研究结果应在一些局限性的背景下进行解释：

首先，虽然我们使用影像衍生表型作为结构性大脑储备的标志物，但我们无法确定这些表型在多大程度上捕捉了病前大脑储备，而不是继发于疾病的神经病理学变化（例如继发于阿尔茨海默病的萎缩）。考虑到英国生物库影像队列的年龄范围（45-82岁），不能排除影像GWAS中的一些个体患有临床前阿尔茨海默病的可能性。使用自我报告的诊断和国际疾病分类代码，我们发现英国生物库中只有0.6%的参与者目前被诊断为阿尔茨海默病。因此，影像GWAS样本中有很大比例的参与者在扫描时患有当前或即将发生的阿尔茨海默病的可能性不大。然而，随着随访时间的延长，这些参与者中有相当一部分可能会继续发展为阿尔茨海默病或其他痴呆症。

其次，我们分析中的因果效应估计值可能会受到赢家诅咒偏差的影响，这种偏差发生在使用相同的数据集来选择作为工具变量的遗传变异并估计它们与暴露的关联时。虽然可以通过使用来自相同基础人群的三个非重叠数据集进行基因发现以及变异-暴露和变异-结果关联的估计来避免这种偏差，但将我们的分析限制为所检查表型的非重叠数据集会大大减少样本量。因此，有必要在偏差风险与因果估计值的不精确性之间进行权衡。

第三，尽管在教育和大脑结构对阿尔茨海默病的影响的分析中没有重叠样本，但EA（教育程度） GWAS中39%的参与者和脑影像GWAS中的所有参与者都来自英国生物库。双样本MR中暴露和结果数据集之间的重叠会加剧由于弱工具变量引起的偏差，偏差的大小是两个样本之间重叠程度的线性函数。然而，脑成像是英国生物库数据收集方案中最近增加的内容，本研究中使用的影像样本中只有不到10%的英国生物库队列参与。即使来自英国生物库影像样本的所有参与者都包含在EA GWAS中，本研究中暴露和结果数据集之间的重叠百分比在教育→大脑结构分析中为2.8%至2.9%，在大脑结构→教育分析中为4.1%至4.3%，这表明本研究中样本重叠的程度很小。因此，使用完全不重叠的样本不太可能改变我们结果的方向或大小。

第四，我们的研究结果可能受到英国生物库影像队列中选择偏差的影响，这种偏差发生在选择进入研究样本取决于一个对撞因子时。在孟德尔随机化中，暴露和结果都是遗传变异和暴露-结果关联的任何混杂因素的因果下游（即它们是工具变量和混杂因素的对撞因子）。因此，如果选择进入研究样本是暴露或结果的函数，这可能会在工具变量和混杂因素之间引入关联，从而导致违反工具变量假设。在评估EA对影像衍生表型的因果效应的分析中，选择进入影像样本很可能是暴露的一个函数，因为与英国一般人群相比，英国生物库中的参与者受教育程度更高。在评估大脑结构对阿尔茨海默病的因果效应的分析中，也可能发生选择偏差，因为招募进入影像样本可能是结果的一个函数。由于英国生物库参与者比一般人群更健康，而且影像队列是那些自愿接受广泛额外评估的参与者的一个子集，因此可以合理地假设，与一般人群相比，那些被招募进入影像队列的人在扫描时不太可能患有阿尔茨海默病（或在未来发展为阿尔茨海默病）。然而，模拟研究表明，选择偏差对MR估计值和I型错误率的影响只有在对撞因子对选择的影响特别大时才会很严重，这在前面讨论的例子中不太可能出现。因此，我们认为我们的研究结果不太可能仅仅用选择偏差来解释。

第五，几个表型的遗传关联估计值来自基于英国生物库队列的GWAS，该队列在几个社会人口统计学、生活方式和健康相关特征方面并不代表一般人群。例如，与非参与者相比，英国生物库参与者更有可能是女性、年龄更大且居住在社会经济剥夺程度较低的地区。他们还被证明与英国一般人群相比，肥胖、吸烟和每日饮酒的患病率较低，以及年龄调整后的癌症总发病率和全因死亡率较低。这些差异与公认的“健康志愿者效应”一致，这可能会限制我们研究结果的普遍性。

第六，为了尽量减少由于人群分层造成的混杂的可能性，我们将分析限制在欧洲血统的参与者中。因此，我们的研究结果是否能推广到其他人群仍不清楚。

最后，用于脑成像表型的GWAS数据源的样本量相对较小。虽然有更大规模的大脑结构GWAS可用，但这些是来自不同成像队列的MRI数据的荟萃分析。尽管样本量略小，但在英国生物库中使用统一的基因分型和神经影像方案，以及对本研究中使用的数据应用一致的遗传和表型质量控制流程，可能会导致更低的测量误差和更高的功效。然而，统计功效计算表明，我们的分析可能功效不足以检测大脑结构对阿尔茨海默病风险的特别微妙的因果效应（补充表1）。本研究基于的影像样本仅占最终英国生物库影像队列规模的40%。随着更多参与者的数据变得可用，使用更大规模和更高功效的影像衍生表型的GWAS来重复这些发现将使我们能够就教育、大脑结构和阿尔茨海默病之间的假定因果关系得出更明确的结论。

总结：

总之，我们的研究结果补充了大量的观察性流行病学文献，以及越来越多的孟德尔随机化研究的证据，支持增加受教育程度对阿尔茨海默病风险的因果保护作用。此外，我们的结果支持教育与皮质宏观和微观结构的几个方面之间潜在的双向因果关联。然而，我们没有发现证据表明这些结构改变对阿尔茨海默病的风险有下游影响，或者未发现它们位于从教育到阿尔茨海默病的因果通路上。观察到的增加EA（教育程度）对阿尔茨海默病风险的保护作用可能是通过这些特定MRI表型未捕捉到的其他大脑结构变化或通过其他生物学机制介导的。