分享

优秀综述 | 全基因组重测序方法在濒危植物保护中的应用

 kibcat 2023-03-26 发布于美国

本文来源于由中国科学院生物多样性委员会,中国植物学会,中国科学院植物研究所,中国科学院动物研究所,中国科学院微生物研究所主办,中国科学院主管的综合性顶级学术刊物--《生物多样性》

Image
景昭阳 程可光 舒恒 马永鹏 刘平丽. 全基因组重测序方法在濒危植物保护中的应用. 生物多样性, DOI: 10.17520/biods.2022679.

编者寄语

推荐感兴趣的小伙伴可以去精读马永鹏老师发表的有关朱红大杜鹃和漾濞槭的文章!!!

摘要

全球生物多样性的急剧下降促使人们对生物多样性的保护日益重视。保护遗传学是濒危物种保护研究的重要手段, 它极大地促进我们对保护生物学多个领域的认知。然而, 保护生物学的一些重大科学问题, 包括濒危植物的演化历史、濒危原因和过程以及适应性演化机制等仍有待进一步深入研究。近年来, 高通量测序技术和保护遗传学思想的交叉融合, 促进了保护基因组学的产生, 为深入探讨这些重要问题提供了新的方法和思路。本文简要综述了组学方法中的全基因组重测序方法在濒危植物保护研究中取得的一些重要进展, 以期推动我国濒危植物保护生物学的进一步发展。

全基因组重测序作为目前保护基因组学方法中具有最高分辨力的一种方法, 在研究濒危植物系统发育和种群遗传结构, 基因组多样性, 种群演化历史、适应性演化和近交衰退等方面取得的一些重要进展, 这些研究确定了一些濒危物种的分类地位和种群保护单元, 揭示了它们的进化历史、濒危原因和过程, 阐明了部分适应性进化和近交衰退的遗传机制。由于重测序方法可以帮助更加深入地窥探保护生物学的诸多问题, 随着测序技术进一步发展和费用的降低, 它必将成为保护生物学研究的主要技术手段。

Proof

Image
可能应该是“近交衰退”吧...

生物多样性是人类生存和发展的物质基础, 但随着全球气候变化和人类活动的加剧 , 自然界中野生动植物种群的生物多样性急剧降低(Bongaarts,2019; Ceballos et al, 2020), 很多植物已处于濒临灭绝的边缘。在过去的 40 多年里 ,遗传学已成为保护濒危植物的重要工具。通过对个体和种群遗传变异的分析 , 遗传学对保护生物学的多个领域包括遗传多样性量化、物种和亲缘关系的鉴定、有效种群大小的评估、种群亚结构的确定等提供了深刻的认识 , 为指导和实施管理策略缓解濒危风险提供了重要依据(李昂和葛颂 2001; Primmer,2009; Fuentes Pardo & Ruzzante, 2017)。传统上, 保护遗传学研究主要依赖于少数的分子标记如同工酶、微卫星标记或者是细胞器基因组测序(线粒体基因组和叶绿体基因组), 由于使用的大多数分子标记被锚定在基因组上少数的中性区域, 在研究保护生物学问题时有一定的局限性 (Avise, 2010; Allendorf, 2017)。

近十几年来, 高通量测序(high-throughput sequencing)技术的发展彻底改变了评估遗传变异的方式(Goodwin et al, 2016; Fuentes Pardo & Ruzzante, 2017)。这些技术允许在短时间内以可承受的成本对数千到数百万个基因座进行大规模测序, 得到数以万计的高密度分子标记。基因组学技术与保护遗传学理论思想融合, 促进了保护基因组学(conservation genomics)的诞生(Allendorf et al, 2017)。与保护遗传学相比, 保护基因组学不仅可以在传统的物种分类地位和亲缘关系的鉴定、遗传多样性、种群遗传结构等方面提供更全面、更准确可靠的研究结果, 还可以对物种起源、分化和种群大小随时间演化的历史进程、种群局部适应的分子机理和近交状况及近交衰退的遗传基础等方面提供更加深入的研究(Allendorf et al, 2010; Fuentes Pardo & Ruzzante, 2017; Hohenlohe et al,2021; 魏辅文等 , 2021)。

在保护基因组学采用的众多组学方法中 , 全基因组重测序(whole genome resequencing), 是目前具有最高分辨力的基因组学方法。其优点明显、应用前景广阔 , 发展迅速(刘山林等, 2022)。近年来 , 有一些综述文章很好地总结了保护基因组学研究取得的一些进展。但是 , 这些综述文章更多地聚焦于动物(Fuentes Pardo & Ruzzante, 2017; 魏辅文等, 2021), 且取得的进展主要来自利用基因组方法中的简化基因组测序方法(Primmer, 2009; Hohenlohe et al,2021; 郝宇波等,2022) 。

在此 , 我们聚焦于利用全基因组重测序方法在濒危植物保护研究方面取得的一些进展。我们首先关注全基因组重测序方法如何提供更多的分子标记更全面、精准地研究传统的保护遗传问题如遗传多样性、系统发育关系及群体遗传结构等 , 然后进一步关注全基因组重测序方法如何深入地揭示濒危植物有效种群大小随时间的演化历史 , 种群适应性演化的分子基础和近交衰退的遗传基础。最后 , 本文对重测序方法应用于濒危植物保护研究中存在的问题及未来的发展趋势提出进一步的思考和建议。

1 保护基因组学方法和策略

传统的保护遗传学研究, 依赖于包括等位酶和微卫星基因分型或线粒体 DNA 测序在内的技术 , 以提供关于自然种群的丰富知识。然而 , 这些技术只能提供非常有限的遗传标记数据。21 世纪以来 , 测序技术特别是二代及三代测序技术的飞速发展 , 促进了保护基因组学的诞生。目前 , 被广泛应用于保护基因组的方法主要可以分为两大类 : 简化基因组测序(reduced representation genome s equencing,RRGS) 和全基因组测序(Fuentes Pardo & Ruzzante,2017)。

1.1 简化基因组测序

简化基因组测序即对部分基因组进行序列测定 , 它极大地降低了基因组的复杂度 , 进而降低了测序成本和计算的负担 , 此外还具有性价比高、稳定性好、文库的构建程序更简单、实验时间较短、得到 SNPs 数量多和不依赖于参考基因组等众多优点 , 因此该技术被广泛应用于濒危动植物的保护基因组学研究 (Fuentes Pardo & Ruzzante, 2017; Wang et al, 2019; Bao et al, 2020; Cai et al, 2021)。简化基因组测序可分为 酶切位点相关 DNA 测序(restriction site Associated DNA Sequence, RAD seq(Andrews et al, 2016), 转录组测序(RNA sequencing, RNA seq(祁云霞 , 2011),全外显子组测序(whole exome sequencing, WES (Warr et al, 2015)。这3种方法的共同点是它们通常只评估基因组的一小部分。由于基因组的不完全覆盖和一些数据的缺失, 简化基因组数据给后续的种群遗传学分析带来了挑战 , 例如在群体系统发育推断方面 : 首先 , 当存在多态性和测序错误的情况下 , 很难快速准确地对来自同一限制性位点进行聚类 ; 其次 , 从头将每个聚类组装成独特的位点最终构建系统发育关系仍然比较复杂 ; 此外, RAD seq数据最终获得遗传变异信息的规模以及系统发育的可用性 , 均受到所用的限制性酶、所选片段的大小以及不同样品的测序覆盖率等多种因素的影响(Chong et al, 2012; Eaton, 2014; Andrews et al, 2016) 。而相较于简化基因组测序方法 , 依赖于参考基因组的全基因组重测序方法能够检测获得的标记的数量和质量均有显著提高 , 它极大地优化获得遗传标记的准确度(Andrews et al, 2016; Jones & Good, 2016)。

1.2 全基因组测序

全基因组测序可分为两类; 全基因组从头测序(de novo whole genome sequencing) 和全基因组重测序 (whole genome resequencing)(Fuentes Pardo & Ruzzante, 2017)。从头测序是指首次组装一个新的基因组序列 , 基因组组装的难度和质量取决于基因组的大小和复杂性、计算资源和生物信息学经验。目前 , 全基因组从头测序的主要采用三代测序技术 ,有Pacific Biosciences公司的单分子实时测序(single molecule real time sequencing, SMRT)技术和Hifi(High fidelity reads) 技术、Nanopore 公司的纳米孔测序技术(oxford nanopore technologies, ONT)(Schuster, 2008 ; Clarke et al, 2009),在测序完成后Hi-C(high throughput chromosome conformation capture)技术则可以帮助将测序结果组装到染色体水平。全基因组重测序的目的是比较个体和种群的基因组变异。全基因组重测序主要利用二代测序技术Roche 454 GS FLX Titanium、ABI 公司的SOLID和Illumina公司的HiSeq 2000等获得大量的短片段(short reads) 并比对到参考基因组上从而获得群体水平的单核苷酸多态性(si ngle nucleotide polymorphism, SNP)数据 , 然后在此基础上进行一系列的种群遗传学分析。

全基因组重测序需要高质量的参考基因组来进行读长比对和变异检测。高质量参考基因组的缺乏是全基因组重测序技术用于保护生物学研究的主要限制因素。虽然测序技术的高速发展促进了大量高质量参考基因组的解析 , 但受限于成本、技术 ,无法对所有物种做到均匀覆盖 , 往往具有较大的物种以及地理偏向性(刘山林等, 2022)。在此 , 我们归纳整理了记录在《国家重点保护植物名录 2021》和世界自然保护联盟(International Union for Conservation of Nature, IUCN) 红色名录上受威胁植 物的全基因组从头测序情况(图 1)。相比于已经测序的其他植物物种 , 受威胁植物的所占的比例很小。尽管如此 , 随着人们保护意识的增强和一些重要项目的启动 , 预计将来会有越来越多的濒危植物基因组被解析出来。如地球生物基因组计划(Earth BioGenome Project)提出优先对IUCN上的23,000多种濒危物种进行基因组进行测序(Lewin et al, 2018)。这一项目的实施 , 将为濒危物种的保护基因组学研究提供助力。

Image

图1 全基因组从头测序的受威胁植物统计。(a)已经全基因组测序的受威胁植物饼图。括号中的数字分别表示已经全基因组测序的受威胁植物物种数量,和其所占总测序植物物种数量的比例。(b)《国家重点保护野生植物名录》和《世界自然保护联盟红皮书》收录的受威胁植物所属科目统计图。图中的数字表示物种的数量。

2 全基因组重测序在濒危植物保护中的应用

2.1 系统发育关系和种群遗传结构

保护计划的成功实施在很大程度上依赖于对保护目标分类地位的正确识别。全基因组数据记录了一个物种进化过程中的全部历史。通过比较基因组的大部分数据而不是像传统方法那样的少数几个基因 , 可以构建更加稳健的系统进化关系 , 为近缘物种的识别和隐存种的发现提供了新的解决办法(Fuentes Pardo & Ruzzante, 2017) 。例如 , 内蒙古珍稀濒危保护植物互叶醉鱼草 Buddleja alternifolia 主要分布于喜马拉雅、横断山和黄土高原地区3大区域。其中 , 黄土高原地区的互叶醉鱼草与其他两个地区的互叶醉鱼草在形态上存在显著差异 , 而分布于喜马拉雅和横断山的互叶醉鱼草在形态上没有区别 , 无法判断分布于3个地区的群体是否属于3个物种。

Ma等(2021b)首先组装了互叶醉鱼草高质量基因组 , 然后获得了分布于3大区域48个居群的样本重测序数据。进一步对这些数据分析后 , 他们发现 3 大区域的互叶醉鱼草形成了与地理分布相一致的 3 个独立的明显分支 , 且种群分化  均大于0.5, 他们推测这3个地区的互叶醉鱼草应属于3个不同的种。

同样地 , 人们利用保护基因组学的方法在濒危动物中也发现了许多类似的例子 , 虽然某些濒危动物从形态上无法判断是否属于不同的种 , 但是遗传分化已经非常大 , 实际上可以定位为不同的物种(谭鑫鑫和李明, 2018)。对这些隐存种的识别对于濒危动植物的保护来说尤其重要。如在互叶醉鱼草的例子中 , 本就已经濒危的互叶醉鱼草在基因组上被确认为3个物种 , 意味着每个新种比之前预测的数量更少、分布范围更窄 , 物种的濒危程度可能更高。在实施保护管理时 , 这3个可能的物种也应该分别进行管理。

同一物种的不同种群之间往往存在遗传多样性的分化。保护生物学的目标之一是尽可能地保护易危物种的遗传多样性。种群管理最重要的第一步是确定和划定种内保护单位(conservation units, CUs)的边界 , 如进化显著单位(evolutionarily significant units, ESUs)。进化显著单元代表了一个物种内种群间的绝大部分遗传多样性 (Funk et al, 2012; Forester et al, 2022)。除了ESUs, 还有管理单元(management unites, MUs)和适应性单元(adaptive unites, AUs)。

在基因组框架内 , Funk等(2012) 建议用所有可能位点的遗传结构分析来鉴定ESUs, 而用中性位点来确定MUs, 用适应性位点来确定AUs 。目前 , 利用所有的重测序数据进行群体遗传结构分析是种群基因组学的常规分析 (Zhao et al, 2019; Liu et al, 2020; Ma et al, 2021a,b), 其结果可以作为濒危植物ESUs划分的依据。

Liu 等(2020)利用了SMRT和Hi-C技术对水青树Tetracentron sinense进行了全基因组从头测序和染色体水平的组装 , 并对分布于中国代表性区域的55个水青树个体进行了重测序和群体遗传结构分析包括(Structure,PCA和NJ建树等分析), 发现水青树具有4 种古老的遗传组分 , 对应于四个不同的ESUs 。Liu等(2022)对分布在中国的13个群体的154个伯乐树(Bretschneide rasinensis)个体进行重测序 , 利用去除选择位点后的中性位点来进行结构分析 , 将中国的伯乐树群体分为西部群体和东部群体, 对应于两个MUs 。

上述研究表明,基因组重测序数据可以为系统发育关系的重建和种群遗传结构的划分提供强有力的统计支持 , 有效地解决使用传统方法无法解决的模糊不清的系统发育关系和种群遗传结构 , 很好地确定保护对象和保护单元 , 对物种保护具有重要意义。

2.2 基因组多样性的评估

遗传多样性与物种的适应性演化和演化潜能密切相关。因此 , 濒危植物的遗传多样性一直都是保护生物学关注的重点。传统的保护遗传学对种群遗传多样性的评估主要基于同工酶、细胞器基因组以及其他的分子标记 , 但是这些方法仅能从群体中获得有限的遗传变异资源。采用全基因组重测序方法可以得到一个物种几乎全部的遗传信息 , 可以整体评估物种或者种群的遗传多样性即基因组多样性 。近年来, 随着濒危植物基因组不断地被解析 ,以及基于重测序的种群基因组数据的积累 , 一些濒危植物的基因组多样性被评估。在此 , 我们搜索和统计了目前已进行过重测序研究的受威胁植物和无危植物的基因组多样性(表1和附录1) 。我们发现相比于一些无危植物 , 受威胁植物的遗传多样性相对偏低(图2) 。

Image
图2 受威胁植物和无危植物的基因组多样性 π 统计。结果显示受威胁植物的遗传多样性明显低于无危植物的遗传多样性。图中只显示遗传多样性最高的 5 种受威胁植物的拉丁名。

同时 , 受威胁植物物种之间的遗传多样性水平存在差异。其中 , 斧翅沙芥(Pugionium dolabratum)和水青树具有最高的遗传多样性 , 紧接着遗传多样性较高的为野生荔枝(Litchi chinensis)、茶(Camellia sinensis)和珙桐(Davidia involucrata)。水青树和珙桐为第三纪孑遗植物 , 它们较高的遗传多样性可能与其漫长的进化历史有关。较高的遗传多样性说明这些物种具有较高的进化潜能。在这些受威胁植物中 , 濒危植物芒苞草(Acanthochlamys bracteate)具有最低的遗传多样性。研究也发现 , 有些活化石植物如银杏(Ginkgo biloba)尽管形态变异比较少 , 但是遗传多样性还比较高 , 显示银杏仍有相当的进化潜能 , 且形态变异与遗传变异之间没有相关性 (Zhao et al, 2019)。

值得注意的是 , 有些研究群体取样较少 , 代表性不足 , 这也可能导致了不同濒危植物检测到的遗传多样性水平的差异。未来濒危植物的保护基因组学研究需要加大取样量从而更全面地评估物种或种群水平的基因组多样性。

Image
表1 受威胁植物核酸多样性

2.3 种群历史动态

种群动态历史研究物种种群大小和相关参数随着时间变化的情况。濒危植物有效种群动态历史的研究(包括历史有效种群大小的扩张和收缩、瓶颈形成模式、迁移模式等), 有助于揭示植物的濒危过程和原因 , 对濒危植物的保护具重要意义。传统的保护遗传学借助线粒体和叶绿体 DNA 片段或者微卫星遗传标记来推断种群历史动态 , 需要的群体样本量大 , 且仅能追溯最近一次的种群动态事件(魏辅文等 ,2021)。而全基因组重测序数据可以全面重建种群大小在不同时间尺度上变化的历史动态 , 为我们了解过去的历史事件对当代有效种群数量以及遗传组成的影响提供了新的见解。

Yang等(2018)对铁木属(Ostrya)的两个近缘种天目铁木 O. rehderiana 和 O. chinensis 共 26 个个体进行了重测序 , 并对测序数据进行了种群动态历史分析 , 发现这两个物种在前期经历了相似的种群动态历史 , 发生过两次群体大小骤缩。但是 , 末次盛冰期(Last Glacial Maximum)后 , 这两个物种遵循了不同的进化路径 , 广布种在冰期结束后有效群体大小迅速回升 , 而濒危种天目铁木在冰期结束后有效群体大小持续下降 , 现已濒临灭绝 , 他们推测濒危种天目铁木种群的崩溃可能是由历史气候变化和人为干扰共同造成的。在银杏、珙桐、水青树和伯乐树(Bretschneidera sinensis)等物种中 , 研究也发现了多种种群动态历史事件 , 如种群扩张、种群瓶颈的遗传证据 , 推断历史上多次冰期很可能是它们有效群体大小下降的原因 (Zhao et al 2019; Chen et al, 2020; Liu et al, 2020; Liu et al, 2022) 。冰期可造成物种有效群体大小的下降 , 而间冰期气温的恢复可能有利于种群的扩张。

Chen等(2018)利用 PSMC 软件重建了鹅掌楸(Liriodendron chinense)和北美鹅掌楸(Liriodendron tulipifera )的群体动态历史 , 发现在整个第四纪冰期, 北美鹅掌楸的种群数量持续减少 ,而鹅掌楸大约在0.4Mya 时种群得到恢复并达到峰值 , 这两个物种经历的不同群体动态历史很大程度上解释了为何北美鹅掌楸遗传多样性严重丢失而中国鹅掌楸遗传多样性相对较高。鹅掌楸的种群数量恢复时间0.3-0.4 Mya与古乡冰期(Guxiang Glaciation, 0.3-0.13Mya) 和聂聂雄拉冰期(Naynayxungla Glaciation, 0.72-0.5 Mya)之间的间冰期时间一致 , 推测间冰期的温度恢复和冰雪消冰作用为东亚避难所内鹅掌楸种群的恢复提供了基础。除了气候因素(如冰期与间冰期 ), 地质历史事件和人为干扰也是造成种群大小波动的重要原因。

Ma等(2021a)基于31个体的重测序数据对朱红大杜鹃进行了群体动态历史的 分析 , 发现反复的遗传瓶颈效应是导致朱红大杜鹃相比近缘广布种马缨杜鹃(Rhododendron delavayi)遗传多样性低的重要因素。朱红大杜鹃历史上经历 3 次严重遗传瓶颈 , 与冰期-间冰期作用、 共和运动等地质历史事件一致 , 最后一次遗传瓶颈之后 , 朱红大杜鹃的有效种群大小逐渐恢复 , 但是 , 现代的人为干扰可能是造成了该物种目前种群规模较小和分布受限的主要因素。除此之外 , 物种在冰期的地理分布可能也影响种群的动态历史。

Wang等(2022)对从中国三大农业生态区采集的185种不同的野大豆(Glycin esoja)种质进行了全基因组测序 , 种群动态历史分析发现野生大豆的有效种群大小自0.6Mya到0.2Mya持续减少后 ,所有种群的有效种群大小持续发生不同程度地扩大 , 末次冰期并未造成种群大小的减少。Wang 等认为前期种群的持续减少可能是由聂聂雄拉冰期的低温造成的 , 而在末次冰期时野生大豆种群非减反增的原因可能是因为此时野生大豆主要分布在温暖的华南地区 , 适宜的生长环境促进了其有效种群大小的持续扩张。

总之, 全基因组重测序可以帮助推断有效群体的波动和追踪种群动态历史事件 , 并推断过去的地质气候等历史事件对当代有效种群数量以及遗传组成的影响 , 如上述研究表明极端的地质气候变化和人类的活动是造成物种有效群体大小急剧减少和遗传多样性降低的重要原因。将种群大小变化与历史环境变化联系起来 , 还可以帮助预测未来环境变化对种群分布和遗传多样性的影响。

2.4 选择信号和种群局域适应

植物的适应性变异决定了它们的长期生存能力、种群大小和分布增加的潜能以及灭绝的概率。除了评估适应性表型性状是否有遗传基础外 , 基于重测序的保护基因组学还可以确定自然群体中这种变异背后的特定基因 , 并且使研究者可以更好地理解适应的过程和潜力。

目前, 在基因组水平上 , 通常有两类方法来检测基因组上的选择信号 : (1)基于群体间遗传分化指数  的“离群值”检测方法 ; (2)基于等位基因频率和环境变量之间相关性的基因型-环境互作关系检测法(Hohenlohe et al, 2021)。前一种方法的理论依据是 : 受到适应性选择或正选择的位点明显比基因组上中性进化的其他区域有更高的遗传分化。第二种方法则考虑到不同群体之间存在的环境异质性问题, 旨在将等位基因频率的模式与环境梯度联系起来。基于两类方法的软件有很多, 如BayeScan和Fdist2, “LEA” R package和SAM Matla等 。

此外 , 确定自然种群适应性变异的遗传基础的其他方法有全基因组关联研究(genome wide association studies, GWAS)。基于这些方法 , 多个濒危物种中受选择或与地方性适应相关的候选基因被鉴定出来。

Zhao等(2019)利用SweeD软件并结合CLR统计在银杏东部和西南群体中分别检测到了910和949个受选择区域 , 分别包含了643和504个候选基因 , 进一步结合  分析 , 鉴定出25个基因 , 这些基因主要参与对昆虫和真菌的抗性以及对失水、低温和高盐等非生物胁迫的响应。环境适应性相关变异位点的鉴定以及生物学过程的富集对于后期的遗传拯救(例如 , 引种过程中不同生态区域的环境适应)提供了理论指导。

Hu等(2021)发现沙芥和斧翅沙芥的基因组中存在 42 个遗传分化较大的区域 , 而对该区域进行进一步的分析鉴定出 197 个受选择基因 , 这些基因参与植物根的发育 , 叶片形态构成、木质部分化、种子发育、耐盐碱、耐干旱、氧化应激反应和类黄酮生物合成等等。该研究认为这些受选择的基因在这两个物种形态分化和各自适应当地生态小环境过程中起了重要作用。

Zhu等(2020)通过对连香树日本和中国群体的  和基因型环境关联分析等鉴定出的 823 个与地方性适应可能相关的基因 , 它们主要富集在细胞的发育和增殖、生长素代谢途径和胁迫响应等方面。基因型环境关联方法也被用于检测伯乐树和野生大豆的局域适应。

Liu等(2022)利用 PCAdapt 和 BayPass 软件对伯乐树群体数据进行基因组扫描筛选出 388 个受选择的 SNP 位点 , 涉及的基因可能与伯乐树的生长如(PLIM2B_1、JHS1 和 MES17 基因)和胁迫应答(如VTE5RH1_3cycl11_1 基因)有关。Liu等(2022)认为所伯乐树中受正选择的基因主要参与胁迫反应和生长相关等生物学过程 , 表明该物种仍然具有多种适应潜力支持其持久存在。

Wang等(2022)使用了两种基因型-环境关联方法对分布于中国三大农业生态区的185种野大豆种质进行了基因组扫描 ,发现了多个参与局域适应的基因 , 如开花时间和温度相关基因。在第19染色体上发现了一个经历了正选择的位点 , 该位点含有两个相邻MADS box转录因子 , 可能与野大豆能够适应高纬度环境有关。在铁皮石斛(Dendrobium officinale)和古茶植物等濒危植物中 , GWAS则被用来检测受选择的位点。

Niu等(2021)对来自13个地区的铁皮石斛及其5个近缘种的38个个体样本进行了重测序并结合 GWAS 分析 ,识别出 13 个GWAS位点 , 这些位点包含了4个与株高性状有关的基因 , 2个与叶长长度性状有关的基因 , 3个与茎 长性状有关的基因 , 1个与节间长性状有关的基因。尤其 , 关键基因MWL1是木质素生物合成的关键基因 , 参与次生细胞壁的形成。敲除MWL1基因及其近缘基因MWL2后 , 株高显著降低。推测MWL1基因很可能与铁皮石斛的植株产量(茎产量)有关。Lu等(2021)对来自云南和贵州的 120棵古茶植物进行了WGAS分析了发现了四个与叶形相关 , 两个与株型相关的基因。

综上, 全基因组重测序方法是检测自然选择信号、揭示表型性状的遗传基础和鉴定地方性适应的有利武器。它可以促进我们对遗传变异和适应特性内在机制的理解。该方法揭 示的适应性性状遗传基础或者说是哪些位点促进了植物的适应 , 有助于我们采取有针对性的保护措施促进濒危植物对快速改变的自然环境的适应。

2.5 其他(近交衰退 , 有害突变等)

除了能够鉴定出适应环境变化的基因位点外,全基因组重测序方法还可以揭示小种群适合度降低的遗传基础。小种群由于遗传漂变会导致有害突变积累 , 而近交导致纯合有害等位基因的比例增加, 从而降低了个体的适合度。全基因组重测序方法不仅可以用来评估和检测近交事件 , 还可以揭示造成群体适合度降低的有害突变位点和与之相关联的基因。

目前, 人们通常基于基因组连续性纯合片段ROHs(runs of homozygosity)计算获得的基因组近交系数FROH(frequency runs of homozygosity, FROH)来评估近交事件(Hohenlohe et al, 2021)。连续性纯合片段 , 即染色体上很少或没有杂合核苷酸位点的区域。ROHs的出现通常是由于个体来自父母双方的单倍体型是相同的 , 而这个单倍型又是从过去某个时间点的共同祖先继承而来。短ROH反映了较老的近交事件 , 而较 ROH则反映了近期的近交事件。目前, 也有多种不同的软件可以用来检测群体基因组水平上的有害突变。

比如 , 基于序列同源性的SIFT预测软件可以帮助分析新出现的非同义变异是否为有害突变(Ng & Henikoff, 2003); 基于序列同源性和蛋白质结构的PolyPhen 2预测软件可以帮助预测群体中有害的错译突变(Adzhubei et al, 2010)。利用这些软件 , 人们检测了天目铁木、漾濞槭和朱红大杜鹃等濒危植物种群的近交衰退和有害突变情况。

Yang等(2018)通过对濒危种天目铁木和广布近缘种 O. chinensis 的 ROH 分析 , 发现濒危种天目铁木的FROH(0.31-0.45)比O. chinensis(0.07-0.19)要高 , 且每个天目铁木个体有几个大于1Mb的 ROHs, 而近缘 O. chinensis最长的ROH大小不超过0.63Mb, 推测天目铁木相对于O. chinensis存在高度近亲交配 , 加剧了种群基因组遗传多样性的降低。遗传负荷分析显示天目铁木存在较高的遗传负荷积累 , 综合 4 类(SYN、TOL、DEL、LoF)突变位点于两个铁木树种中的比较情况 , 确定天目铁木显著携带更多的纯合有害突变 , 这可能是天目铁木濒危的主要原因之一。但天目铁木要比O. chinensis清除了更多严重有害的隐性突变 , 这种清除和逐渐降低的近交衰退有可能一起减缓该物种的灭绝 , 并可能促进杂交天目铁木在未来的存活。

Yang等(2018)等人对天目铁木的基因组遗传多样性被侵蚀的模式调查为后续该物种的保护提供了一个很好的例子, 认为未来应该设计人工杂交策略 , 以减少由于近亲繁殖和遗传漂移造成的多样性损失 , 而不是通过收集近亲繁殖的种子或在濒危树木中进行克隆扦插来增加存活个体的总数。

Ma等(2021a)对极度濒危物种朱红大杜鹃和同属广布种马缨杜鹃 的重测序数据分析显示朱红大杜鹃显著积累了更多的纯合有害突变 , 而这可能与朱红大杜鹃近交严重有关 , 因为结果显示朱红大杜鹃的 ROH 程度显著高于马缨杜鹃。他们进一步注释了朱红杜鹃中的有害突变 , 检测到了几个与热应激相关的突变 , 包括 (i) 热休克蛋白 , (ii)转录因子 热应激转录因子、 WRKY 转录因子 和 ( iii)分子伴侣。朱红大杜鹃遗传多样性低,遗传负荷重预示着该物种有很高的灭绝风险 , 作者提出一些相应的保护措施 , 比如应当原地保护整个HQ 种群 , 禁止在该保护区进行任何活动以减缓该物种栖息地和野生种群的减少和退化 ; 设立永久的科学信息面板以提高公众对朱红大杜鹃的认识和保护意识。此外 , 考虑到 JT 群体中有价值的基因型个体的灭绝 , 它们提出应优先在当地附近的村庄和苗圃园进行全面调查找到某些具有JT 群体遗传背景的个体。在这之后 , 异地保护和人工补充授粉。

Ma等(2022)基于重测序数据对漾濞槭不同种群的近交以及有害突变模式进行了分析 , 制定出了个性化的遗传拯救模式。比如 , 针对FROH高和纯合有害变异多的LSBD种群的遗传拯救 , 他们建议利用纯合有害突变数目最低的DYS种群个体的花粉来对LSBD种群的雌花进行授粉 这样不但不会引入更多有害突变 , 还可以使纯合的有害突变杂合化。另外, CR种群由于遗传背景纯 , FROH和有害突变较低也可以作为杂交的候选种群资源。

从以上例子可以看出, 全基因组重测序方法可以帮助鉴定近交衰退的遗传基础 , 这些遗传信息可以用于自交衰退的早期诊断 , 在设计育种计划时以帮助避免使用带有有害突变的个体 , 因为一旦引入这样的个体将会影响野生种群的恢复。近交和有害突变的检测可以帮助制定出了个性化的遗传拯救策略 , 对于濒危植物的保护具有重要意义。

3 总结和展望

3.1 存在的问题

伴随着基因组测序技术发展起来的保护基因组学为深入揭示保护生物学的问题带来了一些新的思路和解决办法 , 逐渐成为保护生物学研究的重要手段。其中 , 全基因组重测序方法是目前保护基因组学采用的组学方法中具有最高分辨力的一种方法 , 其应用前景广阔。然而 , 大部分濒危物种高质量参考基因组缺乏 , 测序成本较高 , 和计算资源不足 , 限制了全基因组重测序方法在保护生物学上的应用。此外 , 保护研究人员还需要相当熟练的生物信息学知识和技能。再者 , 保护基因组学研究和保护实践的应用之间仍然存在差距。研究人员在做完研究后通常会写一篇文章并在结尾提一些保护建议 , 他们希望保护管理者找到并应用它 , 但实际上保护管理人员通常并没有阅读这些文章。且研究人员认为对保护有用的研究或结果 , 可能在操作过程中很难或者几乎不能顺利实施。

3.2 建议和未来发展趋势

保护基因组学不仅可以为传统保护遗传学关注的问题如遗传多样性 , 种群遗传结构等提供更强的统计支持 , 而且还可以揭示种群大小随时间变化的种群动态历史 , 更可以深入探讨物种或种群局部适应分子机制和近交衰退的遗传基础。而随着测序技术的进一步发展和测序成本的进一步下降 , 可以预测未来会有越来越多濒危植物基因组被解析出来且随着更多对用户友好的生物信息学工具和种群基因组学分析软件的开发 , 基于全基因组重测序的保护基因组学研究面临的一些问题如缺少参考基因组的问题也必将迎刃而解 , 重测序必将成为保护基因组学研究的主要技术手段。

在利用重测序方法研究保护生物学问题时, 我们建议 :

(1)研究者与保护管理工作者人员建立专业良好的沟通体系 , 确定要解决的问题 , 并评估所要解决的保护生物学问题是否需要利用重测序方法才能解决 , 如果利用传统的保护遗传学技术手段就可以解决的问题 , 我们可以优先利用传统的保护遗传学技术手段来解决 ; 但是当我们需要检测选择信号和确定表型性状或者适合度降低的遗传基础时 ,全基因组重测序方法则是更好的选择;

(2)管理建议应建立在取样充足和分析合理的基础上 , 在确定重测序策略后 , 进行群体取样时 , 尽可能将物种分布范围内的代表性群体样品取全 , 在群体内部取样时 ,个体之间的取样距离要足够 ;

(3)获取重测序数据后需要利用多种软件对数据进行全面深入的分析, 比如目前就有多种软件可以进行种群动态的历史分析 (如 PSMC 、 Stairway plot2 、 SMC 和 fastsimcoal2等软件), 对种群的适应性进化和有害突 变研究也有多种不同的分析软件 前者有(Fdist2 和sweeperfinder)等分析软件 , 后者有(SIFT 和PolyPhen 2 预测软件), 每种软件基于相似的或不同的原理 , 可以帮助揭示物种进化的不同侧面 , 通过比较多种分析结果有利于我们推断种群更加真实的演化历史和演化机制 ;

(4)目前绝大多数基于重测序的保护基因组学研究都是基于核基因组的单核苷酸多态性SNP标记的分析 , 对细胞器基因组标记的利用不足 ; 对于结构变异(Structural variations,SV)如倒位(inversion)、异位(translocation) 等在濒危物种演化过程中发挥的作用也知之甚少。随着长读长测序技术的进一步成熟 , 研究人员可以更多地关注基因组中大的结构变异;

(5) 由于种群动态历史和遗传漂变形成的遗传模式也可能与地方性适应形成的遗传模式相似 , 因此基因组扫描检测出来的位点需要进一步的功能验证。对表型性状和适应有效应的突变也需要设计实验进行证实以揭示适应本质。建议一方面用模式物种来进行实验验证 , 因为很多的生物途径在不同物种之间是保守的 , 另一方面 , 我们可以利用基因组编辑工具如CRISPR/Cas9在濒危植物中进行功能验证。

总之, 由于重测序方法可以帮助更加深入地窥探保护生物学的诸多问题 , 它必将成为保护生物学研究新的常用的基本技术手段。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多