分享

R软件线性模型与lmer混合效应模型对生态学龙类智力测试数据层级结构应用

 拓端数据 2025-03-07 发布于浙江

全文链接:https:///?p=40925

在生态与生物学研究中,数据常呈现复杂结构特征。例如不同种群、采样点或时间序列的观测数据间往往存在相关性点击文末“阅读原文”获取完整代码、数据、文档

传统线性模型在处理这类非独立数据时存在局限性,而混合效应模型通过同时纳入固定效应与随机效应,为解决此类问题提供了有效方案。本文以龙类智力研究为例,探讨混合效应模型的构建与应用。

数据探索与预处理

研究数据来自龙类智力测试,包含体长(bodyLength)与测试得分(testScore)等变量,采集自8个山脉3个采样点。

 

通过标准化处理体长变量:

dradat$length <a(dag_datodyLeng)

直方图显示测试得分近似正态分布(图1),符合线性模型假设。

传统线性模型的局限性

初步建立线性模型:

模型显示体长对测试得分有显著正向影响(p<0.05)。但散点图揭示不同山脉间数据存在明显异质性(图2),提示观测值可能存在非独立性。


进一步分析发现,不同山脉间测试得分存在显著差异(图3),说明传统模型忽略了数据的层级结构,可能导致结果偏差。

混合效应模型构建

引入山脉作为随机效应:

library(lme data=drta)
summary(mixed_model)

 

模型结果显示,体长的影响不再显著(p>0.05),表明原线性模型高估了体长效应。随机效应分析表明,山脉间差异解释了约60%的剩余方差(339.7/(339.7+223.8))。
为处理嵌套结构(采样点嵌套于山脉),创建显式嵌套变量:

ste(dragon\_data$mountainRange, dragon\_data$site))

改进模型

模型可视化与结果解释

利用ggeffects包绘制预测曲线:

结果显示体长对测试得分无显著影响(图4),验证了混合效应模型的有效性。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多