通过稳健路径分析理解生物多样性对营养级相互作用的影响:开拓生态研究新视角

《Cell Reports Sustainability》:Understanding biodiversity effects on trophic interactions with a robust approach to path analysis

【字体: 时间:2025年03月26日 来源:Cell Reports Sustainability

编辑推荐:

  本文提出了一种变分贝叶斯稳健中介分析(VB-RobM)方法,该方法结合稳健估计方程和贝叶斯框架,在处理异常数据分布时比传统方法更准确、高效且稳健。通过模拟研究和生态数据集应用,为生物多样性与营养级相互作用研究提供了有力工具。

  

研究背景

在生物和社会科学研究中,路径分析对于探究变量间因果关系至关重要,它能够打开生物或社会途径因果链中 “黑箱” 的窗口。其中,结构方程建模(SEM),尤其是结合贝叶斯应用的方法,在自然、医学和社会科学领域广泛应用。但传统的基于频率的统计方法存在局限,SEM 在模型设定不当的情况下,其估计结果会出现偏差,而贝叶斯方法虽然使用弱信息先验能在一定程度上改善估计,但在数据真实分布违反模型假设时也会产生偏差,且蒙特卡罗马尔可夫链(MCMC)采样算法耗时较长。
稳健估计方程的出现旨在处理数据中的异常值,通过用稳健损失函数替代残差的平方损失,降低异常观测值的权重。然而,其对称误差项的假设是保证无偏估计的关键,现有的基于线性近似的偏差校正稳健估计器依赖校正项的准确性,若校正项估计有偏差,最终的估计结果也会有偏差。因此,开发一种结合稳健最大似然估计和贝叶斯方法优势的新方法迫在眉睫。

VB-RobM 方法介绍

本文提出的变分贝叶斯稳健中介分析(VB-RobM)方法,结合了变分贝叶斯(VB)方法,通过特定分布族近似贝叶斯推断中的后验分布,能够在减少计算时间的同时获得更稳健的估计。
VB-RobM 方法主要包含五个步骤:首先是数据输入和指定变量间路径;接着根据指定关系,利用稳健估计方程获得路径系数和稳健残差的初始估计;然后通过狄利克雷过程混合模型(DPMM)估计残差的密度函数以及稳健函数的一阶和二阶矩;之后将密度估计整合到估计方程中,对初始估计进行去偏;最后通过自助法对处理对结果的直接、间接和总效应进行统计推断。在求解稳健估计方程时,采用了定点和坐标下降算法,以增强稳定性。

研究结果

  1. 模拟性能:研究人员通过模拟研究,对比了 VB-RobM 与其他现有方法,包括限制最大似然估计器(REML,常用于 PSEM)、偏差校正的稳健 REML(BCR REML)和多元贝叶斯估计器(Bayesian)。模拟数据集基于两级线性混合模型(LMM)生成,并构造了 “污染” 数据集,使其不符合标准统计分布,以此测试不同方法在参数估计时的稳健性。
在处理中心误差(误差均值为零)和非中心误差的情况时,VB-RobM 都展现出了最高的准确性和效率。在偏差方面,VB-RobM 对参数(截距、斜率、随机效应标准差和误差项标准差)的估计偏差几乎为零,远低于其他方法。在覆盖概率(CP)上,VB-RobM 对截距和斜率估计的 CP 接近名义上的 95%,而 REML 和 Bayesian 在非中心误差情况下,截距的 CP 较低,BCR REML 表现最差,其 CP 始终低于名义水平,这表明它严重低估了标准误差,无法支持稳健的假设检验。在计算效率上,REML 虽然是最快速的,计算每个样本仅需 0.003 秒,但 VB-RobM 的计算时间也较为合理,处理中心误差和非中心误差时,每个样本分别耗时 0.120 秒和 0.116 秒,远低于贝叶斯方法(分别为 0.416 秒和 0.382 秒)。
  1. 全球数据集应用:研究团队将 VB-RobM 方法应用于一个生态数据集,评估植物多样性对植物、食草动物及其天敌之间的双营养级和三营养级相互作用的路径效应。该数据集包含来自 57 篇文章的 262 个观测值,地理分布在世界地图上。
分析结果显示,所有方法都表明增加植物物种多样性能增强天敌和植物的性能,同时降低食草动物的性能。天敌性能的提升会抑制食草动物性能,进而影响植物性能。然而,在统计显著性方面,VB-RobM 的结果与其他方法存在差异。例如,在天敌性能对食草动物性能的路径效应上,只有 VB-RobM 识别出了统计显著的结果(值小于 0.001),其他估计器则认为该关系不显著。在植物物种多样性对植物性能的路径效应上,VB-RobM 是唯一报告结果不显著的方法(值为 0.127)。此外,VB-RobM 还能推断出植物物种多样性对植物性能的直接、间接和总效应,虽然直接和间接效应的置信区间包含零,不显著,但总效应显著,这表明植物物种多样性通过多种途径影响植物性能,不过通过控制食草动物来影响植物性能的证据较弱。

讨论

VB-RobM 在处理具有异常分布或异常值的数据时,在偏差、CP 和时间效率方面都优于其他方法。它能够有效处理中心和非中心误差,通过整合稳健估计框架和利用 DPMM 校正正态性偏差,克服了传统 LMM 和贝叶斯方法在模型误差不符合高斯分布假设时缺乏稳健性的问题。同时,VB-RobM 使用变分贝叶斯近似替代 MCMC 算法进行后验估计,大幅减少了计算时间。
不过,VB-RobM 也存在一定的局限性。在模拟中发现,它能够容忍的最小污染比例为 20%。为了提高对更高污染水平的稳健性,可以考虑将 S 估计器整合到 VB-RobM 中,但这需要所有研究具有相同的重复次数,在实际应用中可能会受到限制。未来的研究可以进一步探索如何更好地整合 S 估计器,增强 VB-RobM 的稳健性和灵活性,同时扩展应用的 LMM 模型,使其能够处理具有更多层次结构的复杂数据。
总体而言,VB-RobM 为路径分析带来了重要的进展,在保持计算效率的同时提高了准确性和稳健性,非常适合生态研究以及其他需要进行路径分析以探究复杂关系的领域。

研究方法

  1. 文献来源与选择标准:为了对比不同方法在分析生物多样性对生态营养级相互作用的影响,研究人员首先建立了一个全球数据集。通过在 Web of Science 核心合集、BIOSIS Previews、Derwent Innovations Index 等多个数据库进行文献检索,使用布尔搜索字符串筛选出相关文章。经过标题和摘要筛选,排除了 195,939 篇文章,再根据数据提取、时空尺度、监测对象等多项标准,最终从 982 篇论文中选择了 57 篇,获得 262 个观测值,用于测试植物多样性对双营养级和三营养级相互作用的影响,并记录植物、食草动物和天敌的性能指标。
  2. 两级 LMM 和稳健 REML:采用两级 LMM 为子模型获取初始估计。假设变量与其祖先变量满足特定的 LMM 关系,其中包含系数、解释研究间异质性的随机效应和误差项。一般使用 REML 估计系数和方差分量,为了减少研究内的异质性,提出了稳健 REML 估计器,通过修改 REML 的估计方程,引入函数,并在本研究中采用 Tukey 函数,固定调整参数进行位置和尺度估计。
  3. VB 稳健估计器:为了克服正态性限制,修改了估计方程,引入了新的参数,分别表示变换标准化残差的期望和方差。由于这两个参数与缩放残差的真实分布相关,需要进行估计,因此使用 DPMM 来估计缩放残差的密度和矩。与常用的核密度估计(KDE)相比,DPMM 无需选择核函数带宽,且基于残差选择弱信息先验,更加稳健。为避免 DPMM 复杂耗时的 MCMC 采样算法,采用 VB DPMM。在一定条件下,VB 稳健估计器渐近服从正态分布,最后通过自助法获得直接和间接效应的置信区间。
  4. 模拟设计:通过模拟研究对比 VB-RobM、REML、BCR REML 和贝叶斯 LMM 的性能。模拟数据集基于特定的模型生成,设定了斜率、截距、中介变量和随机效应的分布,误差项由卡方分布、指数分布或泊松分布以 4:1 的比例混合。每个分布生成 500 个数据集,每个数据集包含 100 个样本和 20 个研究。
  5. 数据集:编制了一个描述植物物种多样性、无脊椎动物食草动物及其天敌之间 3 因素和 4 因素相互作用的数据集,包含来自 57 篇文章的 262 个观测值,用于比较 VB-RobM 方法与传统的基于 REML 估计器的 PSEM 和基于贝叶斯 LMM 的多元贝叶斯分析。
  6. 案例研究数据集的处理、中介和结果:在案例研究中,将植物多样性作为处理变量,天敌性能和食草动物性能作为中介变量,植物性能作为结果变量,同时考虑纬度和植物类型作为协变量。由于植物多样性的影响是非线性的,且植物物种丰富度本质上是一个二元变量(0 或 1),为探究其对其他营养级的影响,定义了添加植物多样性,并将模型中的截距项解释为处理效应,的斜率解释为添加效应。
  7. 真实数据集中的效应量测量:使用 Hedge’s g 标准化平均差(SMD)来测量植物多样性对营养级的影响,其计算方式是处理组和对照组的平均差异除以两组的合并标准差。
  8. 方法实施对比:按照特定的先验和设置进行多元贝叶斯分析,使用 “rstanarm” 和 “brms” 包在 R 中进行贝叶斯分析,使用 “piecewiseSEM” 包进行 SEM 分析,VB-RobM 分析则通过开发的 R 包 “VB-RobM” 进行,该包可在 GitHub 上获取,所有数据存于 Zenodo。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号