《Communications Biology》:Network-informed analysis of a multivariate trait-space reveals optimal trait selection
编辑推荐:
为解决在多维共变的植物性状空间中合理筛选最具信息性性状的问题,研究人员开展了基于 Network 分析的植物性状筛选研究。通过构建和分析全球植物性状网络,他们发现 10 性状网络可保留 60% 原始信息,成本仅为全性状组的 20.1%,有助于理解植物策略及未来研究。
在植物生态学的广袤天地里,植物功能性状就像一把把独特的 “钥匙”,它们蕴含着植物应对环境变化、参与生态系统运转的奥秘。这些性状涵盖了植物形态、化学、生理和物候等多个方面,从叶片的大小、厚度,到根系的生长模式,再到种子的特性,每一个性状都记录着植物在漫长进化历程中的适应策略。然而,随着研究的深入,一个棘手的问题摆在了科学家面前。植物的性状数量繁多,且相互关联,形成了一个复杂的多维共变性状空间。在实际研究中,测量所有性状不仅耗时费力,还受到野外工作时间和预算的限制。传统的性状选择方法往往缺乏系统性,随意且片面,难以确保所选性状能全面、准确地反映生态系统的功能。例如,过去常依赖的叶片经济谱,虽然在一定程度上能体现植物的策略,但过度聚焦这一维度,会忽略其他重要的生态维度,如营养获取、环境适应等,导致对植物功能和生态过程的理解产生偏差。此外,主成分分析(PCA)作为常用的分析工具,在处理性状空间时也存在局限性,它可能会过度强调某些维度,而对其他维度的表征不足,进而误导对植物性状和策略的解读。因此,如何在众多性状中筛选出最具代表性、最能反映植物功能复杂性的关键性状,成为了植物生态学研究的关键挑战,迫切需要一种新的方法来突破这一瓶颈。
为了攻克这一难题,来自根特大学(Ghent University)、法国国家农业、食品与环境研究院(INRAE)、西悉尼大学(Western Sydney University)、德国综合生物多样性研究中心(iDiv)和马克斯?普朗克生物地球化学研究所(Max Planck Institute for Biogeochemistry)的研究人员携手展开了深入探索。他们的研究成果发表在《Communications Biology》上,为植物性状研究开辟了新的道路。
研究人员采用的主要技术方法包括:首先,利用全球植物性状数据库(TRY)中的数据,获取 27 个填补缺失值后的植物性状数据,这些数据涵盖了叶、茎、根、种子和整株植物的性状,并代表了功能生态学中常见且可测量的性状。通过贝叶斯分层概率矩阵分解(BHPMF)方法对缺失数据进行插补,确保数据的完整性和可靠性。其次,运用网络分析方法,将性状视为节点,性状间的关系用边表示,基于皮尔逊相关系数构建植物性状网络。在构建过程中,设置固定阈值(p ≥ 0.05 或span data-custom-copy-text="\(\vert r\vert0.2\)"∣ r ∣ < 0.2 )以避免虚假相关性。同时,借助网络密度、连通性和模块性等网络指标,来评估性状间的相互作用和性状空间的结构。最后,通过计算性状冗余、网络相异性和网络性能等指标,对不同规模的网络进行筛选和分析,确定最优的性状组合。
研究结果主要体现在以下几个方面:
最优简化网络与性状冗余 :研究发现,网络相异性(简化网络与完整网络在结构上的差异)随网络规模减小而降低。即使在仅有 5 个性状的最小情况下,也至少存在一个简化网络能够捕捉完整网络的结构。随着性状数量从 5 增加到 10,最优网络的性状冗余平均从 0.7 增加到 0.9,比随机抽样网络高 3.4%。当包含 26 个性状时,性状冗余继续缓慢增加。在捕捉完整网络指标在不同生态区域的变化方面,最优简化网络的平均性能比随机抽样网络高 2.9%,最低性能值提高了 11.1%。在植物叶性状和茎性状方面,两者都存在较高冗余,而种子性状的冗余度最低。在捕捉网络连通性变化上,最优简化网络表现更为突出,其最低值增加了 18.5%。
一致简化网络系列与最佳性能网络系列 :从最优简化网络中,研究人员发现了 3979 个一致简化网络,形成了 3,133,589 个潜在网络系列。随着网络规模从 5 个性状增加到 27 个性状,这些一致简化网络的相异性占最优简化网络分布的 91.8%。与最优网络相比,一致简化网络的最低性能提高了 14%,预测网络模块性的R 2 平均提高了 17.1%。完整的 27 性状空间存在三个主要维度,分别反映植物在水文安全策略(以植物高度、茎导管密度和比根长为主导)、叶片经济策略(以叶片碳氮比、叶片氮含量和比叶面积为主导)和植物繁殖与竞争(以种子质量、茎导管元件长度和木纤维长度为主导)方面的功能维度。表现最佳的 10 性状简化网络成功捕捉到了完整性状网络的结构复杂性,其性状分布在这三个不同模块中,且这三个模块构成了简化性状空间的三个主轴线,解释了性状空间 33%、17% 和 16% 的变异。
最具成本效益的网络系列 :最具成本效益的网络系列和最佳性能网络系列的性能都随网络规模逐渐提高,但同时网络性状测量成本也相应增加。然而,最具成本效益的一致网络在平均降低 44.2% 成本的情况下,能达到与最佳性能一致网络相当的性能。例如,7 性状网络的性能达到 41.6%,与最佳性能网络系列具有相同的预测能力,但测量成本仅为完整网络的 15.2%。10 性状网络系列在仅占完整网络 20.1% 测量成本的情况下,性能接近 60%,而相同规模的最佳性能网络系列的支出占比为 45.5%。当网络包含 18 个性状且加入种子质量时,能获得最大的边际效益,性能提高 84.3%。
研究结论和讨论部分具有重要意义。该研究证明了有限数量的关键性状能够有效把握性状空间的整体功能复杂性。最佳网络系列对植物性状进行了排序,优先选择那些最能代表完整性状网络结构、捕捉不同生态区域网络指标变化的性状。与常用的 6 性状组合相比,最佳网络系列中的 6 性状网络在展现植物功能的三个主要维度方面表现更优,能更好地捕捉原始数据集的复杂性。通过网络简化过程确定的关键性状集,有助于深入理解植物功能策略之间的相互作用。在表现最佳的 10 性状简化网络中,木本和非木本植物性状网络中与繁殖和生长相关的性状构成独立模块,且比叶面积在不同植物类型中与不同功能性状的关联差异,揭示了木本植物和非木本植物不同的进化策略。此外,性状简化方法能够简洁地表示多元性状空间,避免了纳入过多功能相似的性状。该研究结果还对地球系统模型中植物多样性的表示具有重要参考价值,有助于重新评估当前用于定义植物功能类型(PFTs)的性状选择,为基于性状的生态学研究提供关键性状选择的依据。同时,最具成本效益的网络系列为研究人员在实际测量性状时提供了有价值的指导,有助于在保证研究效果的前提下,最大程度地减少测量成本和冗余。尽管该研究在植物性状筛选方面取得了重要进展,但也存在一些局限性。研究起始的性状空间可能遗漏了一些重要性状和维度,且初始性状空间中存在的强相关性可能导致简化后的性状空间仍保留部分冗余。此外,性状测量成本因物种生活型而异,未来研究需要根据具体目标定制性状成本,以确定最有效的网络。但总体而言,该研究提出的网络简化方法为评估性状间关系提供了新视角,是生态系统研究中植物性状选择的有力工具,为后续研究奠定了坚实基础,有望推动植物生态学领域的进一步发展。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》