-
生物通官微
陪你抓住生命科技
跳动的脉搏
社会-环境建模中的物理学式自信:水模型在数值主张上超越物理学
《iScience》:The l,d-transpeptidation pathway is inhibited by antibiotics of the β-lactam class in Clostridioides difficile
【字体: 大 中 小 】 时间:2025年03月27日 来源:iScience 4.6
编辑推荐:
本研究揭示了社会-环境建模领域(如流行病、综合评估和水模型)在知识主张上表现出与物理学相似的自信水平,尤其是水模型在数值支持上甚至超越了热力学等精确物理学科。通过机器学习分析约75.5万篇摘要,研究人员发现这些建模领域在缺乏充分不确定性分析的情况下过度依赖数值主张,可能引发"数学精确性幻觉"。该研究发表在《iScience》上,为模型可信度评估提供了新视角,对政策制定和跨学科研究具有重要警示意义。
在当代科学研究中,计算机模型已成为理解复杂社会-环境系统的关键工具,从病毒传播到气候变化预测,再到水资源管理。然而,这些模型面临一个根本性挑战:它们处理的开放系统无法像物理实验那样被精确控制和验证。这种"开放系统困境"引发了学术界对模型可靠性的持续质疑——当模型构建者面对无数无法完全参数化的变量时,他们如何确保其结论的可信度?更值得关注的是,一些研究表明,模型构建者可能正在不自觉地陷入"数学精确性陷阱",用看似精确的数字掩盖实质性的不确定性。
英国伯明翰大学地理、地球与环境科学学院的Arnald Puy团队在《iScience》发表了一项开创性研究,通过大规模文本分析揭示了社会-环境建模领域令人惊讶的语言学特征。研究团队收集了14个学科领域约755,000篇论文摘要,运用机器学习方法系统分析了知识主张的确定性程度和数值支持强度。结果显示,流行病模型、综合评估模型(IAMs)和水模型表现出与物理学相当的自信水平,而水模型在数值精确性主张上甚至超越了热力学等经典物理学科。这一发现挑战了传统的科学层级假设,引发了关于模型可信度的深刻反思。
研究团队采用了多项关键技术方法:1) 使用SciBERT机器学习模型从海量摘要中提取知识主张句子;2) 建立包含372个术语的强化词(boosters)和弱化词(hedgers)词典,量化各学科主张强度;3) 开发专门算法识别六类数值表达(整数、小数、百分比等);4) 对978篇水模型文献进行全文敏感性分析(SA)实践评估;5) 采用马氏距离等统计方法识别学科异常值。样本涵盖1990-2022年间Web of Science收录的文献,包括物理学、人文学科和三类社会-环境建模领域。
"社会-环境建模领域展示出物理学式的自信"部分显示,通过分析约500万句知识主张,研究者发现学科间存在明显的确定性梯度:人文学科偏好弱化词体现审慎,而物理学科更倾向强化词。引人注目的是,三类建模领域均位于物理学科区间,其中综合评估模型(IAMs)的自信度增长最快(2010-2022年间增长173%),水模型和气象模型分别增长35%和20%。聚类分析确认了三个清晰的学科群:人文学科、物理学科和社会-环境建模学科,后者与物理学科联系更紧密。
"水模型用比物理学更多的数字支持主张"部分揭示了更惊人的发现。水模型在数值使用强度上显著超越所有物理学科,成为明显的统计异常值(Mahalanobis距离检验)。具体而言:95%的水模型论文使用多达6位小数(物理学仅4位)、5处百分比表述(气象模型3处)和8处整数(热力学7处)。更值得关注的是,水模型论文同时使用多类数值的频率最高,在6-7类数值组合使用上领先所有学科。
"水模型报告的数字缺乏不确定性和SA"部分通过深入分析2,942篇水模型论文发现:仅33%提及"不确定性"或"敏感性"相关术语;在978篇相关论文中,仅30%实施了技术敏感性分析。其中多数(75%)仅分析≤13个参数,且常用一次单因素(OAT)方法——这种方法被SA专家批评为无法充分探索高维参数空间。例如,对含30-44个参数的模型,OAT方法探索的参数空间比例近乎为零(10-24-10-14量级)。研究还发现,90%水模型论文可能未经严格不确定性分析就得出数值结论。
讨论部分提出了"模型例外状态"概念,解释为何社会-环境建模领域能在高不确定性背景下维持强主张。作者对比了"无奇迹论证"——物理学的强主张基于其封闭系统研究和小世界控制能力,而建模领域的成功更多依赖外部因素(如政策影响力)而非内在验证。特别指出水模型的"数学精确性幻觉"问题,即通过过度量化制造虚假精确印象。该研究呼应了Donella Meadows四十年前的警告,呼吁建模领域增强谦逊,更诚实地对待不确定性。
这项研究的意义在于:首次量化揭示了社会-环境建模领域的语言自信与数值使用模式;挑战了科学层级假说的简单二分法;为模型可信度评估提供了实证基准。尤其对政策相关模型(如气候变化预测、水资源管理)具有直接警示意义——当模型数字被过度呈现为确定事实时,可能导致决策风险。研究建议建模领域从物理学借鉴严谨性,同时保持人文学科的反思精神,在精确性与谦逊间寻找平衡点。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号