比较不同方法处理纵向多项目患者报告结局缺失数据:模拟研究 —— 为精准医疗数据处理提供关键指引

《Health and Quality of Life Outcomes》:Comparison of different approaches in handling missing data in longitudinal multiple-item patient-reported outcomes: a simulation study

【字体: 时间:2025年04月06日 来源:Health and Quality of Life Outcomes 3.2

编辑推荐:

  在临床研究中,患者报告结局(PROs)数据常存在缺失值,影响分析准确性。研究人员开展了不同方法处理 PRO 缺失数据的模拟研究。结果显示不同方法在不同缺失场景各有优劣,该研究为选择合适处理方法提供依据,提升分析结果可靠性。

  在医疗研究的舞台上,患者报告结局(Patient-Reported Outcomes,PROs)是至关重要的 “演员”,它直接由患者提供,能反映患者真实的体验和感受,在以患者为中心的药物研发等临床研究中占据着重要地位,常作为主要或次要终点。然而,现实总是充满挑战,PROs 数据缺失的问题就像一场 “暴风雨”,频繁袭击着临床研究。患者可能因为各种原因,无法完整报告所有 PRO 测量指标,或是遗漏特定项目。这种数据缺失现象给数据分析带来了巨大的麻烦,它会增大标准误差,降低统计功效,引入治疗效果估计偏差,严重影响研究结论的科学性和价值。令人遗憾的是,许多研究对这个问题重视不足,处理缺失数据的方法也存在缺陷。
为了在这场与数据缺失的 “战斗” 中取得胜利,来自南方医科大学的研究人员挺身而出。他们聚焦于如何处理纵向多项目患者报告结局缺失数据这一关键问题,展开了一项模拟研究,相关成果发表在《Health and Quality of Life Outcomes》杂志上。

在研究过程中,研究人员运用了多种关键技术方法。他们采用真实完整的多项目 PRO 数据集,通过模拟不同缺失率、机制和模式,构建了 90 种不同的缺失场景。在处理缺失数据时,比较了 8 种方法,包括混合模型重复测量(Mixed Model for Repeated Measures,MMRM)直接分析及在项目水平的预测填补、多重填补法(Multiple Imputation by Chained Equations,MICE)在综合得分和项目水平的填补、3 种基于对照的模式混合模型(Pattern Mixture Models,PPMs)在项目水平的填补以及末次观测值结转(Last Observation Carried Forward,LOCF)在项目水平的填补。所有模拟和分析均借助 R 4.2.2 软件完成,利用 “mmrm” 和 “mice” 等 R 包实现模拟和填补操作。

研究结果


  1. 误差指标分析:研究发现,随着缺失率上升,所有方法的平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error,MRE)和均方根误差(Root Mean Square Error,RMSE)都增大,处理效应估计偏差增加,统计功效降低,且在单调缺失数据情况下更明显。在不同缺失机制下,大多数方法在非单调缺失数据中的误差指标小于单调缺失数据。在处理误差方面,项目水平填补的方法优于综合得分水平填补,其中 MMRM 在项目水平填补时误差最低(MNAR 机制单调缺失情况除外),MICE 在项目水平填补时误差也较低,而 MICE 在综合得分水平填补(SCORE-MICE)的表现最差。
  2. I 型错误分析:当缺失率大于 20% 时,SCORE-MICE 倾向于保守(I 型错误小于区间下限),其他方法在各种场景下总体能较好控制 I 型错误。
  3. 统计功效分析:随着缺失率增加,统计功效下降。MMRM、MICE 和 PPMs 方法在各种场景下的统计功效显著高于 MMRMD 和 SCORE-MICE 方法。在单位无应答比例为 0.2 或 0.5 时,MICE、PPMs 和 MMRM 在单调和非单调缺失情况下的统计功效较高;单位无应答比例为 0.8 时,PPMs 在 MNAR 机制下统计功效最高。

研究结论与讨论


综合研究结果,该研究明确了不同方法处理 PRO 缺失数据的适用场景。在 MNAR 机制的单调缺失情况下,PPMs(J2R、CR 和 CIR)更适用,因其在不同单位无应答比例下都具有较高统计功效和较小偏差;而 MMRM 和 MICE 则更适合 MCAR 和 MAR 机制的非单调缺失情况。这一研究结果为科研人员在处理 PRO 缺失数据时选择合适方法提供了重要参考,有助于提高数据分析的准确性和研究结论的可靠性。

此外,研究还强调了项目水平填补在保持数据完整性和分析准确性方面的重要性。即使在缺失率高达 30% 的情况下,项目水平填补仍比综合得分水平填补更具优势。同时,研究发现单调和非单调缺失对填补方法性能影响不同,多数方法在非单调缺失情况下表现更优。不过,研究也存在一定局限性,如模拟数据基于特定 RCT 数据集,模拟场景有限,真实世界情况更为复杂,研究结果可能无法完全适用于所有情况。未来研究可进一步探索更多替代方法,如期望最大化算法和贝叶斯方法等,以更全面地理解和处理 PRO 缺失数据问题。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号