突破!神经多任务逻辑回归模型精准预测交界性卵巢肿瘤复发,改写诊疗格局?

【字体: 时间:2025年02月19日 来源:BMC Cancer 3.4

编辑推荐:

  为解决交界性卵巢肿瘤(BOT)复发预测难题,中国医科大学附属盛京医院的研究人员开展基于神经多任务逻辑回归(N-MTLR)模型预测 BOT 复发的研究。结果显示 N-MTLR 模型优于传统 Cox 模型。推荐阅读,助力相关研究突破。

  
在女性的健康世界里,卵巢肿瘤是个不得不重视的话题。其中,交界性卵巢肿瘤(Borderline Ovarian Tumor,BOT)虽然不像卵巢癌那样 “穷凶极恶”,但也有它的 “小脾气”。世界卫生组织给 BOT 的定义是卵巢肿瘤呈现出比良性肿瘤更明显的上皮细胞异常增生,但又没有出现破坏性的间质浸润。它在卵巢上皮肿瘤里占比 10 - 15%,大部分能在早期被发现,不过它的复发率在 5 - 20% 之间,这可让医生们头疼不已。

随着生活质量的提高,还有咱们国家二孩政策的实施,越来越多的女性患者希望能保留生育功能。对于这些患者来说,卵巢功能和生育力的保护就变得至关重要。而要做到这些,关键得搞清楚哪些患者容易复发,然后制定出合适的随访计划。可现有的预测方法都不太给力,之前研究找到的像国际妇产科联盟(FIGO)分期、手术类型、肿瘤包膜完整性和血清糖类抗原 125(CA125)这些复发因素,在实际应用中并不能准确地识别出哪些患者有复发风险。那些用逻辑回归开发的预测模型,预测效果也不太理想。这是因为肿瘤复发和一些预后因素之间存在复杂的非线性关系,传统的模型很难搞定。

就在大家为这个问题发愁的时候,中国医科大学附属盛京医院的研究人员挺身而出,在《BMC Cancer》期刊上发表了一篇名为 “A predictive model for recurrence in patients with borderline ovarian tumor based on neural multi - task logistic regression” 的论文。他们就像一群勇敢的探险家,在医学的未知领域里探索,想要找到预测 BOT 复发的更好方法。经过一番努力,他们得出了一个让人振奋的结论:基于神经多任务逻辑回归(N - MTLR)开发的模型,在预测 BOT 复发方面,比传统的 Cox 回归模型更厉害!这个发现意义重大,它能帮助医生更准确地找到那些高复发风险的患者,然后进行密切监测,给出更合适的治疗方案,对于有生育需求的女性,也能更好地帮助她们在低复发风险的前提下保留生育功能,完成生育计划。

那研究人员是怎么做到的呢?他们用了好几个关键的技术方法。首先,因为 BOT 复发患者数量少,数据不平衡,就像一个天平两边重量差很多,这样会影响模型的准确性。于是,他们用了合成少数过采样技术(SMOTE),这个技术就像是给少的那一方增加重量,让天平重新平衡。它通过在特征空间里合成新的少数样本,让数据变得更均衡。然后,他们把这些平衡后的数据按照 8 : 2 的比例,分成了训练集和验证集。在构建模型时,用单变量和多变量 Cox 回归分析来筛选变量,找出和 BOT 复发相关的因素,再用这些因素构建 Cox 回归模型。对于 N - MTLR 模型,他们用 Spearman 相关性筛选变量,然后用 Python 语言,借助 numpy、sklearn 和 pysurvival 这些工具包,搭建了一个包含输入层、三层隐藏层和输出层的神经网络模型。最后,用时间依赖的受试者工作特征曲线下面积(tdAUC)、准确率、灵敏度、特异性、阳性预测值(PPV)和阴性预测值(NPV)这些指标,来比较 N - MTLR 模型和 Cox 回归模型的预测性能。

下面咱们来看看具体的研究结果。

患者特征


从 2011 年 5 月到 2022 年 8 月,中国医科大学附属盛京医院有 1171 位 BOT 患者接受了初次手术治疗。但是呢,有 370 位患者的病理结果显示有局灶性恶性病变,65 位患者失访了,最后只有 736 位患者被纳入了研究。在这 736 位患者里,84 位出现了复发,被分到复发组,剩下 652 位没复发的在非复发组,两组人数比例差不多是 1 : 7.8 。研究人员对这些患者随访了 1 - 14.42 年,中位随访时间是 4.25 年,总体复发率是 11.41%。用 SMOTE 平衡数据后,一共有 1304 位患者,复发组和非复发组各有 652 位。然后又把这些数据随机分成了训练集(1043 位患者)和验证集(261 位患者)。而且,训练集和验证集的临床特征没有统计学差异,这说明它们就像是从同一个 “大家庭” 里选出来的,很有代表性。

Cox 模型变量选择和开发


研究人员对训练集进行单变量和多变量 Cox 回归分析后发现,和 BOT 复发显著相关的临床因素有好多呢,像绝经前、腹腔镜手术、肿瘤包膜破裂、临床分期高、没有进行淋巴结清扫、双侧肿瘤和保留生育功能手术(FSS)。比如说,绝经前患者的复发风险比绝经后患者高 1.876 倍;做腹腔镜手术的患者复发风险是开腹手术患者的 1.379 倍。基于这些多变量分析找到的独立预测因素,研究人员构建了 Cox 回归模型,还画了森林图和列线图,这样就能更直观地看出各个因素对复发风险的影响,也能计算出无复发生存(RFS)的概率。

神经多任务逻辑回归模型变量选择和开发


N - MTLR 模型就像一个精心搭建的 “小城堡”,有输入层、三层隐藏层和输出层。隐藏层里分别有 128、64 和 32 个神经元,总共 224 个神经元。研究人员先对训练集里的 34 个特征进行相关性筛选,就像在一堆宝石里挑选最闪亮的,最后选了 10 个变量放进 N - MTLR 模型,包括 FSS、手术完整性、合并症、FIGO 分期、年龄、大网膜切除术、淋巴结切除术、产次、绝经状态和腹膜种植。为了防止模型 “学偏了”,出现过拟合的情况,他们还用了 L2 正则化和 Dropout 技术。通过五折交叉验证发现,这个模型的 tdAUC 超过 0.75,其他预测性能指标也都不错,说明这个模型很 “靠谱”,对 BOT 患者复发预测很稳健。最后,他们还确定了模型的最优参数,让模型的性能达到最佳状态。

预测性能比较


在比较 N - MTLR 模型和 Cox 回归模型的预测性能时,研究人员发现,在 2 年、4 年和 7 年这些时间点上,N - MTLR 模型在 AUC、准确率、特异性、PPV 和 NPV 这些指标上,都比 Cox 回归模型表现得更好。为了进一步证明 N - MTLR 模型的厉害,他们还和随机生存森林以及基于神经网络(NN - based)的生存模型进行比较,结果 N - MTLR 模型依然表现出色。而且,决策曲线分析(DCA)的结果也显示,N - MTLR 模型的净效益是正的,这意味着它在医疗资源利用和临床决策方面都很有效。

综合这些研究结果,我们可以看到,N - MTLR 模型确实在预测 BOT 复发上更胜一筹。它找到了更多和 BOT 复发相关的预测因素,能更全面地评估患者的复发风险。对于那些有生育需求的患者来说,这个模型也能帮医生更好地选择适合 FSS 的患者,制定合理的随访计划。如果患者做完 FSS,完成了生育计划,而且有高复发风险,比如有病理证实的腹膜种植、更高的 FIGO 分期,尤其是那些分期不完全的 FSS 患者,医生就可以建议他们尽早做根治性手术,降低复发的可能性。对于那些能坚持随访的高复发风险患者,就可以进行长期随访,时刻关注病情变化。

不过呢,这项研究也有一些小遗憾。它是单中心的回顾性研究,临床信息是通过病历和电话随访收集的,可能会存在一些回顾性偏差,也没办法控制所有的混杂变量。虽然研究人员用 Spearman 相关性分析筛选变量,模型训练也避免了人为干扰,但还是有点小不足。而且,研究用的是机构数据结合 SMOTE 采样,样本数量可能不够大,随访时间也有点短,这可能会影响分析结果。

但不管怎么说,这项研究的意义重大。它就像一盏明灯,为 BOT 患者的诊疗照亮了前进的道路。研究人员开发的 N - MTLR 模型,在精准医学的时代背景下,为预测 BOT 复发提供了更有效的工具。未来,研究人员还打算把临床知识和神经网络结合起来,进一步优化模型,让预测准确性和可解释性达到更好的平衡。他们也在收集更多 BOT 患者的信息,准备进行外部验证,相信在他们的努力下,会给 BOT 患者带来更多的希望,让女性朋友们能更好地对抗这个疾病,守护自己的健康。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号