在最近发布在medRxiv*预印本服务器上的一项研究中,研究人员利用医疗记录纵向信息人工智能系统(MERLIN)平台开发了一种基于机器学习的模型,用于纵向子痫前期风险评估。
*重要提示:medRxiv发布的初步科学报告未经同行评议,因此不应被视为结论性、指导临床实践/健康相关行为,也不应被视为既定信息。
背景
子痫前期是妊娠20.0周后引起高血压和蛋白尿的一种特殊疾病,使妊娠复杂化并导致孕产妇死亡。
蛋白尿、肝酶升高、肺水肿、惊厥和死亡均可因终末器官损伤加重而发生。
先兆子痫是医源性早产的主要原因,伴随婴儿发病率和死亡,因为没有明确的治疗方法。
尽管有大量的临床研究,现有的预测方法无法检测到子痫前期风险个体。此外,对怀孕期间的风险轨迹或风险变化速度一无所知。
一个关于这项研究
在本研究中,研究人员设计并验证了MERLIN机器学习工具来估计妊娠期间子痫前期风险。
该研究包括一大批妇女,她们在2015年2月至2023年6月期间在新英格兰的两家三级护理医院和六家社区护理中心分娩。
分析了社会人口统计学、家族史、临床诊断、生命体征和实验室报告。该研究小组只纳入了妊娠14.0周前就诊次数≥1.0次的产妇。在妊娠14.0、20.0、24.0、28.0、32.0、36.0和39.0周及住院分娩时建立8个数据集。
该团队开发了血压测量,ICD代码和实验室结果的组合,以确定数据集中的子痫前期表型。使用线性回归、xgboost随机森林分类器、深度神经网络(DNN)和弹性网络模型来开发该工具并评估其性能。
曲线下面积(AUC)指标用于估计工具的预测能力。该模型使用400.0子痫前期患者的电子健康记录进行了验证,并由两位临床专家进行了审查。
训练和测试数据集分别占病例的80%和20%。团队对训练集进行了5.0倍交叉验证,以确定超参数,然后使用最合适的组合来确定测试指标。
Shapley值用于解释模型输出。此外,从研究开始到2023年5月1日,检索了Web of Science、MEDLINE和PubMed等数据库。
结果
在120,757例患者中,先兆子痫发生率为5.7%(6,920例)。模型的AUC值在0.7到0.9之间,这是外部验证的。一些变量之间的关联是非线性和复杂的;此外,在怀孕期间,风险估计值的相对统计意义有所不同。
与预测妊娠早期子痫前期风险的标准相比,基于机器学习的工具检测到的子痫前期风险患者增加了49%。
此外,在测试数据集上使用xgboost模型预测14.0周时,25% (n=5,624)的个体将符合阿司匹林预防的条件,而15% (n=3,295)的个体将符合美国妇产科学院(ACOG)的标准。
使用新的模型,额外的2329个人将符合条件。如果阿司匹林预防可以预防高危人群中62.0%的先兆子痫,那么每10000名孕妇中有28例(共66例)的早发性子痫有可能通过更新的风险预测得到预防。
测试涉及深度学习和机器学习的不同预测模型类型显示出很高的估计能力。
与正常人群相比,被诊断为子痫前期的人群中黑人(17.0%对9.0%)和西班牙裔(19.0%对15.0%)的比例明显更高。
此外,子痫前期患者比非子痫前期患者有更高的家族性高血压的可能性,更高的最大舒张压和收缩压,怀孕期间体重增加。
在14.0周时,最具代表性的特征是妊娠间隔时间长和慢性高血压。随着胎龄的增加,舒张压和收缩压、实验室报告和生命体征是主要的影响因素。
此外,如果妊娠期最大收缩压低于140.0 mm Hg,蛋白尿不太可能与子痫前期诊断相关;然而,在阈值以上,蛋白尿具有很高的预测性。
20岁以下和35岁以上的人患先兆子痫的风险更高。妊娠中期较高的红细胞计数与较高的子痫前期风险相关。
总共有13项研究使用临床参数结合机器学习来预测子痫前期风险,其中6项包括子宫动脉搏动指数、血清学胎盘生长因子(PIGF)和妊娠相关血清蛋白A等生物标志物;两项研究纳入了超过10万人的不同群体;两项相关研究使用电子健康记录进行了纵向估计。
然而,大多数研究深度有限,引起数据泄漏问题,过度拟合,缺乏通用性。
基于本研究结果,子痫前期风险预测模型可以帮助早期识别高危人群,实现妊娠期间的纵向风险评估。准确的风险预测有助于临床治疗、阿司匹林预防、监测和护理升级。人工智能可以加强围产期护理,减少医源性早产。
*重要提示:medRxiv发布的初步科学报告未经同行评议,因此不应被视为结论性、指导临床实践/健康相关行为,也不应被视为既定信息。