评估ChatGPT从临床记录中提取结构化数据的效果_试管婴儿成功率_试管婴儿多少钱

在npj数字医学最近发表的一项研究中，研究人员评估了ChatGPT从非结构化临床记录中提取结构化数据的能力。

医学中的人工智能

基于大语言的模型(llm)，包括ChatGPT等生成预训练转换器(GPT)人工智能(AI)模型，用于医疗保健领域，以改善患者与临床医生的沟通。

传统的自然语言处理(NLP)方法，如深度学习，需要针对特定问题的注释和模型训练。然而，缺乏人工注释的数据，再加上与这些模型相关的费用，使得构建这些算法变得困难。

因此，像ChatGPT这样的llm通过依赖逻辑推理和知识来辅助语言处理，提供了一个可行的替代方案。

一个关于这项研究

在本研究中，研究人员创建了一种基于llm的方法，用于从临床记录中提取结构化数据，随后将非结构化文本转换为结构化和可分析的数据。为此，使用了ChatGPT 3.50涡轮模型，因为它与特定的通用人工智能(AGI)功能相关联。

概述了使用ChatGPT从病理报告中提取结构化数据的过程和框架。使用OpenAI API对ChatGPT服务进行批量查询的说明，应用于我们研究中的大量临床记录-病理报告。b将ChatGPT集成到实际应用程序中的通用框架。

使用R程序将来自癌症数字幻灯片档案(CDSA)和癌症基因组图谱(TCGA)的1026份肺肿瘤病理报告和191份儿童骨肉瘤报告转换为文本，CDSA和TCGA分别作为训练集和测试集。文本数据随后使用OpenAI API进行分析，该API根据特定提示提取结构化数据。

ChatGPT API用于执行批处理查询，然后进行提示工程以调用GPT服务。后处理包括解析和清理GPT输出，根据参考数据评估GPT结果，以及从领域专家那里获得反馈。这些过程旨在从非结构化病理报告中提取TNM分期和组织学类型作为结构化属性的信息。分配给ChatGPT的任务包括估计目标属性、评估确定性水平、识别关键证据和生成摘要。

从CDSA数据库获得的99份报告中，21份因扫描质量低、数据内容接近空白或缺失报告而被排除。这导致了总共78份真正的病理报告用于训练提示。为了评估模型的性能，从cBioPortal获得了1,024份病理报告，其中97份因与训练数据重叠而被淘汰。

ChatGPT被指示利用第七版美国癌症联合委员会(AJCC)癌症分期手册作为参考。数据分析包括原发性肿瘤(pT)和淋巴结(pN)分期、组织学类型和肿瘤分期。将ChatGPT的性能与关键词搜索算法和基于深度学习的命名实体识别(NER)方法进行了比较。

进行了详细的错误分析，以确定错误分类的类型和潜在原因。GPT版本3.50-Turbos和GPT-4的性能也进行了比较。