新闻中心

NEWS

上海仁济医院:手术室智慧管理的方案设计

发布人:蒋琴     发布时间: 2023-10-08 10:01    浏览量:246
  • 上一篇:王兴玲院长谈管理“MDT”助力医院“提质增效”
  • 下一篇:消毒供应中心——过氧化氢低温灭菌监测手段
  •       在医院手术室日常管理中,医护人员需要根据手术过程和结果选择合适的国际疾病分类(ICD)编码,但具体操作时可能存在错选、乱选等问题。本研究引入NLP和DL模型,利用病历文本资料,对ICD编码进行纠错及预测。采用NLP技术对资料进行预处理,包括数据清洗、标注、分词、向量化等,将非结构化、半结构化的文本资料转化为结构化数据;然后使用DL模型对预处理后的数据进行训练。模型基于大量的历史数据学习疾病诊断、手术名称及其他相关字段与ICD编码之间的关系,然后根据这种关系对ICD编码进行纠错,并预测可能的ICD编码。在此基础上,对围手术期各阶段的数据进行循环分析,预测潜在的手术风险,使医护人员能够更好地了解患者的情况和需求,提供更安全的手术环境和更优质的医疗服务,实现对手术室各项业务的精确分析与管理。手术室智慧管理系统功能模块见图1。

    1.png

    图1 系统功能模块


          1.1  ICD编码纠错

          为解决ICD编码错选、乱选的问题,本研究首先使用NLP技术对历史病历中大量非结构化文本数据进行分析,利用BERT(bidirectional encoder representation from transformers)模型对病历文本进行词向量表示,将文本数据转换为数值型数据,并对医疗领域的语料库进行微调。数据结构见表1。语料库来源于本院积累的结构化手术记录数据集,以及基于百度百科和维基百科的文本数据。然后使用支持向量机(support vector machine,SVM)算法进行ICD编码的精确匹配。

    2.png

    表1 数据结构


          1.1.1  系统程序设计

          本研究选用scikit-learn库的SVC函数,划分训练集和测试集,创建SVM模型,使用线性核函数,正则化参数C设为1,激活概率估计,在训练集上训练SVM模型,在测试集上进行预测,输出分类报告,展示模型性能。程序流程见图2。

    3.png


    图2 编码纠错流程


          1.1.2  模型训练与评估

          首先,加载数据,并对ICD编码进行标签编码,以便能够输入到模型中;然后,使用BERT模型将病历文本转换为特征向量,通过并发处理加快速度;使用训练集的特征向量和对应的ICD编码训练SVM模型,并在测试集上进行预测;最后,输出分类报告,以评估模型的性能。分类报告中频数最高的10个ICD编码输出结果见表2。表格中的每一行代表一个手术和ICD编码的匹配结果以及对应编码的性能指标。“手术名称”是手术的名称,“ICD-9-CM编码”是与该手术名称匹配的ICD-9-CM编码。精确度、召回率和F1值等是评估模型性能的指标。精确度、召回率、F1值均>0.8。说明模型较好地实现了手术名称和ICD10编码的精确匹配,性能良好。本研究将NLP和DL技术应用于ICD编码的精确匹配,成功解决了历史数据中ICD编码错选、乱选问题,为手术室的精益化、智慧化运营管理奠定了坚实的基础。

    4.png

    表2 ICD编码匹配输出结果


          1.2  ICD编码预测

          手术数据是医疗数据的重要组成部分,其中ICD编码可以反映手术类型、手术并发症等信息,有助于监测手术安全、预警手术风险等。本研究采用NLP和DL技术对不同科室的手术数据自动进行ICD编码预测,在医护人员选择ICD编码时能自动推荐提醒该科室高频出现的ICD编码。


          1.2.1系统程序设计

          本研究基于DL和NLP技术对手术数据进行特征提取和分类,配合循环神经网络(RNN)、长短期记忆网络(LSTM)和卷积神经网络(CNN)等模型进行训练,并学习历史手术名称与ICD编码的关系,从而根据手术数据自动预测ICD编码。流程见图3。

    5.png

    图3 ICD编码预测程序流程


          1.2.2数据获取与预处理

          本研究采用外科手术数据作为实验数据,每条记录包括患者信息、科室信息、手术名称、手术日期、手术医生、诊断结果、检查检验结果等。每条记录还有一个或多个对应的ICD编码,表示该手术的类型、指征、并发症等信息。第一步使用Python的正则表达式库(re)对原始数据进行清洗;第二步数据预处理,首先对选取的数据进行人工标注并交叉验证,然后使用CountVectorizer方法进行分词,最后使用Tokenizer方法进行数据向量化;第三步划分训练集和测试集,设置测试集的比例为20%,随机种子为42,以确保每次运行代码时得到相同的结果。


          1.2.3模型构建与训练

          本研究使用深度学习模型对数据进行训练,选择LSTM模型,构建包含嵌入层(Embedding层)、LSTM层和全连接层(Dense层)的神经网络。首先,使用Sequential模型构建神经网络,其中Embedding层设置将每个单词的ID转换为密集向量,设置输入长度为500,词嵌入维度为100;LSTM层使用100个LSTM神经元,设置dropout和recurrent_dropout均为0.2,可以在每次更新时随机丢弃20%的输入,以防止过拟合;Dense层作为输出层,使用sigmoid激活函数,只有一个神经元,用于预测ICD编码;并使用二元交叉熵损失函数和Adam优化器进行训练。训练过程中,另使用EarlyStopping防止过拟合,如果在2轮迭代中验证集上的损失没有下降,则停止训练。


          1.2.4模型预测与评估

          使用训练好的模型进行预测,模型根据大量的历史手术信息学习科室信息、个人信息、病史、诊断结果、检验检查结果与手术名称、ICD编码之间的关系,然后根据这种关系预测可能的ICD编码并自动输出。模型对不同手术类型编码的预测性能见表3。本研究基于LSTM的手术数据自动ICD编码预测系统的预测性能较高,准确度、精确度、召回率和F1值大部分高于0.8。但从表3可以看出,对于不同手术类型其预测性能存在差异,其中,腹腔镜下胆囊切除术、腹腔镜下阑尾切除术和开胸心脏瓣膜置换术的预测性能较高,而颅内肿瘤切除术和人工全髋关节置换术等预测性能相对较低,可能与不同手术类型的样本数量有关。在手术室场景下,医护人员可以根据手术报告和本系统模型的ICD编码预测结果,更快地选择ICD编码,显著提高了编码的效率和准确性,同时可以减少编码错误,为手术风险预警与处理提供数据支撑。


    6.png

    表3 对不同手术类型ICD编码的预测性能


          1.3  手术风险预警与处理

          临床手术过程复杂,情况瞬息万变,实时监测患者的生理信号和手术数据,并结合ICD编码的预测模型,可以实时发现并预警可能出现的风险。如模型预警患者在手术过程中可能出现心律失常,医生便能提前准备除颤器或提前配备药物,还可进一步预测风险等级,如预测一名患者存在中度出血风险,另一名患者存在高度心肌缺血风险,可以帮助医生优先处理高风险情况,对比不同风险,做出最优决策。


          1.3.1系统程序设计

          本研究将术前数据和术中数据作为输入特征,结合ICD编码纠错和预测的模型,训练深度神经网络(DNN)模型来预测术中风险。流程见图4。


    7.png

    图4 手术风险预警与处理流程


          1.3.2数据获取与预处理

          本研究使用了两类数据:术前数据和术中数据。术前数据包括患者的基本信息、病史、体格检查、实验室检查、影像学检查等,主要来源于医院电子病历系统,通过接口或文件方式获取。为保证数据质量,需要对数据进行清洗、规范化、缺失值填充等操作。

          术中数据包括患者的生理信号和手术数据,如心率、血压、血氧饱和度、出血量、手术时间等。本研究根据一定的关联或规则进行随机生成或模拟,例如,生理信号可以根据患者的年龄、性别、健康状况等因素进行模拟,手术数据可以根据患者的手术类型、手术时间、手术风险等因素进行模拟。


          1.3.3模型构建与训练

          首先定义DNN序贯模型:Sequential模型是层的线性堆叠,包括一个输入层、两个隐藏层和一个输出层。通过输入层的神经元数量由输入数据的特征数量决定,两个隐藏层的神经元数量可以根据问题的复杂性进行调整。设置第一个全连接层节点数为128,激活函数为ReLU,输入维度为指定的input_dim;第二个全连接层节点数为64,激活函数同上;输出层节点数为1,激活函数为sigmoid,因为本研究的目标是进行二分类任务;编译模型指定损失函数为二元交叉熵,优化器为Adam,性能评估指标为准确率。然后创建投票分类器,使用基于概率的软投票方法,通过集成多个模型的预测结果,选择得票最多的类别作为最终的预测结果。

          划分训练集和测试集。使用训练集数据训练DNN模型,构建补充训练模型并训练集成模型。使用KerasClassifier包装DNN模型,指定训练周期数为100,批次大小为10。然后构建并训练集成模型:SVC模型已经在之前的实验中被训练过,此处补充训练随机森林模型,并进行集成综合。


          1.3.4模型预测与评估

          本研究在测试集上进行预测,基于预测结果评估模型的性能。预测的结果用于风险预警和风险等级评估,为医护人员的决策提供参考。为保证模型的性能,在实际使用中数据收集、特征选择、模型训练和评估、模型优化等步骤需要反复进行。模型部分预测结果见表4。可以看出,本研究设计的模型在大多数样本上都能够预测正确,但也有一些样本预测错误。例如,对于患者2002,模型预测不存在风险,但真实情况是存在风险的。分析其原因,可能是因为该患者的术中数据中没有明显的异常信号,导致模型无法捕捉到潜在的风险。提示模型还需要进一步提高敏感性和鲁棒性,以应对复杂多变的手术场景。


    8.png

    表4 手术风险预警模型预测结果(部分)


    来源:唐灵逸,郑涛,邵维君.基于深度学习与自然语言处理的手术室智慧化管理创新研究[J].中国数字医学,2023,18(08):12-17.

    声明:转载的目的在于传递及分享更多信息,如涉及侵权,请及时联系我们,谢谢!

    医工融合创新中心编辑:蒋琴(实习生)

    医工融合创新中心审核:朱宗达



    欢迎关注医工融合创新中心公众号,一起探讨学习交流。

    1693205491743316.jpg

    1693205503122013.jpg


  • 上一篇:王兴玲院长谈管理“MDT”助力医院“提质增效”
  • 下一篇:消毒供应中心——过氧化氢低温灭菌监测手段
  •