金阳教授:人工智能如何赋能肺结节的临床决策?如何辅助肺叶精准分割、结节检测与鉴别诊断、分析疗效及预后?
来源: 国际呼吸杂志 08-11


摘要


随着肺结节检出率越来越高,肺结节临床管理的规范化对实现肺癌的早诊早治至关重要。近年来,人工智能(AI)关于肺结节的研究在诊疗及预后分析中不断深入,AI对医学图像的处理分析以及整合多模态数据的能力使得AI在肺结节的临床管理决策中发挥着越来越大的价值。本文旨在探讨AI在辅助肺结节多个临床决策方面的研究现状。


【关键词】肺结节;人工智能;医学图像;临床决策;精准医学


随着低剂量CT筛查的普及,肺结节的检出率不断增加,高分辨率CT的应用也使得肺部小结节的形态学特征得到更清晰的展现。我国2021年的一项大规模前瞻性队列研究发现,一次性低剂量CT筛查与肺癌病死率下降31%、全因死亡率下降32%相关[1]。肺结节表现出不同的特征,包括结节数量、大小、形态、边缘、瘤-肺界面等外观特征,以及密度、结构等内部特征[2]。实性成分、分叶状、毛刺征等特征的出现代表恶性结节的可能性更高,因此准确检测并识别结节的特征对放射科医生来说尤为重要,但肺结节的异质性和多变性使得对其的诊断变得复杂且困难[3]


近年来人工智能(artificial intelligence, AI)迅速兴起并应用于各种医疗场景,它在医疗数据处理方面展现出了强大的优势。随着计算能力的提高和强大的图形处理单元的出现,传统的机器学习及拓展分支深度学习对大型医学图像数据集的分析,使得AI技术在辅助肺结节早期检测和诊断方面得到了广泛应用[4]。AI可以在整个肺癌筛查工作流程中发挥作用,包括减少辐射剂量、个性化筛查间隔[5]。本文重点总结了AI在辅助肺结节临床决策中的应用,包括肺部分割、结节检测、结节分类、疗效及预后分析。


一、AI辅助肺叶精准分割


在肺结节检测之前进行肺叶分割的目的是准确定义肺叶的解剖结构,从而区分与肺结节相关的区域。但是个体之间的肺叶形状和大小存在解剖学差异,这种差异通常与年龄、性别、身高和身体质量指数相关[6]。许多算法专门用于肺部分割,包括基于外观纹理信息和形状特征定义肺部边界,基于解剖学知识识别气道和血管从而确认肺叶裂隙[7]。Soliman等[8]提出了一种可学习的多图随机场系统,该系统集成了视觉外观和自适应肺部形状的独立子模型,对胸部CT图像进行病理肺和健康肺的分割。Dice指数为98.5%,可学习模型与影像科专家人工分割之间的平均重叠率为98.0%。Fischer等[9]在AI-RAD配套框架中,将重建的三维CT图像作为输入,通过对抗性神经网络训练增强了全自动AI算法对肺叶的分割性能。


近来深度学习算法,尤其是卷积神经网络(convolutional neural network,CNN)在CT图像的分析中发挥了重要作用,多种CNN算法被用于肺部分割。Park等[10]使用3D U-Net设计了一种完全自动化的肺叶分割方法,该方法使用内部和外部数据集进行了严格验证,展现出了较高的精度和计算效率,并且可以在临床环境中进行调整以解决严重肺部疾病的肺叶分割问题。在Pang等[11]的另一项研究中,基于nnU-Net构建了一种分割模型,能够从CT图像中自动识别肺叶切除前后的肺叶,从而用于肺癌患者肺叶切除后的管理。


以上研究表明,AI算法利用CT图像进行高精度全自动肺叶分割,在肺功能测量、局部图像分析和手术规划应用中有着巨大的潜力[12]。但在临床应用中,肺结节自动分割仍面临多种困难,包括肺结节的特征异质性阻碍了精确分割,分割结果的可解释性不足导致分割算法不容易整合到临床常规诊断中,以及分割目标和背景像素不平衡、数据集缺失、CT成像引起的固有噪声等[13]。总体而言,高质量的CT图像数据有助于提高模型性能,设计合理的算法更好地获取上下文信息以及整合注意力机制是肺结节分割任务的关键,在实验设计中确定分割算法的结果与放射科医生诊断的可解释性特征之间的关系对实现算法在临床中的应用至关重要[14]


二、AI辅助肺结节检测


AI算法在肺结节检测中显示出较高的灵敏度(83%~97%)和准确度(82%~98%)[15]。识别候选肺结节并从中准确筛选出阳性肺结节是结节检测的2个连续过程。在深度学习出现之前,特征工程算法通常应用于结节检测[16-17],通过从CT图像中手动提取结节特征,包括强度、纹理和形态,然后作为机器学习分类器的输入。相比之下,基于CNN的方法不依赖于人工提取结节特征,拥有高度自动化能力,最大限度地减少了人工干预的需要[18]。许多研究探索了基于深度学习的肺结节检测工具的性能,基础算法包括U-Net、区域生成网络、残差网络(residual networks,ResNet)等[19-20]。Cai等[21]利用特征金字塔网络从CT数据中提取特征图,然后将其输入基于ResNet-50架构的Mask R-CNN中,使用带有特征图的区域生成网络识别结节边界,该方法灵敏度达到88.7%。Yuan等[22]设计了一种多分支分类网络,将结构化和非结构化数据进行多模态特征融合,来实现对肺结节的检测和分类,该网络利用3D ECA-ResNet对提取的特征进行动态调整。


在检测肺结节的过程中降低假阳性率对于提高结节检测的整体准确度至关重要,但由于肺结节的大小、形态甚至分辨率各不相同,结节周围的纹理环境复杂,包括血管、淋巴结以及与肺结节高度相似的其他病理组织,使得降低假阳性率面临一些挑战[23]。Zuo等[24]建议使用嵌入式多分支3D CNN来减少误判,每个分支处理不同级别的特征图,使模型能够更轻松地区分不同分辨率和大小的肺结节,在验证集中该模型的准确度和特异度分别为97.8%和87.7%。Yuan等[25]构建的3D CNN模型通过层次结构有效提取候选结节的空间特征信息,并将对应于3种感受野的3条路径串联,从而更充分地提取和融合特征信息,以动态适应肺结节形状、大小和背景的差异,该方法在肺结节检测中有效降低了假阳性率。


上述研究展现出为了应对以高灵敏度、低假阳性率准确检测肺结节的巨大挑战,AI辅助检测技术不断发展进步。目前,基于深度学习的算法对肺结节的检测优于放射科医生,尤其是对较小的结节,但大多数可用的软件需要放射科医生审查所有由AI识别出的候选结节,以确定是否为真正的结节。为了公平比较各种检测模型的性能,还需要在相同的大规模数据集中对其进行验证和测试[26]。然而,特征分析的准确性和再现性本质上取决于图像采集和重建参数的选择,目前还未实现CT图像采集的标准化,图像异质性仍是阻碍分析算法大规模应用的主要原因之一[27]。提供可公开获得的高质量临床和影像数据集用于模型训练和验证,有助于测试模型对不同图像采集协议的适应性。


三、AI辅助肺结节鉴别诊断


肺结节的良恶性鉴别诊断是肺癌筛查的核心部分。AI系统能够协助放射科医生快速找到疑似结节并提供诊断意见,以减少误诊和漏诊。传统分类器很大程度上依赖于对疾病明确定义的特征进行图像处理,当手动选择的特征集不恰当或不完整时会带来负面影响[26]。Tammemagi等[28]基于CIRRUS计算机辅助检测系统导出肺结节的平均直径和体积,用于多变量逻辑回归模型构建,来预测结节恶性概率,模型的预测性能在训练集和验证集中表现出色。但不同的计算机辅助检测软件的测量结果会有显著差异,因此尚不清楚模型性能是否会因使用的计算机辅助检测系统不同而有所改变。He等[29]提出了一种联合临床信息、影像学和游离DNA甲基化生物标志物的PulmoSeek Plus模型对早期肺结节进行危险分层,能够减少不必要的手术和避免治疗延迟。基于CNN的深度学习分类器高度自动化,从数据中学习特征并自动提取特征,无缝集成了特征计算、选择和组合过程以完成分类任务[30]。Xie等[31]利用基于多视图的协作深度模型来区分良恶性肺结节,该模型将三维结节分为9个固定视图,对每个视图构建子模型。为了增强结节整体外观、体素和形态异质性的表征,为每个子模型设计了3种类型的图片块,并用于微调3个预训练的ResNet-50网络。使用源自误差反向传播的自适应加权方法对9个子模型进行集成,并采用惩罚损失函数来降低假阴性率,同时对结果的影响最小。该方法的准确度达到91.6%,受试者操作特征曲线下面积(area under the curve,AUC)达到0.957。


与传统的机器学习算法获得的知识相比,深度学习算法从其他领域获得的知识可以更容易地应用到肺结节鉴别诊断领域。Bonavita等[32]利用放射科医生对肺结节的注释,开发了一种基于3D CNN的恶性肿瘤分类器,该分类器被整合到一个端到端的自动化肺癌检测流程中,并将其性能与基础流程的性能进行比较,使用F1加权评分量化结节分类器的贡献,结果表明这些预测模型的集成提高了恶性肺结节预测的准确度。与自然图像相比,医学图像的数量远远不足,这在一定程度上限制了CNN的发展。而迁移学习算法能够将在其他计算机视觉任务上训练的CNN应用于解决新的或相关的问题,从而减少对大量训练数据的需求,加速深度学习中最耗时的训练过程[33]。Harsono等[34]开发了I3DR-Net模型,将在多尺度三维胸部CT扫描数据集上预训练的膨胀三维CNN与特征金字塔网络相结合,I3DR-Net在公共和私有数据集的肺结节分类任务中AUC分别为0.818和0.704。


从上述研究可以看出,计算机辅助精准区分良恶性肺结节的技术从传统的计算机视觉算法发展到端到端的深度学习算法,已经成为临床工作辅助诊断中强有力的决策支持方法。有研究表明,基于AI的CT扫描真阳性结节诊断率(98.54%)显著高于放射科医生人工诊断率(46.53%)[35]。AI分类可以通过减少不必要的良性肺结节检查、缩短诊断恶性结节的时间和减少不同阅片者之间的差异来优化肺结节的临床管理[36]。未来,将AI输出的结果与现有的诊疗指南相结合,可以为肺结节管理提供更好的框架。


四、AI辅助肺结节疗效及预后分析


早期肺癌的治疗选择包括手术切除、立体定向放射治疗、化疗等,驱动突变靶向治疗和检查点阻断免疫治疗等更新的治疗方案给患者带来了希望,但较高的治疗费用、耐药率高和相关并发症的出现需要在对患者的选择上更有针对性[37]。Wang等[38]提出了一个全自动的AI系统,从CT图像中挖掘全肺信息,来预测肺癌患者针对表皮生长因子受体酪氨酸激酶抑制剂治疗的耐药风险。Yang等[39]将放射组学特征和临床病理数据整合构建了列线图模型,该模型在预测非小细胞肺癌(non-small cell lung cancer,NSCLC)患者对免疫检查点抑制剂治疗的反应和结果方面也表现出色。在另一项研究中,Vanguri等[40]开发了一种基于动态深度注意力的掩膜多实例学习模型,以预测晚期NSCLC患者对阻断程序性死亡受体1/程序性死亡受体配体1免疫治疗的反应,该风险预测模型使用机器学习方法将医学影像、组织病理切片、基因组学等多模态信息整合集成,AUC达到0.80。基于AI的数字病理在提高病理诊断的准确度、可重复性和效率,以及减少医生工作量方面表现出巨大潜力,可用于肿瘤检测、分级等任务,有助于预测治疗的疗效[41]。Choi等[42]利用802张NSCLC数字病理图像基于AI建立的程序性死亡受体配体1肿瘤细胞阳性比例评分分析仪可以预测患者对免疫治疗的反应,经过AI辅助后,病理医生进行肿瘤细胞阳性比例评分分类的整体一致性从81.4%提升至90.2%。


针对肺癌患者的预后,Yu等[43]从2 480张肺腺癌和鳞状细胞癌患者的HE染色组织病理学全切片图像中提取了9 879个定量图像特征,并使用正则化机器学习方法选择最有意义的特征,分别预测腺癌和鳞状细胞癌患者的短期和长期生存。另一项研究利用深度学习方法从HE染色病理图像中分割出肿瘤细胞、间质细胞、淋巴细胞、巨噬细胞和红细胞的细胞核以及核碎裂,并对细胞核进行鉴定和分类,提取了48个表征肿瘤微环境的细胞空间组织相关特征,利用这些特征构建了肺腺癌患者预后模型,预测出的高危组总体生存率显著差于低危组[44]。Mazzaschi等[45]提取的与肿瘤免疫微环境相关的影像组学特征与临床病理特征相结合,可以很好地预测NSCLC患者接受手术切除后的预后。Wang等[46]使用PyRadiomics从肿瘤内二维区域、三维区域和瘤周区域提取影像组学特征,选择最佳特征对临床和病理分期为ⅠA期的NSCLC患者进行个体化生存风险分层,在外部验证集中3年和5年生存的AUC分别为0.76和0.75。另一种类型的神经网络——图神经网络,靠图中节点之间的信息传递来捕捉图中的依赖关系,是一种链接主义模型[47]。Lian等[48]提出了一种基于图神经网络的模型,利用视觉变压器获得CT图像特征,并将影像学和非影像学数据分别嵌入神经网络,对早期NSCLC患者的总生存期和复发风险进行分类,该模型在外部数据集上的性能明显优于TNM分期。


以上研究表明,除了医学影像图片,病理切片也具有丰富的信息,可以帮助判断肺癌患者的疗效及预后。然而,AI在病理学中的应用仍存在一些限制和挑战,标本处理和切片染色的异质性会影响诊断性能,AI无法解决复杂的病理诊断问题,无法像医生那样解释病理和机制。数字病理扫描仪、图像存储、图像分析软件和支持系统的成本相对较高,导致AI可应用的场景较少[35]。未来,需要研究者和企业建立标准数据库,统一规范并生成行业标准。同时,利用AI对多模态信息进行融合,能够更好地辅助临床决策,促进精准医疗,并进一步揭示各模态数据之间的联系,从而确定诊断或预后生物标志物,改善患者的风险分层,预测不良治疗结果以指导患者临床管理[49]。在这一背景下由跨学科专家组制定的伦理和监管框架将至关重要。


五、展望与挑战


CT图像是肺结节相关AI模型构建的关键基础,因此推进高质量CT筛查也是至关重要的,可采取的措施包括建立全民筛查项目质量评估指标,完善肺结节检出后的追踪和管理方案,整合AI和生物标志物提高对CT筛查发现的可疑病变的预测准确度,标准化高质量的AI协议从而大幅降低成本、缩短放射科医生报告时间、制定个性化的CT筛查间隔时间[50]


AI作为一种创新技术,可以完成人类无法完成的重复而繁琐的任务,大大减少临床医生的工作量。此外,AI还有助于整合各种数据并自动化预测过程,从而实现肺结节患者的个性化治疗。目前有各种研究探讨了AI在肺结节检测、分类、疗效和预后分析中的应用,虽然这些AI模型在其特定的使用场景下表现出优越的性能,但通常难以有效地推广到其他中心的应用中。泛化能力差会增加误诊和漏诊的可能性,对患者的健康和后续治疗策略的选择以及预后情况构成重大风险。一些机器学习和深度学习算法由于缺乏对预测过程的解释而被视为“黑匣子”,导致了对其输出结果的不信任[51]


同时,基于AI的特征识别方法缺乏标准化,导致其临床应用受到限制。鉴于各种医学扫描设备在不同环境下运行,涉及多种成像模式,这些因素可能会影响AI模型的普遍适用性,因此深入探索扫描参数和图像重建技术对模型性能的具体影响,然后对这些不同的设备设置进行优化,可能会增强模型的泛化能力。未来的研究应该集中于基于AI算法的大规模测试,以及启动多中心临床研究,以验证AI模型在改善患者结局方面的有效性。AI模型的局限性和挑战不应使研究者感到恐惧,而应激励研究者加快发展并转化为临床实践。未来几十年,AI仍将在肺结节辅助诊疗中发挥重要作用,为患者提供服务。


(参考文献略)


作者:谭学耘 夏慧 曹雅淇 汪速飞 金阳;单位:华中科技大学同济医学院附属协和医院呼吸与危重症医学科 国家卫健委呼吸疾病重点实验室 教育部生物靶向治疗重点实验室 湖北省呼吸重大疾病临床研究中心 肿瘤靶向生物化疗湖北省工程研究中心 湖北省生物靶向重点实验室,武汉 430022;通信作者:金阳,Email:whuhjy@126.com


引用本文:谭学耘,夏慧,曹雅淇,等.人工智能赋能肺结节的临床决策[J].国际呼吸杂志,2024,44(7):750-756.DOI:10.3760/cma.j.cn131368-20240619-00370.


基金项目:国家重点研发计划(2022YFF1203300);国家自然科学基金(82330003)


本文转载自订阅号「国际呼吸杂志」(ID:guojihuxizazhi)

原链接戳:【专题笔谈】人工智能赋能肺结节的临床决策


* 文章仅供医疗卫生相关从业者阅读参考


本文完

责编:Jerry

615