肺癌是全球癌症相关死亡的主要原因。大量研究证明,肺癌筛查能检出早期肺癌并降低肺癌相关死亡率。构建高质量的肺癌筛查项目是一项涉及多个领域的复杂任务。《NEJM医学前沿》周二「肿瘤深度观察」栏目综合《新英格兰医学杂志》(NEJM)、《Lancet》以及我国的肺癌筛查指南等,全面梳理关于肺癌筛查的现有证据。
证据基础
20世纪70年代的早期临床试验探索了胸部X线片和痰液分析在肺癌筛查中的潜在价值,发现这两项筛查手段未能降低肺癌相关死亡率,然而《新英格兰医学杂志》(NEJM)发表的本世纪进行的两项大型随机对照试验结果则证实采用低剂量CT筛查肺癌可降低相关死亡率。
NLST纳入53,454名肺癌高危人群,随机分配接受3次低剂量胸部CT或胸部X线年度检查。与胸部X线检查相比,低剂量CT组肺癌死亡率降低20.0%(95% CI,6.8~26.7;P=0.004),全因死亡率降低6.7%(95% CI,1.2~13.6;P=0.02)。预防1例肺癌相关死亡所需筛查人数为320.2人。
NELSON试验将13,195名男性(主要分析)和2,594名女性(亚组分析)随机分组,分别在基线、1年、3年和5.5年时接受低剂量CT筛查,或不接受筛查。与NLST试验评估肺结节二维大小不同,NELSON研究根据半自动化的肺结节体积测量结果指导后续处理。该研究发现,在男性筛查组中,10年内肺癌死亡人数累计减少24%(累计率比[RR],0.76;95% CI,0.61~0.94;P=0.01)。女性累积降幅更高,为33%,但统计学功效不足。NELSON试验发现筛查组和未筛查组在10年内的全因死亡率没有显著差异。
一项纳入9项随机对照试验的荟萃分析(共计94,921名参与者)显示低剂量CT筛查使肺癌死亡率降低16%,全因死亡率降低3%。中国一项前瞻性队列研究纳入1,016,740名参与者,发现1次性低剂量CT筛查可使肺癌死亡率降低31%(HR,0.69;95% CI,0.53~0.92),全因死亡率下降32%(HR,0.68;95% CI,0.57~0.82)。
潜在危害
肺癌筛查的潜在危害包括进一步评估筛查结果引起的身体损害,获知结果后的心理痛苦,过度诊断和过度治疗,以及辐射暴露相关风险。
NLST试验将肺结节阳性的阈值设定为4 mm,但在低剂量CT组中,96%的阳性筛查结果均非肺癌。在所有接受手术的患者中,约有20%因筛查出良性结节而接受手术。在对筛查结果进一步评估时,低剂量CT筛查组的重要并发症发生率为33人/万名筛查者。筛查结果也有可能造成短期的心理困扰;然而,不利影响似乎不会存在超过6个月。
肺癌筛查中的过度诊断是指检测到的肺癌可能为高度惰性,不会进展引起症状或导致死亡。符合肺癌筛查条件的人也可能罹患严重合并症,导致部分患者在肺癌影响到其生活之前就死于其他疾病。在NLST研究中,估计18.5%的肺癌被过度诊断为癌症。如果组织学为非浸润性腺癌,其概率更高(79%)。在预防1例肺癌相关死亡所需的320名筛查参与者中,1.38例被过度诊断。癌症的过度诊断可能引起焦虑,其治疗可能引起并发症。
与辐射暴露相关的风险较难估计。一项研究估计,每2500名接受筛查的参与者中可能有1人因筛查的累积辐射而死于辐射相关恶性肿瘤。
目标人群
肺癌高危人群
肺癌筛查对高危人群最有效,不同试验和指南主要从年龄和吸烟史识别高危人群。在NLST试验中,高危人群的标准为:年龄为55~74岁,至少有30包-年(每天吸烟包数×吸烟年数)吸烟史;如果戒烟,则戒烟时间<15年。在NELSON试验中,筛查个体年龄在50~74岁,吸烟史超过25年且每天超过15支,或吸烟史超过30年且每天超过10支,如果已经戒烟,戒烟时间在10年内。美国预防服务工作组(USPSTF)的肺癌筛查指南确定的高危人群筛查年龄为50~80岁,吸烟暴露为20包-年,从而可使更多吸烟暴露较低但仍具有肺癌风险者受益于筛查,包括更多女性和少数族裔。
考虑到中国和西方国家人群对吸烟的易感性不同,与不吸烟者相比,中国吸烟者发生肺癌的相对危险度显著低于西方人群;与其他国家相比,严重空气污染、生物燃料使用等其他危险因素对中国人群肺癌风险影响更大。因此,我国目前制定的指南建议下列患者接受肺癌筛查:(1)年龄介于50~80岁;(2)具有下列条件之一:①吸烟史:吸烟≥20包-年或被动吸烟≥20年,若现在已戒烟,戒烟时间不超过5年;②有长期职业致癌物暴露史:长期接触氡、砷、铍、铬及其化合物,石棉、氯甲醚、二氧化硅以及焦炉逸散物和煤烟等肺癌致癌物;③一级、二级亲属患肺癌,同时吸烟≥15包-年或者被动吸烟≥15年;④如果某些高发地区有其他重要肺癌危险因素,也可作为筛选高危人群条件。
另一种方法是开发多变量数学模型,估计一定时期的肺癌风险,并确定风险阈值以判断需要接受肺癌筛查人群。目前有两个风险模型经过严格评估并开始用于筛查试验:前列腺、肺、结直肠和卵巢(PLCO)模型和利物浦肺项目(LLP)模型。PLCO模型的最新版是PLCOm2012模型,综合了年龄、种族、吸烟史、个人癌症史、肺癌家族史、是否患有慢性阻塞性肺病(COPD)、教育水平和体重指数等因素。
在对PLCO和NLST的回顾性分析中,PLCOm2012风险模型在肺癌风险预测的准确性方面优于USPSTF标准。国际肺部筛查试验对PLCOm2012进行了前瞻性评估,在将6年内肺癌发病风险阈值设定为1.51%时,PLCOm2012模型对5819名参与者肺癌发病率的预测能力优于USPSTF标准。LLP风险模型也迭代至LLPv3,综合考虑了年龄、性别、吸烟史、个人癌症史、肺癌家族史、石棉接触史以及肺炎、肺气肿、支气管炎、肺结核和COPD史。英国肺部筛查(UKLS)试验采用LLPv2模型确定纳入资格,其阈值为5年内肺癌风险5%,结果显示1次低剂量CT筛查后肺癌检出率可达2.1%。
从未吸烟者的筛查
前文所述的肺癌风险评估聚焦于烟草暴露,但约四分之一的肺癌患者从不吸烟。从未吸烟女性在南亚的肺癌发病率最高(83%女性肺癌患者从未吸烟),其次是东亚(61%),美国仅为15%。因此,基于其他地区数据开发的肺癌风险模型筛查可能会遗漏众多早期肺癌患者。亚洲筛查队列的分析表明,从未吸烟者肺癌发病率可能并非远低于吸烟者。韩国一项回顾性肺癌筛查队列分析报告称,从未吸烟者中有0.45%的人筛查出肺癌,而曾经吸烟者中有0.86%。而日本的前瞻性肺癌筛查分析则指出,从未吸烟者的1.1%筛查出肺癌,而吸烟者同样是1.1%。
中国台湾一项纳入12,011名从未吸烟但有其他肺癌危险因素(55~75岁、肺癌家族史、被动吸烟暴露、肺结核或慢性阻塞性肺病、烹饪指数较高以及烹饪时不使用通风设备)者的低剂量CT筛查发现,2.6%的参与者患有肺癌,高于第一轮NLST检测出的1.1%的比率。这些数据表明,有必要建立针对亚洲人的风险模型优化肺癌筛查人群。但考虑到非吸烟亚洲妇女诊断出的肺癌有很大一部分可能是过度诊断,因此在优化筛查资格标准时,必须注意尽量减少过度诊断。
此外,职业和环境风险因素,包括暴露于氡、石棉、铬、砷和空气污染,也应该被考虑,以有效地识别肺癌高风险个体,并为初级预防方案提供信息。男性和女性肺癌风险因素可能不尽相同,表明识别高风险个体进行肺癌筛查的策略可能需要为不同性别量身定制。
癌症幸存者筛查
曾经罹患肺癌和其他癌症的幸存者再次罹患原发性肺癌风险比普通人群高,因此这部分人群的肺癌筛查项目需特别考虑。根据美国监测、流行病学和最终结局项目(SEER)数据库,在被诊断为10种最常见原发恶性肿瘤之一的成年患者中,8.1%的人会发生第2种原发恶性肿瘤,其中最常见的是肺癌。
在肺癌幸存者中,估计10年内第二次患原发性肺癌的中位风险为8.4%,根据年龄、组织学和原发性肺癌的期别不同而有所差异。这表明癌症幸存者再次患肺癌风险极高,即使他们不符合目前基于年龄和吸烟史的筛查标准,也要接受筛查。
目前的肺癌幸存者影像监测指南建议在治疗结束后前2~3年内每6个月进行一次胸部CT检查,然后每年进行一次监测。虽然指南没有指出停止影像学监测的时间,但登记数据表明,肺癌幸存者在第1次肺癌诊断后至少10年内,与吸烟有关的第2原发癌风险仍然升高,常规肺癌跟踪应持续10年。此外,癌症幸存者不仅有患第二原发肺癌风险,而且其他与吸烟有关的第二原发癌症风险均升高,包括头颈部、喉部和食管鳞状细胞癌。
筛查所见问题的处理
肺结节和肺癌
肺结节需要尽快明确其性质。结节大小和生长速度是预测恶性最重要指标。由于手动测量的误差可达1.5 mm,因此可能对判断小结节体积产生重大影响。例如,1个直径5 mm结节在3个月增至6 mm,尽管直径变化未超过阈值,但体积倍增时间约为115天,与恶性肿瘤倍增速度一致。因此人们开发出半自动体积分析法。英国胸科学会(BTS)指南指出,结节体积增大25%才有临床意义(亦即5 mm结节需增至5.4 mm)。
BTS建议,对于直径≥8 mm或体积≥300 mm3的结节,可使用PanCan/Brock大学的工具评估结节基线CT,如果恶性风险>10%,则在PET-CT检查后进一步使用Herder模型评估。对于<8 mm的结节,PET-CT定性准确性较低。
亚实性结节(部分实性和纯磨玻璃结节的统称)应采用较为保守的策略,因为亚实性结节多为惰性癌症,容易造成过度诊断。纯磨玻璃样结节最初几乎只需要接受观察,只有在出现实性成分时才考虑进一步诊断和治疗。部分实性结节最初亦只需观察,除非实性成分达到或超过8 mm,这时可以考虑在活检或治疗前进行PET-CT检查。
疑似癌症者应尽快明确诊断,完成肿瘤分期,并评估适宜的治疗方案。而对良性或惰性肿瘤患者应给予安慰,并继续参加筛查。指南建议,恶性概率难以明确的结节可经胸穿刺活检,对于恶性风险高的结节则建议手术切除。
偶然发现
偶然发现是指在低剂量CT筛查肺癌过程中检出的肺部结节以外的影像学异常。偶然发现可能导致患者更加焦虑,后续影像学检查会增加辐射暴露,诊断或治疗引起并发症,以及花费增高。
最常见的偶然发现是非结节性的肺部异常和冠状动脉钙化。虽然大多数非肺结节的偶然发现无需特殊处理,但肺癌筛查有可能检出严重疾病,包括肺外恶性肿瘤和严重冠状动脉疾病(图1)。大约14%的患者需要由专科医生会诊,12%的患者需要进一步检查。
图1. 肺结节Lung-RADS分级与推荐的处理方法
戒烟干预
戒烟是降低肺癌相关死亡率的最有效干预措施。肺癌筛查是关于戒烟的「教育窗口期」,有助于为个人戒烟提供支持。美国预防服务工作组和中国肺癌筛查指南均建议将戒烟干预整合至肺癌筛查项目中。将低剂量CT与有效的戒烟计划相结合,通过降低肺癌和其他吸烟相关疾病(包括慢性阻塞性肺病、心血管疾病和其他癌症)风险,可以提高肺癌筛查成本效益。
肺癌筛查未来方向
个体化筛查间隔
中国肺癌筛查指南指出:「对于1年是否为LDCT筛查的最佳间隔仍存在争议……建议连续2年筛查阴性的人群停止筛查2年,筛查阳性的人群需每年筛查。」
对于肺癌风险较低的筛查参与者,延长低剂量CT扫描间隔,可以大幅减少每年的CT扫描次数,降低肺癌筛查成本,并减少个人辐射剂量。反之,对于高危参与者,缩短筛查间隔可以减少肺癌延迟诊断数量。通过对肺癌筛查参与者进行风险分层,可以制定个体化筛查间隔,有助于提高肺癌筛查效率。这是一个当前活跃的研究领域。
最佳筛查间隔可以根据患者人口统计学和其他已知危险因素确定:如吸烟、肺气肿和癌症史;此前胸部CT扫描信息,包括肺结节和肺气肿;以及生物标志物等。例如,LCRAT模型纳入低剂量CT的发现(包括CT发现的肺气肿和实变影等)以预测下一次年度筛查时的肺癌风险。该策略根据下一次年度筛查时估计的肺癌风险,将部分肺癌筛查参与者筛查间隔延长,但导致肺癌诊断延迟的发生率增加。回顾性分析NLST数据发现,对于下次筛查时肺癌风险低于0.1%风险阈值的参与者,15.1%的筛查阴性参与者会延长筛查间隔,但0.7%的肺癌会被延迟诊断。PLCOm2012等模型均试图寻找低危患者以延长筛查间隔。
为确保风险模型能够安全应用于肺癌筛查项目,对参与者进行分层以制定个体化筛查间隔,外部前瞻性验证至关重要。4-IN THE LUNG RUN试验是一项随机对照试验,计划将欧洲6国的24,000名基线低剂量CT检查正常的参与者随机分配到年度筛查或基于风险的筛查间隔(两年一次筛查)。期待该项研究结果能为个体化筛查间隔提供更多数据。此外,制定个体化筛查间隔的需求也推动了人工智能和生物标志物研究。
人工智能
人工智能(AI)在肺癌筛查项目中可以发挥巨大作用,包括减少辐射剂量、肺结节检测、肺结节定性和个体化筛查间隔的制定。如果大幅增加肺癌筛查项目的覆盖范围,工作量将成倍增加,标准化图像质量和肺结节评估将十分重要,因此加强AI的应用显得迫在眉睫。
基于深度学习的图像重建技术可以减轻图像噪音,有助于降低辐射剂量,提高图像质量。与使用传统算法重建的超低剂量CT(0.07 mSv或0.14 mSv),深度学习图像重建技术应用于超低剂量CT时结节检出率更高,测量精度也有所提高,提示AI有助于推动超低剂量CT的应用。
AI算法检出肺结节的灵敏度(83%~97%)和准确性(82%~98%)均较高。基于深度学习算法检出肺结节的能力已经超过影像科医生,特别是较小结节。结合算法和采用卷积神经网络的新方法已经将假阳性率降低到每次扫描约一个假阳性结节。但大多数软件解决方案均需要影像科医生审核软件检出的所有结节,以确定它们是否是真正的结节。到目前为止,大多数筛查项目使用AI人工智能作为第一或第二阅片者,以提高肺结节检测灵敏度。
AI还能够协助医生判断肺结节的良恶性概率,其性能可达到胸部影像科医生水平。AI应用将可减少良性结节的后续不必要检查,降低阅片者之间的差异,从而优化肺结节管理。使用低剂量CT图像和临床信息估计肺癌风险的AI算法可以使检查间隔个体化,从而优化资源利用。
大部分AI算法的缺点在于它们没有经过外部验证,而且可用于临床的成熟产品较少。仅有少部分检测并测量肺结节的AI软件获得美国食品药品管理局批准。
生物标志物
研发有效的肺癌生物标志物将有助于完善肺癌筛查选择标准、协助处理性质不明肺部结节、定制化筛查间隔以及预测患者对辅助治疗的应答。但目前尚缺乏有效的肺癌生物标志物。
MILD试验的亚组样本回顾性分析发现,利用血浆microRNA特征分类可将直径>5 mm非钙化结节假阳性率从19.4%降至3.7%。microRNA检测方案可测定13种microRNA,在连续观察的1000多名吸烟高风险参与者中,诊断肺癌总体准确率为75%。
EarlyCDT-Lung检测方案测定肺癌相关抗原的自身抗体,是唯一接受过前瞻性评估的生物标志物之一。在1613名肺癌高风险参与者中,检测结果显示6个月内诊断为肺癌的阳性预测值为9%~16%。之后的苏格兰肺癌早期诊断(ECLS)试验将12,000多名高危参与者接受EarlyCDT-Lung检测,如果EarlyCDT-Lung检测为阳性(只有9.8%的参与者),则随机分组接受低剂量CT检查,或者接受标准临床观察。结果显示,两年后,干预组的Ⅲ期或Ⅳ期肺癌发病率低于标准临床观察组。而对德国肺癌筛查干预试验的参与者队列的评估发现,该检测方案的敏感性只有13%,特异性为89.9%,表明高危人群仍需要低剂量CT检查。
其他仍在研究的肺癌早期检测生物标志物包括补体片段、循环肿瘤DNA(在晚期疾病中的研究较多,肺癌筛查方面研究较少)、DNA甲基化、支气管内上皮细胞基因分析以及核苷酸多态性等。
参考文献 (可上下滑动浏览)
1. Aberle DR, Adams AM, Berg CD, et al. Reduced lung-cancer mortality with low-dose computed tomographic screening. N Engl J Med 2011;365:395-409.
2. de Koning HJ, van der Aalst CM, de Jong PA, et al. Reduced lung-cancer mortality with volume CT screening in a randomized trial. N Engl J Med 2020;382:503-13.
3. Krist AH, Davidson KW, Mangione CM, et a;. Screening for lung cancer: US Preventive Services Task Force Recommendation Statement. JAMA 2021;325:962-970.
4. Adams SJ, Stone E, Baldwin DR, Vliegenthart R, Lee P, Fintelmann FJ. Lung cancer screening. Lancet 2023;401:390-408.
5. Choi HK, Mazzone PJ. Lung cancer screening. Med Clin North Am 2022;106:1041-53.
6. Chinese Expert Group on Early Diagnosis and Treatment of Lung Cancer; China Lung Oncology Group. China national lung cancer screening guideline with low-dose computed tomography (2023 Version)]. Zhongguo Fei Ai Za Zhi 2023;26:1-9.
本文转载自订阅号「NEJM医学前沿」(ID:NEJM-YiXueQianYan)
原链接戳:综述:肺癌筛查
* 文章仅供医疗卫生相关从业者阅读参考
本文完
责编:Jerry