《新英格兰医学杂志》主编:不宜过度解读美国紧急授权瑞德西韦,应尽快公布全部数据
来源: NEJM医学前沿 2020-05-16

3项关于Covid-19治疗的临床研究于近日公布结果:一项大型观察性研究宣告未见羟氯喹有效,一项未完成入组从而统计学功效不足的中国研究未发现瑞德西韦能改善重症患者结局,而一项只在新闻发布会公布部分结果的美国研究宣称瑞德西韦有效。


此前,媒体对这些结果已经有过诸多报道。在上周的访谈中,《新英格兰医学杂志》(NEJM)主编Eric Rubin和责任编辑Lindsey Baden,与执行主编Steve Morrissey一起,提供了他们的专业看法。他们在高度赞扬中国研究团队迅速且高质量地完成Covid-19首个随机对照试验的同时,也对欧美临床试验未能快速跟进深感遗憾


有趣的是,Rubin表示,不宜「过度解读」(I don't think I would read too much into that)瑞德西韦获得美国食品药品管理局(FDA)紧急授权,因为3月份「FDA也授权使用了氯喹」。


Morrissey 


这周我想谈谈Covid-19的治疗。目前有许多疗法,但大多数疗法缺乏数据支持。迄今为止唯一已发表的大型安慰剂对照试验是洛匹那韦-利托那韦的研究,该研究在疫情暴发早期就已进行。在那之后,我们学到了什么(新的知识)?


Rubin 


我认为,首先洛匹那韦-利托那韦试验是一项非常重要的试验,因为它表明我们可以在公共卫生紧急情况下进行这类研究,它为进一步研究奠定了基础。遗憾的是,结果相当令人失望,联合用药并没有什么疗效。但该试验仍然表明,在Covid-19治疗方面,我们应该能够做得更多。


Baden 


让人惊叹的是,这项研究在一月份开始,在二月底完成。当时,疫情在中国武汉呈显著上升趋势,并且当时存在着令人难以置信的不确定性:人类刚刚发现病毒,还在确定病毒引起的综合征的特征。这些研究者迅速组织和启动试验的能力令人惊叹。该研究确实为我们业界应该开展的各种研究树立了标杆,即使在新发流行病的混乱情况中也有可能进行这样的研究。


Rubin 


这也是为什么我对那之后研究步伐的缓慢在一定程度上感到失望。这些研究者是在令人难以置信的环境下开展试验的,然而本周才(在《柳叶刀》)发表了最新的(关于瑞德西韦的)RCT。


Morrissey 


是什么原因导致了随机对照试验如此之少?


Rubin 


我认为有几点原因造成了RCT的缺乏。一些中国研究者做好了研究的准备。然而,患者数量减少了,所以很多计划中的研究要么无法开始,要么无法完成。我们稍后会讲到其中一个不得不提前结束的试验。欧洲和美国没有很好地预测疫情会大暴发,随着患者数量的突然增加,研究似乎被抛到了一边。当时还没有相应的机制来迅速启动试验,并通过监管程序实施和完成试验。


Baden 


我认为,部分原因还是在于疫情迅速暴发,病情严重,需要送到医疗中心紧急救治的情况复杂,医生面临巨大压力。我们的精力用来治疗患者都感到不足,无暇考虑开展研究了解如何治疗患者。我认为这是把患者救治和研究割裂成两个问题,这种割裂是错误的。


这是我们业界必须好好考虑的一个问题,因为没有依据的治疗不一定是好的治疗。我们如何整合系统研究的需求,以了解哪些疗法有益,哪些疗法无效,哪些疗法可能有害?所有药物都有副作用,在美国和全世界,我们一直在设法知道应当向我们的SARS-CoV-2患者提供什么治疗。(作为医生,)我们想为患者做些治疗,尽管我们可能不知道这些治疗是好还是坏。


所以我同意你的看法,Eric,洛匹那韦-利托那韦试验的结果虽然不是我们想要的,但非常重要,可以让我们知道至少一种药物疗法,在那个给药时间,治疗重症Covid-19是无益的。我们需要开展更系统的研究来确定哪些疗法有效。


Morrissey 


迄今为止我们看到的大多数证据都来自病例系列研究和观察性研究,我们能从这些观察性研究中了解到什么?


Rubin 


我认为这取决于具体的研究。我们看到很多研究使用了不同的对照组,而对照非常重要。例如,那些使用历史对照(这是一种常见的疗效对照比较方法)的研究,是在不断变化的疫情中进行的,患者的基线治疗也在发生变化。


在疫情流行期间,随着医生对如何治疗这些患者的了解逐步加深,患者结局也逐步改善。因此,在Covid-19临床研究中使用历史对照有其缺陷。我们在埃博拉疫情期间看到治疗改善使历史对照失效,我们现在也可能在Covid-19疫情期间看到这一点。不论如何,我们都应该尽力设立一个对照组,这样就可以学到一些东西,对疗效和害处有大致的了解,当然也可能了解到任何药物的副作用。


Baden 


我认为,在我们非常清楚地知道疾病结局的情况下,观察性数据是非常有价值的,例如狂犬病。并不是说完全没有狂犬病患者生存的例子,但在大多数情况下,当一个人出现狂犬病的临床表现时,结局通常是死亡。对于晚期癌症,我们知道结局常常也是死亡,所以在某些情况下,观察性数据可能是最好的,因为我们已经清楚地了解了基础疾病。


现在,SARS-CoV-2治疗的困难之处在于,大多数病例可能是无症状或症状轻微的,并且大多数有症状的病例会好转。因此,在背景标准治疗改善的情况下,如何确定会发展为重症的患者以及好转与进展的比例,就变得非常复杂。


这就是为什么有必要进行适当的对照试验来了解一种新药的效果。我们必须建立开展对照试验的架构,而观察性数据可以帮助我们了解如何建立这样的架构。但是(对一些患者而不对另一些患者)使用特定药物是有原因的,没有通过随机给药减少偏倚,因此观察性数据仍然让解读结果比较困难。


Morrissey 


本周发表了一份有关羟氯喹(与阿奇霉素合用或者不合用)观察性试验的报告。我们从这项试验中学到了什么?


Rubin 


首先,让我概括介绍一下该研究小组做了些什么。他们观察了在纽约一个医疗机构入住的患者结局。当时,医院内部指南建议对氧饱和度低于94%的低氧血症患者使用羟氯喹。


然而,临床医生可以自行决定是否使用羟氯喹。此外,一些医生选择加用药物阿奇霉素,有人认为阿奇霉素与羟氯喹联合治疗有效。研究者对患者进行了中位时间超过22天的随访,并记录患者是否插管或死亡。插管或死亡是该研究的复合终点。研究者发现,当患者接受羟氯喹单独治疗或羟氯喹+阿奇霉素联合治疗时,终点发生率较高。换句话说,粗略看起来,接受羟氯喹治疗的患者结局较差。


然而,各组患者不具可比性,羟氯喹治疗组患者病情较严重。医生选择给予某些患者一种治疗或其他治疗,很可能有一些理由,尽管我们不知道这些理由是什么。但如果你使用Covid-19不良结局的传统风险因子来校正结果,结果基本上在统计学意义上是相似的。因此,患者是否接受治疗似乎对改善结局没多大意义。


Morrissey 


这是否意味着羟氯喹无效?


Rubin 


这意味着不鼓励使用羟氯喹,但不能确定羟氯喹无效。羟氯喹可能有一些小的好处,也可能有小的害处。根据数据,我们不能排除任何一种可能性。我们可以说,羟氯喹既不是特效治疗,也不是毒药。我们最多仅观察到了轻微的效果。


Baden 


我同意,Eric。我认为,挑战在于我们这些治疗患者的医生现在就需要根据最好的信息做出决定。指南基于目前可用的最佳信息。这些类型的数据有助于我们做出决定。虽然更仔细收集的数据可能影响有益或有害结论的方向,但没有明显的大的有益或有害效应。我的意思是说,这些作者在回顾性评估中已经尽力了。遗憾的是,对于观察性数据,为什么患者接受这种药物治疗(我认为不是随机的)的偏倚很难控制,虽然研究者已经尽力减少这些因素的影响。


Eric,如你所述,这些数据表明,疗效不明显,害处也不大。这为了解药物效应的更细致数据、分析风险收益比奠定了基础,但是否进行这种评估取决于其他治疗是否更有益。


Morrissey 


我要问你一个容易回答的问题。我们到底需要做什么才能证明(羟氯喹治疗)是有益还是有害?


Rubin 


为了观察到较小的效应,我们需要设计非常好的安慰剂对照随机试验。目前这样的试验正在进行中。我们只是还没有获得试验结果。再回到Lindsey对临床指南的评论。我认为这正是我们选择发表这个研究的原因——帮助临床医生获得信息,虽然研究并未得出有关这一问题的最终结论。


Baden 


我们期待RCT的结果,我们需要Covid-19所有不同疗法的各类高质量数据。正在进行的Covid-19治疗研究表明,做好Covid-19治疗研究非常重要,医学界对此很感兴趣。


Morrissey 


但在这些研究还在进行的时候,临床医生应当怎么做?


Rubin 


这确实是一个难题。Lindsay和我均治疗过患者。有许多治疗指南,许多指南实际上包括羟氯喹和阿奇霉素这样的药物,但指导治疗的数据其实很少。难以置信的是,疫情已经暴发几个月了,但我们没有足够严格的试验对这些常用治疗进行检验。这是一个普遍问题。不仅仅是羟氯喹,几乎我们在使用的所有干预措施都是这样。


这让我想起了肿瘤学领域发生的事情。当被诊断为癌症的患者到学术医疗中心就诊时,患者几乎总会被纳入临床试验中。我认为我们在应对Covid-19时也需要保持同样的心态。既然我们不知道我们在做什么,我们就应该弄清楚我们应该做什么。我们应该通过研究当前患者的治疗来了解什么治疗是正确的,这样才能帮助我们的患者。


Baden 


我参与制定了我所属的医院以及美国传染病学会(Infectious Disease Society of America)的指南。制定指南与治疗单个患者不同,但我们希望(本质上)它们都是一样的。指南需要以可靠的、有指导性的现有证据为基础。当证据不那么明确时,指南需要反映出这一点。我们在杂志上发表的文章也需要反映出什么是紧急的临床决策以及当今最好的可用证据,因为作为临床医生,我需要尽我所能做出最好的决定来治疗患者。


遗憾的是,目前完成的唯一RCT仅能帮助我了解哪些治疗无效。在治疗患者时,我们都需要了解什么疗法有效,在什么情况下有效,什么剂量有效,疗效持续多长时间,疗效表现在哪些方面,这些都不是容易回答的问题。但是系统性的数据收集将提供信息来解决我刚才提到的这些问题。


Rubin 


这说明了一个问题。从这次疫情暴发可以明显看出,我们没有足够灵活的研究架构来做出应对。我们无法像我们需要的那样非常迅速地开始试验,也不能很早就开始获得这些这些知识。我们需要从这次疫情暴发学到的一个教训是——这不会是最后一次疫情暴发,也许甚至不是我们有生之年的最后一次疫情暴发——我们应当有所预期,并做好准备,通过研究来了解如何治疗患者。


Baden 


Eric,正如你提到的,讨论一直在进行,但对我们来说,这次疫情强调的是紧迫性。五年前的埃博拉疫情暴发后,过了数月,才启动和实施RCT。


在全世界范围内、在各个国家内部,在世界卫生组织、英国惠康基金会(Wellcome Trust)、美国疾控中心、美国国立卫生研究院、盖茨基金会以及许多其他国际组织和科研资助机构,人们就如何更好地开展研究进行了大量讨论。为了做得更好,他们制定了路线图。这些讨论确实有助于对这次疫情暴发的应对,但是在这次疫情暴发中,我们未能很好预料到的是疫情暴发的速度。


埃博拉病毒和某些传染病的传播速度不如冠状病毒和流感病毒那样的高传染性呼吸道病毒。我们并非不知道具有高度传染性的全球性流行病可能发生,例如,我们经常讨论1918年的流感。


我们医学界必须认真审视我们如何更快地做出应对,以及我们如何以与病原体及其引发的疾病相称的速度做出反应。这意味着,当疫情随机出现在某个地方时,不论是哪个国家、医院,不论有适当的基础设施、还是仅有不完善的基础设施,都有一个快速识别机制,然后通过高质量研究来确定什么治疗有效,什么治疗无效。这需要研究者、医院、机构审查委员会(IRB)、国家、监管机构和国际组织通力合作。我认为,与五六年前的情况相比,他们在某种程度上已经做到了这一点。


但我同意,遗憾的是,我们的能力还不能满足应对这种快速传播病原体的需求。冠状病毒暴露了现行体制的弊端。


Morrissey 


抗病毒药物瑞德西韦临床试验的第一批结果逐渐被发表了。我们从瑞德西韦的研究中学到了什么?


Rubin 


对于瑞德西韦而言,这是有趣的一周,因为我们听说了两项安慰剂对照试验的结果。


第一个发表在《柳叶刀》杂志上,是在中国进行的,该研究组还进行了洛匹那韦-利托那韦研究。该研究的设计与洛匹那韦-利托那韦研究非常相似:患者接受瑞德西韦或安慰剂治疗,随后对患者随访4周,使用与之前研究相同的量表(研究者设计的一种顺序量表)来评估临床改善。


这项研究有好消息也有坏消息。好消息是,在研究实施期间,中国的疫情正在迅速改善。然而,从研究角度来看,这是一个坏消息,因为这意味着研究者无法招募到目标数量的患者,因此决定停止试验。受试者数量使得研究统计学功效有限,因此无法识别两个治疗组之间的差异。停药后,瑞德西韦组的疗效优于安慰剂组,但未达到统计学显著性。因此,该试验无法得出结论,难以排除有益或有害的作用。


我们「听到」了美国国立过敏和传染病研究所(NIAID)试验结果最重要的部分,但全部结果还没有发表。这项安慰剂对照试验使用了与中国试验类似的终点。我们「听说」瑞德西韦确实显示出积极的作用,但评估这项研究有点困难。我们知道,基于这些数据,FDA已批准瑞德西韦使用的紧急授权,允许医生使用瑞德西韦。我认为,这不能过度解读,因为FDA也授权使用氯喹和羟氯喹,在目前的试验中,而氯喹和羟氯喹似乎没有多大疗效。因此,我认为我们要等待研究的细节,看看瑞德西韦到底有多好。


Baden 


我们都在等待你提到的瑞德西韦研究的安慰剂对照RCT数据。通过评估数据,我们才能更好地了解研究到底做了什么、如何用药的、应答性质是什么和药物副作用,以实现对总体风险收益比的综合观察。在高质量的研究设计中看到令人鼓舞的结果,这是一个可喜的消息。当我们看到(全面的)数据时,这个好消息才会得到证实,从而知道如何将其付诸实践。


中国瑞德西韦研究还在进行的时候,中国通过公共卫生措施控制了疫情,这是好消息,但由于仅纳入了一部分受试者,研究的统计学功效不足,难以解释结果,这又是坏消息,这成为了该研究的一个难题。


五年前埃博拉病毒疫情暴发时,我们在ZMapp的研究中就遇到了这种(因疫情被控制而受试者不足的)情况。为应对今后出现类似的情况,我们提出了新的设计方案,通过适当的统计设计和适当的监管,可以让同一个研究跨越疫情,当一次疫情可能结束时,数据暂停,另外一次疫情开始时,再继续研究,以获得确定性的结果,从而我们能够知道治疗是否有效。


我们必须研究这些模型,看看我们能否跨地区来延续研究。多中心研究就是这样做的。但我们需要从单中心研究或单国家研究的角度来考虑这个问题,这样我们才能获得确定性的结果,而不会因为出色的公共卫生干预措施终止了疾病传播,而导致研究陷入僵局。这必须得到鼓励和支持。我们需要知道这些疗法是否有效,这样才能知道如何治疗我们的患者。我认为公共卫生和研究这两个目标都能够实现,研究的设计和实施必须从这个角度来看待。


Morrissey 


总的来说,这些研究的时间表是什么样的?我们什么时候能看到更多关于这些疗法的研究结果?


Rubin 


我们希望很快就能看到结果。我相信NIAID试验的详细结果很快就会公布,因为试验已经完成。还有许多其他RCT在进行中。这些RCT包括羟氯喹和氯喹的试验,这些研究可能会更准确地告诉我们这些药物是否有效。当然,这个问题正是Lindsey刚刚讨论的,在美国和欧洲,我们看到病例数在下降,因此将患者入组变得越来越困难。因此,除非或直到疫情复发,否则我们有可能还是不清楚会从研究中知道什么。但我非常希望大约在下个月,我们会得到一些答案,这些答案可以帮助我们向前迈进。


Baden 


要速度还是要完整性,这是难点所在,我们可能获得一项试验的主要结果,但未完成随访,未能全面收集或清理数据,或者未进行适当的反复分析。在疫情大流行背景下还需要立即获得信息,这是难以置信的挑战。一旦一个疗法的某些方面看起来好或坏,我们就需要立即分享这一信息,即使数据是不完整的。这种速度与完整性之间的对立是我们一直要挣扎的。


我赞赏我们中国和美国的同事完成了瑞德西韦研究,产生了这些数据,并尽可能早地分享了主要结果。我鼓励他们确保做好数据分析,这样我们就能在平衡速度和完整性的情况下,完全理解实验结果。我期待看到这些结果,但我确实理解研究者在平衡速度和完整性方面所面临的挑战。






本文内容来源自订阅号「NEJM医学前沿」(ID:NEJM-YiXueQianYan)

原链接戳:NEJM主编:不宜过度解读美国紧急授权瑞德西韦,应尽快公布全部数据







本文完
排版:Jerry
1305