男科 | 妇科 | 骨科 | 耳鼻喉 | 肛肠 | 泌尿 | 不孕不育 | 皮肤病 | 口腔 | 肿瘤 | 糖尿病 | 眼病 | 性病 | 肝病 | 心血管 | 更多 |
1.问题的提出
作为恶性肿瘤谱中最重要的癌瘤之一的肺癌,每年世界范围内诊断的新病例超过了50万例,国内的肺癌死亡率上升也较快,90年代达20.41/10万。对于这一发病率日益增长的肿瘤,尽管投入了大量的人力物力进行研究,但令人遗憾的是,治疗效果一直不尽人意。
是什么原因使得肺癌的生存率裹足不前呢?
让我们首先来看看非小细胞肺癌术后辅助性放射治疗的研究情况。
从1933年首例的肺癌全肺切除术以来,手术一直是非小细胞肺癌的首选治疗方法。然而,即使是完全性切除的肺癌病例,其5年生存率也仅在40%左右,治疗失败的原因,主要在肺癌的局部复发和转移上。既然外科手术对肺癌的局部控制不足,同为局部治疗手段的放射治疗,自然被列入肺癌的术后辅助治疗计划中。下面是一些研究结果:
肺癌研究组于1986年报道了230例的非小细胞肺癌病人术后放射治疗的随机研究,结论是术后放疗能减少N2病人的复发,但不能提高生存率。同样结论的报道也见于相隔10年后的1996年,英国的Stephens等报道了16个中心308名病人的随机研究,结论是术后放射治疗能减少和推迟局部复发和骨转移,但不能提高生存率。
澳大利亚的Mayer等1998年报道了155名NSCLC病人的随机研究,结论为尽管目前的结果还没有统计学的意义(P=0.07),但术后放射治疗的趋向是可能有延长总生存率和无复发生存率的作用。
美国著名的Mayo医院的一项回顾性研究,把224名接受了术后放射治疗的病人,按术后复发危险性的高低和生存情况分成高危险、中危险、低危险三个组进行分析,结论是高、中危险组的病人能从术后放疗中获益,而低危险组的病人则效果不确切。
俄罗斯Bartchuk等702例的回顾性研究结果显示,术后放射治疗明显地提高了生存率和减少了局部复发率。
法国Lafitte等报道了160例T2N0M0的早期非小细胞肺癌术后放射治疗的结果,结论是对这一期的肺癌,术后放射治疗既不能减少局部复发率,也不能提高生存率。
国内汪楣等166例的随机分组研究,术后放射治疗明显降低了局部复发,但3,5年生存率与单纯手术组比较没有统计学的差异。
钱浩和王瑞芝等分别于1993和1995年报道认为,如果手术切除彻底,无残留淋巴结,非小细胞肺癌术后做不做放疗对生存率无影响。
上述引用的文献,来自不同的国家不同的研究时间段,但结论相当的不一致。因此,当我们在引经据典地为我们的临床实践或进一步的临床研究寻找根据时,我们只能说,非小细胞肺癌术后是否辅助性放射治疗仍有争论。
在非小细胞肺癌的临床研究中,类似的问题还有:转移性肺癌用化学治疗还是用支持疗法、ⅢB期非小细胞的治疗、生物治疗在肺癌治疗中的作用、肺癌恶性胸水的治疗模式、新辅助放化疗在非小细胞肺癌治疗中的价值、小细胞肺癌是否需要辅助性手术治疗,等等。对这些问题,我们有哪一项能确切地回答?
问题在于,我们能一直用这些有争议的治疗模式来处理每一个需要得到最好治疗照顾的肺癌病人吗?不恰当的过分治疗,既对病人不利也是对有限的医学资源的浪费。另一方面,仍按此进行临床研究,是否再过10年20年,我们仍只能同前10年20年前一样只得出有争议的结论呢?
需要新的临床研究方法。
2.系统评估的研究方法
对上述有关完全性切除的非小细胞肺癌术后放射治疗文献的剖析发现,对同一问题的研究,不管是例数的多少,均涉及到统计学的权重,也即P值是否有意义的问题。对同一问题得出不同的结论,其中一个值得考虑的是研究对象的例数是否足够。举一个例子,如果期望通过术后放射治疗,把非小细胞肺癌的5年生存率从50%提高到60%,即提高10%的绝对生存率,那么需要900例的研究才能从统计学的角度回答辅助性放射治疗是否有价值。
如果要把生存率从5%提高到55%,则需要3500例的研究对象。显然,依靠一个研究中心是难于甚至是不可能达到目的的,即使是联合多个中心共同进行研究,也难于达到这么多的样本量,由此,就有可能应该得出阳性结果的研究,却因例数不够而导致统计学上的无意义。因此,需要引进系统评估的研究方法。另一方面,每年在全世界范围内2万多份杂志上发表的生物医学文献超过2百万篇,任何一个人不可能一一阅读和消化,需要把这些有关的文献精简成精华才能有效的利用。
所谓的系统评估(SystematicReviews),指的是用一些系统的方法来尽可能地减少偏倚和随机误差。研究者用系统的方法来鉴别、判别和提炼假说,认识和避免以前工作的陷阱,估计样本量,描述主要的副作用和确定进一步的研究方向。系统评估最常用的方法是Meta分析法。
现举几个例子加以说明。
1998年英国Stewart等发表了非小细胞肺癌术后放射治疗的Meta分析报告。该研究总共收集了9个随机对照研究,其中有3个是没有发表的研究,病例数达2128例。1056例接受术后放射治疗的肺癌病人已有707例死亡,1072例单独手术的肺癌病人也有661例死亡。中位随访时间为3.9年。结果是,术后放射治疗对生存率有负面影响,死亡危险性增加了21%,等于2年生存率下降了7%,即从55%降为48%。进一步的亚组分析,负影响最大的为N0N1的Ⅰ、Ⅱ期病人,N2病人的负影响则不明显。因此,术后放射治疗不适于完全切除的早期非小细胞肺癌病人,不应列为常规使用。至于N2病例,术后放射治疗的作用仍难于确定,需进一步研究。
另一个例子是关于非小细胞肺癌的化疗问题。1995年非小细胞肺癌协作组[15]在BMJ杂志上发表了该问题的Meta分析报告,该研究由52项随机研究组成,涉及9387名病人,其中已死亡的7151例,同样包括了部分未出版的研究。结论是,含有铂类的化疗方案能提高病人的生存率,术后加上化疗与单独手术比较,减少了死亡危险13%,5年生存率提高5%;放射治疗联合化学治疗比起单独的放射治疗,死亡危险减少了13%,2年生存率提高4%;支持疗法联合化学治疗,比起单独的支持疗法,死亡危险减少了27%,1年生存率提高10%。从上述两个Meta分析,我们可总结出几个特点:
首先是纳入研究的均是随机对照研究,样本数总量达数千例,保证了统计学处理的需要,更由于包括了未出版的资料,可纠正绝大部分公开发表的文献只报阳性结果的所谓出版偏差。其次是结论均是数量化且有统计学处理,能更直接的回答待解决问题的是与否。第三是研究结果是解决临床中某些一直混淆不清的有争议问题,是一种真正的临床研究手段。
当然,Meta分析不等于就是系统评估的方法。在某些情况下,譬如出版的资料不能用来计算比数比(OddsRatio),研究方案的设计存在异质性等等,均使得Meta分析不能进行。1998年Sculier[16]等在评价小细胞肺癌维持化疗的作用时,使用了另一种系统评估的方法-称为文献的批判性综述(ACriticalReviewoftheLiterature),这种方法的实质是一种定性评分法,采用评分表来评价方案设计和方案分析的质量,获得分数最高的研究方案,其结论就最可信。与Meta分析相比较,这一种定性评分法并不能得到基于统计学处理的结论,因此对期待解决的问题可能得不到明确的答案,但它耗时少,在不能采用定量分析方法时,不失为一个较好的定性方法。
Sculier等采用的计分表为欧洲肺癌工作协会(EuropeanLungCancerWorkingParty,ELCWP)设计的质量评分表,该表分方案描述研究和分析报告研究两部分,每一部分再分成若干小项,每一项满分为2分,该项如果研究方案或分析报告完全没有提及的为0分,仅部分提及或虽涉及但不充分者为1分,描述清晰和完全的为2分。如在方案设计中毒性项,没有涉及的得分为0,只涉及部分毒性的得分为1,按WHO标准观察毒性的得分为2。所有项目得分相加占总分的百分数为总得分,分数越高研究质量越有代表性。从1980年到1996年,总共13个随机研究进入评分,结论是小细胞肺癌的维持化疗有一定的适应症,在方法学上,目前已发表的研究质量总体上不尽人意,越近发表的研究质量越好,未来需要有好的高质量(即计分高)的研究。
类似的评分法还有Chalmers法。
系统评估的另一个重要方面是确定证据的可靠性,称为对证据的批判性评估。经过大量的评估,美国肿瘤临床协会提出了临床证据可靠性的5个级别,可以大体上评估海量文献中结论的可靠性。
这5个级别为:
级别Ⅰ:研究结论来自对所有设计良好且有对照的临床研究的meta分析。低假阳性或假阴性的随机研究(高权重)。
级别Ⅱ:研究结论至少来自一个设计良好的随机对照临床试验,高假阳性或假阴性的随机研究(低权重)。
级别Ⅲ:研究结论来自设计良好的准临床试验,如非随机的、单组对照的、前后队列、时间序列或配对病例对照系列。
级别Ⅳ:结论来自于设计良好的非临床试验,如比较和相关描述和病例研究。
级别Ⅴ:病例报告和临床总结。
不同的研究机构的证据可靠性的评估有不同的标准,但其基本要点均是以统计学的基本原则来确定的。