发新话题
打印

Meta 分析:综述中的一次大革命

Meta 分析:综述中的一次大革命

meta-analysis: 国内被译为整合分析,元分析,荟萃分析

Meta 分析:综述中的一次大革命
彭少麟 郑凤英 ( 中国科学院华南植物研究所,广州510650)

Meta - Analysis : A Graet Revolution in Review. Peng Shaolin , Zheng Fengying ( South China Institute of Botany , Chinese Academy of Sciences , Guangz hou 510650) . Chinese Journal of Ecology , 1999 ,18 (6) :65 - 70. Meta - analysis ,a statistical method to integrate the results of multiple independent studies under a same subject , has more merits than traditional reviews. It had experienced three developmental stages. It has been widely used in Education ,Psychology and Medicine ,but is new in Ecology. And it is a new concept to most Chinese scholars. The process of Meta - analysis was reviewed in the paper.

Key words : Meta - analysis ,history ,ecology.

 科学研究应建立于许多实验结果的重复之上,除了少数新发现外,单个实验结果很难对科学的发展作出极为显著的贡献。所以为了阐明某一主题,在许多科学领域有众多研究者在对不同的实验对象或对同一对象在不同的实验环境中进行实验,如生态学中CO2 倍增对植物光合作用的影响是目前一个比较热的话题,于是在短短的几年内就有大量的文章报道CO2倍增对各种植物光合作用的影响;在医学界,如胎教对婴儿智力的影响,吸烟与肺癌的相关程度等,都曾有大量的临床或调查实验对这些大众所关心的问题进行统计分析研究,但结果不尽相同。面对如此多结果不一的独立研究,作为决策者该相信哪一个分析结果呢? 于是当大量独立实验出现时,就会有人对这些独立实验进行综合,即综述。综述是对同一主题不同实验结果的总结,也是对过去实验的概括、提炼,要从独立实验中排除随机误差,提炼出本质的内容,同时也要从中发现问题,为将来这一主题的研究指明方向,为解决问题的决策者提供科学依据。所以好的综述必须有好的方法来作后盾。Meta 分析正是这样一种好的综合方法。
1  Meta 分析的发展历程
1. 1  萌芽阶段
Meta 分析方法是当今比较流行的一种对同一主题下多个独立实验结果进行综合的统计方法。也有人用总观评述(overview ) 、数量评论( quantitative review) 、数量综合(quantitative synthesis) 这些名称来代表这一方法。它的起源可追朔到1904 年,英国统计学家基于样本大小对5 个估计值进行平均,对英国军事实验进行综合分析,以检验当时所用的intestinalfever 疫苗与死亡率的相关程度(疫苗是否有效) [1 ] ,可以说这是Meta 分析的雏形。30 年代, Tuppett 、Fisher 和Yates 三位统计学家提出了结合概论统计检验,也有许多Meta 分析学者认为Meta 分析直接根源于此[2~4 ] 。



1. 2  缓慢发展阶段

从40 年代到70 年代中期,Meta 分析在缓慢发展,其中Mantel 和Haenszel 创建的Mantel - Haenszel 法和Cochran 发展的Cochran 法分别为以后的Peto 法和D - L法提供了基础[5 ,6 ] ;这一阶段只是零星地出现了一些分析方法,真正的应用实例较少[7 ] 。



1. 3  真正兴起阶段

1976 年美国教育学家Glass 在研究心理疗法的有效性时才正式将这种定量综合法命名为Meta 分析,也真正揭开了Meta分析革命的开端,并创造了效应值(effectsize) [8 ] 。社会科学(包括教育学、心理学和社会决策学等) 很快接受了Meta 分析,80年代初期,在社会科学领域有关书籍和软件也相继问世[9~14 ] 。不久临床医学发现了这一方法,于是Meta 分析在医学领域又开始了它的使命[15 ] 。虽然直到80 年代末期,在医学界才出现了有关的专门书籍[16 ,17 ] ,但是它在医学中的应用却发展迅猛。作者通过MEDL INE(美国医学国家图书馆数据库)以Meta - analysis 为主题词进行检索,发现从1976 到1998 年,有关Meta 分析的论文急剧增加(表1) 。由于医学领域广阔,与教育学、心理学相比,如流行病学、大众健康学等学科又有其独特性,于是促使医学统计学者不断发展新的Meta 分析方法来满足医学领域的需要。DerSimonian 和Laird 改进了Cochran 法,构造了随机效应模型,打破了Meta 分析中传统的假设,引进了研究间方差权重, 使其更符合事实[18 ] 。Hedges 提出了小样方的校正方法[14 ] 。最初的Meta 分析并未考虑所结合研究的质量问题,后来有些分析家又提出了定性Meta 分析(qualitative meta - analysis) ,即在综合时要考虑各研究的质量。所以Milos 把前阶段的Meta 分析称作典型或数量Meta 分析(classic meta - analysis orquantitative meta - analysis) [19 ] 。90 年代,生态学家们又把它引入了生态领域,虽然它在生态学中的应用还很少,仅有少数几篇文章[20~24 ] ,却引起了生态学界的高度重视。Gurevitch 发展了混合效应模型[25 ] ,1997 年又提出了适合生态学的重取样检验法[26 ] , 并发行了她的MetaWin 软件[27 ] 。可以说Meta 分析在生态学领域的应用正方兴未艾。但遗憾的是,Meta 分析在中国学术界才暂露头角,1993 年赵宁等首次把它介绍进了中国医学界[28 ] ,1997 年郭春彦等在《心理学报》发表了有关文章[29 ,30 ] ,他们都将Meta 分析翻译成元分析。彭少麟等把这一方法引入了中国生态学界[31 ]并进行应用[32 ] 。根据我们的理解及有关科学术语翻译家的意见[33 ] ,元分析并不是Meta分析最好的中文对等词,相反,台湾一些学者所用的“整合分析”显得更确切。可以说Meta 分析对绝大部分中国学者来说还是个陌生的名词,也尚未进入真正的应用时期,故它在我国医学、教育心理学和生态学等领域的应用前景很广阔。



2  Meta 分析的过程



2. 1  Meta 分析的目的

目前Meta 分析主要应用在对照实验(研究) 的综合中。其目的是通过综合独立研究来提高统计学能力,降低II 型错误;当独立研究结果出现矛盾时,解决这种不确定性,弥补单个研究的不足;提高对效应大小的总体估计能力;比较不同研究特点下的分析结果,回答一些独立研究并未提出的问题并为将来的研究指明道路。



2. 2  现代Meta 分析的过程

Meta 分析决不仅仅是一个数学分析过程,它本身也是一项研究,需要认真设计。主要步骤如下。

2. 2. 1  提出所要解决的问题并制定搜集、选择文献的标准 明确指出所要解决的问题是后面几步的基础,如Gurevitch 在提出要检验野外实验中生物相互竞争对生物量的影响程度,首先,将综述文献定于野外实验、竞争和生物这几个关键词上,即实验大背景为野外实验,不包括室内模拟实验。实验对象为植物,影响因素为种间竞争,测量结果为植物生物量。选择文献的标准根据所解决问题来定,既要考虑到文献的全面,又要照顾到计算的可能。

2. 2. 2  搜集文献 这是一项非常繁重且关键的工作。最初的Meta 分析中只搜集已发表文献,后来Meta 分析家们通过调查发现已发表的文献往往不能代表所有研究的真实结果,因为在统计学检验中显著性较小的研究较显著性较大的研究更易于发表。所以后来的综述者为了能搜集到全面的文献,通过各种途径来最大可能地收集已发表的和未发表文献(包括正式期刊中的论文、会议论文、摘要以及各种私人交换资料等) 。文献检索中要联机检索与手检相结合,并重视所得文献的参考文献。对一些基本内容符合要求,报道不详者,可通过与作者联系获取分析所必须信息,这一点需要科研工作者具有良好的合作精神。

2. 2. 3  标定各研究的特点,并对其进行分类 要结合独立研究,综述者必须对各研究作充分的了解,目前正规的做法是先将各研究的实验设计,包括取样是否随机、研究背景、研究方法、样本大小、结果测量、统计分析方法等罗列出来,然后一般根据研究背景将所有研究分为几级别或类(class) ,以作比较。

2. 2. 4  定量测度研究特点 研究特点的不同会影响实验结果,也即各研究的质量不同,如果在分析时对这些质量不等的研究给予相同的结合标准,必然会导致分析结果的不准确,为了克服这一问题,分析家们提出了定性Meta 分析,即先对前面所罗列的研究特点按重要程度进行打分,然后指定两位分析者按照评分标准对所有的研究进行盲打分,即事先将各研究的作者、所在出版物名及发表日期全部隐藏起来进行评分,如果二位的评分结果相似性高,则接受此评分标准,然后取二人的平均值;如果二位的评分结果一致性较差,则重新制定标准。

2. 2. 5  结合研究结果并结合研究特点来分析结果 也有人称这一步为定量Meta分析,以相对于定性Meta 分析。目前已发展出多种Meta 分析方法。但它们的基本思想是一致的,那就是先提出假设,构造一个综合统计量,然后计算各研究的结合统计量,并用其在定性Meta 分析中所得分数去权重它的综合统计量;计算各级别研究中的加权平均综合统计量(在平均过程中,要根据其各结合统计量的方差进行权重) ;做各级别中研究间统计量的异质性检验。

Meta 方法的不同主要在于结合统计量和统计假设的不同。根据结合统计量的不同可将Meta 分析方法主要分为三类:第一类的综合统计量为效应值,它适合于测量结果为连续数据的独立研究,目前主要应用于社会科学(教育学、心理学等) 、临床医学和生态学中,它可反映一个程序或现象的效应大小和方向,它的计算公式为:d = ( Xe - Xc) / S , 其中Xe 为实验组平均值, Xc 为对照组平均值, S 最初为对照组标准差,以后多用两组共同标准差。但不幸的是,许多文献中并不报道标准均值,省略掉了。于是Glass 提出了以最终统计量t2值、F2值或确切的P2值来转换成值[9 ] 。第二类主要应用于流行病学、病因学、大众健康学等医学领域中,综合统计量为相对风险度或风险度比(relative risk、risk ratio)Pe/ Pc 或风险度差( risk difference) Pe -Pc , Pe 为实验组中的风险度, Pc 为对照组中的危险度,它适合于测量结果为二元数据的独立研究。第三类为80 年代末在医学领域中发展出的回归方法,其结合统计量为药量- 反应斜率( dose - reponseslope) ,由回归方法得出的,它适合于测量结果为分类数据的独立研究;根据统计假设的不同可将Meta 分析方法分为两类:固定效应模型和随机效应模型,前者假设所有研究享有共同的真实效应大小,后者假设所有研究的真实效应大小不同,具体体现在计算所有研究平均效应的权重上,当前在医学中常用的固定效应模型为Mantel Haenszel 法和由其改进的Peto 法,O2E 法是典型的随机效应模型[34 ] 。由于随机效应模型比较符合实际,得到了Meta分析家们的认可,正被广泛应用开来。

Meta 分析一个重要的目的就是要比较不同研究特点下的分析结果,如Gure vitch 在研究竞争对生物生物量的影响时,对几个级别间的效应大小做了比较[8 ] 。Matthew 在做饮酒与女性乳腺发病率关系的Meta 分析时,对不同的日饮酒量与病发关系作了对比[36 ] 。各级别差异可用x2来检验。

Meta 分析还对所有研究间或各级别内研究间的异质性进行检验,一般都用x2检验法,以验证假设的正确与否。

2. 2. 6  报告分析结果 包括评估效应,指出研究中实验设计、数据分析等的不足并通过综合为将来这一主题的研究指明方向。最近有人用图表法来报告Meta 分析结果[37 ] 。



3  Meta 分析的优点和不足



3. 1  优点

在Meta 分析正式出现之前,已经有两种综合方法。第一种为传统的描述性综述。它有两个基本缺点,首先,它并未用任何系统方法来对所综述内容的原始数据进行收集、综合,而且综述者在综述过程中往往主观性太强,过分依赖自己的实验结果,常反映自己的观点,所以不同的综述者会得出不同的综述结果[37 ] 。第二,综述者并未将文献定量综合,所以当所研究实验数量不断增加时,得出错误结论的机率也随之增加。第二种为数表决法(vote - counting、box - SCORe analysis) 。它是最简单的定量综合方法。综述者往往将要综合的实验研究按统计结果的不同分为三类:在一个方向上统计检验显著;在反方向上统计检验显著;统计检验不显著。然后采取投票表决方式,数量最多的一类被认为具有代表性,反映近似真实结果。此方法没有考虑综合的各实验研究的样本大小和效应大小,是一种简单的举手表决法,不具有统计性质,也有失科学性。

与上述两种方法比较,Meta 分析设计较严密,有明确的选择文献标准;系统地考虑了研究的方法、结果测量指标、分类、对象对分析结果的影响;给出了测量指标(结合统计量) ,提供了一种定量估计效应程度的机理,分析结果较前二者客观性强,具有科学性;提高了文献的综合统计能力;现代Meta 分析考虑了独立研究的质量问题。



3. 2  Meta 分析的不足

目前有关Meta 分析的不足可归纳为:

3. 2. 1  发表偏见 几乎所有作者及编辑都有更愿意报道统计检验显著结果的趋向,所以综述者被限于在发表物中综合独立研究结果,有可能导致效应大小的高估计。在一项调查中,58 名工作者说他们共做了921 个随机对照实验, 96 个( 10.42 %) 未发表,且正效应结果明显比负效应结果更易于发表[38 ] ;再者,已发表论文所用的实验方法也未必一定好于未发表者。为了克服这一缺点,现在Meta 分析者在搜集资料时既包括了已发表物,也包括未发表物。但有人反对这样做[39 ] 。

3. 2. 2  发表物中缺少综述者所需数据 在实践中,有许多已收集的文献,由于对最初实验结果的有选择性报道、错误的分析、对原始数据描述不完整等原因而不能被利用,大大降低了Meta 分析的综合能力。

3. 2. 3  不对等比较,也有人称为“桔子与苹果问题” 许多学者指出各研究的对象、结果测量指标不同会影响最终分析结果,好象将桔子与苹果拿来比较一样,很难得出正确的结论。但也有人认为扩大总体概念会提高综合能力, 结论更具实用性。Peto 指出为解决同一问题而进行的实验,其综合结果具有相同的方向[40 ] 。

3. 2. 4  综述对象最初数据质量不等 如果在分析时对这些质量不等的研究给予相同的结合标准,必然会导致分析结果的不准确,为了克服这一问题,分析家们提出了定性Meta 分析。

3. 2. 5  综述者对综合结果的解释有偏见。

3. 2. 6  不可避免的非随机性选择独立研究 因为统计显著性检验要求样本是从遵循一定分布规律的总体中取样得来,所以非随机选取研究和对同一数据进行多次检验(重复报道部分或全部数据或者用同一作者的多个结果) 都是违反上述假设的。但事实上,前5 个问题是所有综述方法的共同弊病,但在描述性综述和数表决法中它们隐藏了起来,并未直接暴露出来,而在Meta 分析中却把它们显露无遗。我们已经看到这样一个事实,Meta 分析正在逐步努力克服这些问题,而且已经取得了可喜的进展。但是再好的Meta 分析也不能代替独立研究,它们是Meta 分析的基础。综上所述,Meta 分析作为一种结合独立研究的统计学方法,具有传统综述不可比拟的优越性,它在这短短20 年中的迅猛发展是最好的一个见证。

TOP

TOP

发新话题