分析性研究的质量评价
顾莺;张慧文;周英凤;胡雁;邢唯杰
【摘 要】澳大利亚JBI循证卫生保健中心作为全球最大的循证协作中心之一,一直致力于推动循证资源的整合、传播和应用.在2016年11月,JBI推出了针对不同类型研究的质量评价工具,以帮助研究者科学评价研究的方法学质量.本文旨在对JBI关于分析性研究的质量评价工具进行详细解读,包括队列研究和病例对照研究,从研究对象的选择、暴露因素的确定、混杂因素的控制、随访及结局指标的测量等方面评价分析性研究的质量.
【期刊名称】《护士进修杂志》 【年(卷),期】2018(033)006 【总页数】4页(P513-516)
【关键词】文献质量评价;分析性研究;队列研究;病例对照研究 【作 者】顾莺;张慧文;周英凤;胡雁;邢唯杰
【作者单位】复旦大学附属儿科医院,上海200032;复旦大学附属儿科医院,上海200032;复旦大学护理学院复旦大学JBI循证护理合作中心,上海200032;复旦大学护理学院复旦大学JBI循证护理合作中心,上海200032;复旦大学护理学院复旦大学JBI循证护理合作中心,上海200032 【正文语种】中 文 【中图分类】R471
分析性研究是指在假设的前提下,在特定人群中通过调查的方法(存在比较或对照),验证假设或提出新的假设[1]。JBI循证卫生保健中心发展了针对分析性研究的质量评价工具,包括队列研究和病例对照研究的质量评价工具,本文主要对JBI的分析性研究质量评价工具进行详细解读。 1 队列研究的质量评价
队列研究是用来检验病因假说、确定疾病危险因素的一种重要的流行病学研究方法[2] 。从一个未患所研究疾病的人群样本中选择和确定两个队列,一个队列暴露于某一可疑的致病因素或者具有某种特征,这些因素或特征被怀疑与所研究疾病的发生有关;另一个队列则不暴露于该可疑因素或不具有该特征;对两组所有观察对象追踪一个时期并分别比较两组在观察期间所研究疾病的发病率或死亡率[3]。JBI关于队列研究的质量评价工具包括11个条目[4],从研究对象的来源及特征、混杂因素的控制、结局指标的测量等方面评价队列研究过程的质量控制,每个条目均采用是、否、不清楚及不适用进行判定。见表1。
表1 队列研究的质量评价工具条目评价结果是否不清楚不适用1.两组研究对象是否来自于同一人群?2.是否采用相同方式测评两组的暴露因素?
续表1 队列研究的质量评价工具条目评价结果是否不清楚不适用3.是否采用有效且可信的方法测量暴露?4.是否识别了混杂因素?5.是否采用措施处理了混杂因素?6.研究/暴露开始时研究对象是否未出现观察结局?7.是否采用有效且可信的方法测量结果?8.是否报告随访时间且随访时间足以获得结果的发生?9.随访是否完整?若没有,是否描述并探究失访的原因?10.是否采取措施解决不完整的随访?11.资料分析方法是否恰当?
1.1 两组研究对象是否来自于同一人群? 研究对象在组内和组间是否具有相似的特征。两组除暴露条件有差别外,其余各方面特征(如年龄、性别、职业、文化程
度、民族)应尽可能相似。作者应提供在研究开始前即已确定的、用于招募研究对象的、清晰的纳入与排除标准。
1.2 是否采用相同方式测评两组的暴露因素? 高质量的队列研究设计应提到或描述暴露如何测量。暴露测量应清晰且详细地定义,可使读者评价研究对象是否接受了暴露。
1.3 是否采用有效且可信的方法测量暴露? 研究应清晰地描述暴露测量的方法。“有效”即要求使用某一“金标准”与使用的测量方法做比较。暴露测量的效度通常与目前测量方法是否恰当或过去的暴露的测量是否需要有关。信度是确认暴露测量的可重复性的过程,包括外部观察者信度和内部观察者信度。
1.4 是否识别了混杂因素? 如果除了要研究的暴露因素不同外,两组间其他因素也不同,则会对研究结果带来干扰,这些因素就是混杂因素。典型的混杂因素包括基线特征、预后因素、伴随的暴露即与要验证的暴露因素同时存在的其他因素。混杂存在于用于比较的两组间,影响研究结果的方向。一个高质量的队列研究能确定并测量潜在的混杂因素。研究中研究对象的行为态度或生活方式可能影响研究结果,但确定并测量这些混杂因素比较困难。
1.5 是否采用措施处理了混杂因素? 处理混杂因素对研究结果影响的策略应包含在研究设计或数据分析部分。通过对研究对象进行匹配或分层抽样可对混杂因素的影响进行调整。如果在数据分析过程中对混杂因素影响进行调整,文献质量评价员应评估作者使用的统计方法。大多数会使用某种多因素回归分析来解释被测量的混杂因素,如通常使用logistic回归来处理研究中被关注的混杂因素。
1.6 研究/暴露开始时研究对象是否未出现观察结局? 在研究开始时研究对象不应该有结局事件的发生。文献质量评价员可在研究的“方法”部分获得相关信息,通常是在作者描述研究对象/样本招募、定义变量以及纳入/排除标准的内容部分。 1.7 是否采用有效且可信的方法测量结果? 评价员应仔细阅读研究的方法学部分。
如果结果的测量是依据已有的定义或诊断标准,则对该项目的评价为“是”;若结果的测量是通过观察或自评量表,则可能使报告偏倚的风险增加,可出现过高或过低报告的现象,结果的客观性会受质疑。重要的是,由于测量工具可显著影响结果评价的有效性,评价员应确认所选用的测量工具的效度。在已确认结果测量工具的客观性之后,确定测量如何实施仍然重要,包括使用测量工具进行数据收集的培训。如果有多个数据收集员,研究中应描述他们所接受的培训、临床工作经历或研究经历、所要承担的责任等是否相似。
1.8 是否报告随访时间且随访时间足以获得结果的发生? 研究应追踪或随访的时间长度因研究人群的本质及特征、疾病或暴露而不同。通过阅读多个研究报告并关注随访的时间范围,以预估合适的随访时间。专家根据其临床实践经验或临床研究而提供的意见同样可帮助确定适当的随访时间。例如,检验石棉的职业暴露与肺癌之间的关系可能需要较长时间的随访。在队列研究中,随访时间需足够长以获得观察结果。研究问题和研究所关注的结果决定了随访时间的长短。
1.9 随访是否完整?若没有,是否描述并探究失访的原因? 队列研究中较大比例的研究对象被随访很重要。一般而言,至少80%的研究对象的随访时间应完整。通常5%或更少的失访率可认为对研究结果的影响较小,而20%或更大比例的失访则可显著影响研究的有效性。然而,观察性研究需要经过漫长的时间,可以预料到较高的失访率。决定研究是否作数基于对研究对象失访原因的判断,以及失访率在暴露组和非暴露组组建是否可比。作者应报告随访研究对象所作的努力,随访率可认为研究实施良好的一个指标。评价员应在文献中寻找有无关于研究对象的遗漏、排除和失访的明确及合理的描述。如没有,该项目应评定为“否”。
1.10 是否采取措施解决不完整的随访? 部分研究对象可能会因为就业情况的改变而退出研究,部分可能死亡。重要的是应评价这部分研究对象的结果。不完整的随访期可导致选择偏倚。因此,随访时间不平等的研究对象也应纳入分析,应对不同
长度随访时间进行调整,通常使用人年危险度来计算率。
1.11 资料分析方法是否恰当? 在评价资料分析方法时,应考虑对该研究是否可使用更恰当的统计分析方法。在研究的“方法”部分,应足够详细地描述使用了哪种分析方法(尤其是回归或分层)以及混杂因素如何测量。使用回归分析的研究,应判断论文中确定了哪些可能的自变量,这些自变量与结局变量如何相关。如果使用分层分析,应判断是否以特殊的变量对层别进行了定义。最重要的是,应当根据研究假设或研究问题来判断资料分析方法是否恰当,因为即使资料相同,但研究假设或问题不同,分析策略是不同的。 2 病例对照研究的质量评价
病例对照研究是比较某患病者与未患某病的对照暴露于某个或某些可能危险因素的百分比差异,以判断这些因素与该病有无关联及关联程度大小的观察性研究方法[2]。JBI关于病例对照研究的质量评价工具包括10个条目[4],从研究对象的特征、混杂因素的测量及控制、结局指标的测量、资料分析方法等方面评价病例对照研究过程的质量控制,每个条目均采用是、否、不清楚及不适用进行判定(见表2)。 表2 病例对照研究的质量评价工具条目评价结果是否不清楚不适用1.两组患者在疾病或暴露进程中是否具有可比性?2.病例与对照的配对是否适当?3.病例与对照是否使用同样的识别标准?4.暴露因素的测量方法是否标准、有效及可靠?5.病例与对照的暴露因素的测量方法是否相同?6.是否确定混杂因素?7.是否采取措施控制混杂因素?8.结局指标的测量方法是否标准、有效及可靠?9.暴露时间是否足够长?10.资料分析方法是否恰当?
2.1 两组人群在疾病或暴露进程中是否具有可比性? 两组人群应来源于相同的病例人群。这通常是通过个体匹配完成的,即除了暴露因素外,对照组应基于与病例组相似的特征纳入每一个患者。频率或组匹配是另一种替代方法。如果两组人群不匹配会导致选择偏倚。
2.2 病例与对照的配对是否适当? 如条目1所述,研究应包括病例来源人群的明确定义。应该仔细查看病例和对照组被招募的人群来源。例如,癌症登记处可以用来招募参与研究肺癌风险因素的研究人群,这是基于人群的病例对照研究的典型代表。可以从目标人群,来源人群或者从一批符合条件的参与者(例如在医院病例对照研究中)中选出最终的研究对象。
2.3 病例与对照是否使用同样的识别标准? 需要根据特定的诊断方法或定义来确定患者是否应被纳入,如此更有可能降低偏倚风险。特征法是组间匹配的另一种有用的方法,未使用规定的诊断方法或定义的研究应提供关键特征匹配的证据。病例的定义应清晰。同样重要的是,对照组必须满足除与疾病诊断有关的其他定义以外的病例组的所有资格标准。
2.4 暴露因素的测量方法是否标准、有效及可靠? 研究应清楚地描述暴露因素的测量方法。评估有效性需要一个“金标准”以供比较。暴露因素测量的有效性通常与目前使用的测量方法是否合适或者过去暴露因素是否需要测量有关。
病例对照研究可能会调查与病症相关或不相关的许多不同的暴露因素。在这些情况下,评审人员在使用该工具进行质量评价时,应该使用主要暴露因素来回答这个问题。可靠性主要包括在流行病学研究的过程中,以检查暴露因素测量方法的可重复性。这些通常包括观察者内部的可靠性和不同观察者间的可靠性。
2.5 病例与对照的暴露因素的测量方法是否相同? 如条目4所述,研究应清楚地描述暴露因素的测量方法。应该明确定义暴露因素的测量方法并进行详细描述。病例组和对照组应通过相同的过程或方案对暴露或风险因素进行评估。
2.6 是否确定了混杂因素? 如果除了要研究的暴露因素或干预措施不同外,各组间的其他因素也不同,会对结果带来干扰,这些因素就是混杂因素。典型的混杂因素包括基线特征,预后因素或其他伴随的暴露(例如吸烟)。 混杂因素是组间的差异,它会影响研究结果的方向。一个高质量的病例对照研究,应该事先识别潜在的混杂
因素,并尽可能在研究中对其进行测评。但如果行为、态度或生活方式是混杂因素,则识别将非常困难。
2.7 是否采取措施控制混杂因素? 可以在研究设计或数据分析中进行混杂因素的处理。可以通过对参与者进行匹配或分层抽样的方法进行混杂因素的调整。在数据分析中对混杂因素进行调整时,需评估研究中使用的统计数据。多数会采用多元回归分析的方法去解释混杂因素。注意统计方法的描述,通常采用logistic回归等方法处理混杂因素。
2.8 结局指标的测量方法是否标准、有效及可靠? 通过阅读论文的方法部分来评价该标准是否达到。例:如果根据现有的定义或诊断标准对肺癌进行评估,该项评估为“是”;如果肺癌是通过观察者报告或自我报告的量表来评估,则过度报告或漏报的风险就会增加,客观性会打折。重要的是,测量工具是否有效对结果评估的有效性有重要影响。
确定客观的结果测量(如肺癌病例)工具,对测量方法的实施非常重要。是否对参与收集数据的人员进行仪器使用的培训和教育(如放射科医师)?。如果有多个数据收集者,是否评估他们在受教育水平,临床,研究经验或工作责任心方面的相似性? 2.9 病例随访或回顾时间是否足够? 在病例对照研究中尤其重要的是,暴露时间必须足以显示暴露与结果之间的关联。暴露时间太短或太长均可能影响结果。 2.10 资料分析方法是否恰当? 正如对统计分析的任何考虑一样,应该考虑是否有更合适的替代统计方法。此外,可以根据研究假设来评估资料分析方法是否恰当,因为不同分析方法的选择是基于不同的研究问题或假设。 参 考 文 献
[1] Kenneth F.Schulz,David A.Grimes.《柳叶刀》临床研究基本概念[M].北京:人民卫生出版社,2010:16.
[2] 姜庆五.临床流行病学[M].北京:高等教育出版社,2007:58.
[3] 徐飚.流行病学原理[M].上海:复旦大学出版社,2007:101. [4] The Joanna Briggs Institute.Joanna Briggs Institute Reviewers' Manual:2016 edition[M].Australia:The Joanna Briggs Institute,2016.
因篇幅问题不能全部显示,请点此查看更多更全内容