Research

如何进行临床科研设计(之一)

医学科研方法及统计学处理
如何进行临床科研设计(之一)

罗德诚 华西医科大学附属第一医院临床流行病学教研室
下一页 >>

  临床医学在一开始就是经验医学。临床医师根据个人医疗实践经验的积累和学习他人实践经验的相关报道,不断提高,确也解决了许多常见病和一些疑难病症的诊治;还可以将自己诊治过的单个或多个自认为有交流价值的病案整理成文送杂志社发表。个案交流虽然也是科研的一种形式,但由于病人对诊治措施反应的个体差异,对甲病人有效的诊治措施,用于患相同疾病、同一程度病情的乙病人就不一定能获得同样好的效果。即使经过长期积累的对多个病人诊治经验作回顾性研究报道,也不能认为该经验一定就是成熟的。因为,这时除了专家成型的诊治措施之外,还有许多其他因素在起着协同或制约的作用(称为混杂性偏倚) ,而在多个病案总结中要排除混杂因素的影响是十分困难的;而且,这种个人经验又往往只报道成功的,以致难以评定该个案研究成果的真正价值。将许多医师对同一种疾病的诊治经验集中成组进行分析,其时间跨度可以较短,受时间、环境因素的影响较少,病例数也可以较多,抽样误差较小,但这也是一种回顾性总结性研究,资料不全常见,偏倚较多,如果在分析中不采取特殊统计方法排除偏倚,其结论的真实性,仍值得怀疑。
  通过探索性实践,有的临床医师采取了前瞻性的、有对照的、有一定病人数量(样本量) 的临床研究设计,控制了主要的偏倚,取得了较好的效果。20 世纪70 年代末期,西方医学界将流行病学的方法学与临床医学相结合,再次提出了临床流行病学的概念,由临床医师设计,以同一种疾病的病人群体作为研究对象,并有医学统计学家参加设计和对研究数据的处理,使研究结论更接近于真实,将其成果用于指导临床工作已取得较好效果。由于医学模式向社会- 心理- 生物模式转变,以及卫生资源短缺,在临床科研中又增加了社会学、心理学、卫生经济学的内容。我国于1980 年秋开始引进临床流行病学这一概念。20 世纪90 年代后期我国引进的循证医学这一概念,更是以临床流行病学为基础,吸取其精华并加以发展,将具有充分论证强度(说服力) 的临床研究成果(证据) 与临床应用紧密结合。它提倡临床医师认真负责,不带偏见地运用个人临床专长,将自已负责诊治病人的实际情况与以病人为对象的系统研究所获得的当前最好的、最能反映真实性的证据的文献进行最完美的结合,对该病人作出决策。它主张对病人所患疾病的诊断、病因、预后和应采用的防治措施都要言之有据。凡属与病人有关的病因和发病危险因素的探讨及预防方法,疾病发生发展的机制,新的、准确度高的诊断,特别是早期诊断方法,确实有效、安全的治疗方法,判断预后的指标,影响预后的因素和改善预后的措施,护理在病情转归、治疗、康复上所起作用和护理措施以及合理用药减少卫生资源的浪费,乃至卫生管理、药政管理、医院建设等等方面的研究,都属循证医学研究范畴;在此,有了符合研究目的和现有研究条件(可行性) 的最恰当的临床科研设计,通过资料收集、整理、统计处理、分析,才有可能获得较为反映真实的结论,提供较好证据。20 世纪90年代初在英国成立的Cochrane 协作网,对具体疾病进行系统文献评价的工作,就是主张将全世界已发表的各科常见疾病治疗的随机对照试验的研究论文集中起来进行分析评价;由于这种设计类型对偏倚控制较好,集中起来的病人数量大,通过评价后确认的对该疾病治疗有益的经验或教训的可信度较高,更接近于真实。协作网将他们的评价和结论作成二次文献或图像资料,向医学界广为传播,供临床医师更好地应用该成功经验于临床,既造福于病人,又避免临床医师重复那些已经有可靠结论的研究而造成的浪费。而且他们还针对新发表的随机对照试验的若干文献又适时再次进行系统评价,不断予以更新,保持经验的先进性。华西医科大学附属第一医院已参加了该国际性协作网,并经卫生部批准于1997 年建立了我国第一个Cochrane中心,开展人员培训和组织文献系统评价工作。懂得临床研究设计的原则和方法,对于选择文献进行系统评价或学习应用是有帮助的。
  选好题目是进行临床研究的第一步。我国幅员辽阔,各地自然条件、环境因素、生活习惯、经济、文化发达程度等等差别甚大,常见病、地方病也有差异。因此,选题首先要考虑我国或本省、本地区发病率、死亡率或致残率高、对人民群众危害大、对国家社会带来沉重负担的那些疾病。例如,在《北京地区儿童急性下呼吸道感染(ALRI) 的病原学研究》[ 1 ]一文中,首先提出儿童ALRI 是儿科常见病, 占儿科住院构成比的24.5 %~65.2 %。5 岁以下儿童每年有105 万人死亡,其中30 万死于肺炎,为该年龄组的第一位死因,表明了本课题的重要性。国家或省市卫生部门、科委往往也提出研究课题方向进行招标,资助研究经费;也有可能是研究人员所在单位接受药品生产研制单位或其他单位的委托,进行临床研究;还有临床的硕士、博士研究生在导师指导和支持下选定的课题;医院或医药卫生研究所也可能设立基金,拨出专项经费鼓励和支持年轻医护人员进行起步科研,自选题目,作出研究计划去争取。在确定题目之前,需考虑两件事。首先,要查阅有关文献(近5~10 年内) ,如所查文献设计正确,资料收集完整可靠,统计方法合理,结论可信,答案是肯定的,问题已经解决,就没有必要去重复研究;如答案是否定的,也不需要再去重复;如果设计方案不合理,存在选择性偏倚(研究对象的来源、诊断标准、入选标准、样本数等等存在的问题) 或资料收集方式、失访等方面的问题,不论其答案如何,都可以重复验证。其次,看研究的可行性。除必要的研究经费需要争取之外,还要看病人来源能否有保证,以及主要设备、技术力量(特殊检查、治疗、统计、电脑操作) 、拟采取干预措施的安全性、指导力量、辅助人员等情况。如为回顾性研究,要看所用病历记录的完整性如何;如为前瞻性研究,若研究周期过长、失访过多,将降低结果的真实性;再如有关科室领导的支持等等,都对可行性有一定影响。
  关于研究设计方案,从研究问题的性质看,可以分为①因果联系研究:包括病因或发病危险因素、发病机制或影响预后因素的研究,预防疾病或其合并症措施的研究,疗效或治疗副作用的研究;②现状调查研究:包括发病率、死亡率、患病率等的调查; ③诊断性研究:包括诊断方法研究,预测预后指标的研究。本文从临床常用方面考虑,只介绍因果联系研究设计和诊断性研究设计。

  1  因果联系研究设计
  从因果联系走向看,因果联系研究有三种设计。
  a、 前瞻性研究设计:即由因求果。在研究开始时,病人只暴露于因,其结果还未出现,研究设计就是观察其果。这个因可能是假定的致病因素,发生了或不发生某病就是其果。例如,对某村饮用沟渠水儿童调查腹泻发生率就是果;不同饮水习惯如喜饮生水或煮沸水的腹泻发生率的差别,就可确定饮用水与腹泻的因果联系。又如《硫酸丁胺卡那霉素对新生儿耳毒性作用的研究》[ 2 ] ,以脑干听觉诱发电位作耳毒性监测手段,观察其常规剂量对新生儿细菌感染连用7天的耳毒性副作用。又如各种预防疫苗如白百破、卡介苗、脑炎疫苗、小儿麻痹糖丸用于幼儿是因,预防效果是果。治疗措施是因,疗效有无则是果。所有前瞻性研究的研究对象都要接受2 次以上的检查,第1 次是要确诊他们不存在所要研究的果,第2 次是观察暴露于可疑病因或防治措施后的果。
  b、 回顾性研究设计:即由果追溯其因。在研究开始时,结果已经存在,研究设计是寻找导致该结果的原因。例如《儿童白血病危险因素的Logistic 回归分析》[ 3 ]一文,对白血病住院患儿和居住同一乡、村或居民区,同性别、民族的健康儿童(年龄相差3 个月) 进行调查,发现住地距化肥厂近者家族子女发生白血病相对危险度增高,证实了环境污染可能为儿童白血病的高危因素;其研究设计类型属于本文后面提到的病例对照研究。
  c、 横断面调查研究设计:即对一个群体或一组病人进行一次性调查,了解因果联系。
  对北京102 例ALRI 患儿和无任何感染征象的健康对照儿童45 例的调查,即属横断面调查[ 1 ] 。又如《病毒性心肌炎和扩张型心肌病粒细胞- 巨噬细胞-集落刺激因子定量分析》[ 4 ]一文,对急性病毒性心肌炎19 例、慢性病毒性心肌炎11 例、扩张型心肌病14 例和正常对照儿童25 例, 检测GM - CSF 并进行比较,也是横断面研究。
  从研究设计类型的论证强度看,论证强度最高、说服力最强的当属随机对照试验( randomized controlled trial ,RCT) 。论证强度较高的还有半随机对照试验(quasi - randomized controlled tri2al) 、自身交叉随机对照试验( randomizedcross2over controlled trial) 、单个病例的随机对照试验(n2of2l randomized controlledtrial) 、组群随机对照试验(cluster ran2domized controlled trial) 和非等量随机对照试验( unequal size randomized con2trolled trial) 等。RCT 这一大类的共同特点是: ①前瞻性的; ②有对照的(成组对照,或在单个病例的不同阶段的药物对照) ; ③病人进入哪一个组(单个病例的RCT 则是接受哪一种治疗) 是由研究者按随机方法预先排定,由不参加设计和收集资料的专人掌握; ④可以实施盲法,即病人和资料收集者及结果判断者都不知道病人接受的治疗(或暴露的因素) 是哪一种,从而防止期望性偏倚(由于知情的心理因素而使病情和客观资料的收集和判断失真,使结果偏向有利于研究的目的) 。
  论证强度较弱的依次有:同一病人(自身) 前后(阶段) 试验(before2after trialon same patients) ,也属于前瞻性,但为非同期进行的研究; (前瞻性) 队列研究[ (prospective) cohort study ] ;回顾性(历史性) 队列研究[ retrospective ( historical1) cohort study ] ;不同病人前后(阶段)试验( beforeafter trial on different pa2tients) ,即前一阶段治疗是回顾性资料,后一阶段是前瞻性的;横断面研究,如前所述;病例对照研究(case2control study) ,所研究的是回忆性的和(或) 病历记录资料。
  论证强度最差的是: ①非随机对照研究( non2randomized controlled study) ,虽然是前瞻性的,也设有对照组,甚至在干预前的组间基线情况具有很好可比性(均衡性好) ,但病人是凭研究者意图,人为安排入组,不可能做到盲法,偏倚甚多; ②叙述性研究(descriptive study) ,它可以是前瞻性,也可以是回顾性的,但其共同特点是没有对照组,说服力较差。有的论文把病人治疗前病情资料作为对照,与治疗后的资料进行对比,称之为“自身前后对照研究”,是一种误解,仍然是叙述性研究,因为病人只接受了一个阶段的有计划的治疗。对于濒临死亡或属于公认的“不治之症”的终末期病人,通过某种治疗,奇迹般地妙手回春的个案或成组病案的报道,虽然是叙述性研究,也是有一定价值的,至少它是提供了一个令人感到可能有希望的信息。
  1.1  研究对象
  a、 根据研究目的,明确研究对象的性质:在研究致病因素的作用或预防某病效果时,研究对象是不患某病的人群;研究治疗效果、预防合并症的效果或疾病预后时,研究对象是患有某病的人。在前瞻性同期对照研究中,上述对象被分为试验组和对照组。在病例对照研究中,对照是不患某病的人,甚至是健康人,如果是研究疾病结局(如死亡) 的影响因素,则为同患某病的死亡与痊愈病例的分组对照。因此,必须首先提出公认的诊断标准,根据标准选择无病的或患有某病为对象。
  b、 研究对象的来源:如果是病人,可来自门诊或住院,后者依从性较好。如是健康儿童可来自幼儿园、学校或居民点。要根据研究目的选择对照。以文献[ 1 ]为例,该院在6 个月中收治102 例ALRI 是否均来自西城区? 未作说明,但对照45 例均来自西城区;季节与AL2RI 关系甚大,两组(患儿与健康儿) 取样的月份分布有无差异? 两组年龄上下限虽然相近,但分布是否相近,未作比较,而且这45 例对照是如何选出来的,也未作说明。又如文献[ 3 ] 中,为了排除环境因素对发生白血病的影响,规定对照儿童住地距患儿住地至少500m ,使对照儿童远离化肥厂,从而夸大了化肥厂所致环境污染对白血病发生的作用,如果不采用住地限制条件而以距化肥厂的距离(5 种) 对两组作分层分析,也许更具说服力。
  c、 确定纳入和排除标准:符合诊断标准的病人不一定都能成为研究对象。病人的性别、年龄、病情轻重的差别对结果可能有不同影响,随访条件对结果的收集也可能造成困难,病人是否可以纳入研究或患儿家长是否同意参加研究等,都必须在设计中设置纳入标准以限定研究对象的范围。此外,还要确定排除标准,即如果病人严重营养不良,合并有其他重要疾病可能影响研究结果,或观察项目有血常规、尿常规、肝肾功能,而研究对象已经有肝、肾、造血系统功能异常时,均属于不应纳入研究的范围,这些即属排除标准。病人符合纳入标准、又不属排除对象时方符合入选条件。在治疗性研究中全部病人均需符合入选条件。任何成组的研究设计都应确定纳入和排除标准。有些研究设计把某病的诊断标准作为纳入标准,是概念上的混淆。
  d、 研究对象人数(样本数) :也要在设计时作出估计。太多样本,不仅浪费人力、物力资源,而且会使那些在临床上本无意义的差别却出现了统计学上的显著性差异。例如《儿童幽门螺杆菌相关性胃十二指肠疾病的药物治疗研究》[ 5 ]一文中,采用4 种方案,分4 组治疗,原计划每组50 例,但在满200 例后,因D组疗效较好,乃将过多病例分入D 组达134 例,HP 根除率达91 % ,以致同B 组(标准方案组,58 例) HP 根除率81 %相比较,χ2 = 3.847 ,刚达P < 0.05 显著性水平。但两组例数悬殊,根除率差值为10 % ,提高程度12.3 %(0.1 ÷0.81) ,从临床上看, 疗效提高度不大, 而P <0.05 。设将D 组例数减半为67 例(仍高于原计划的50 例) , HP 根除率仍为91 % ,计算χ2 = 2.65 , P > 0.05 。而且C组HP 根除率为93 % ,因例数为45 ,其χ2 = 3.264 , P > 0.05 。可见,样本数太大,可以使临床意义不大的差别,反而达到统计学上的显著差别。反之,样本太小,又会使得在临床上本来有意义的差别达不到统计上的显著性。例如《静脉注射大剂量人体丙种球蛋白冲击治疗儿童系统性红斑狼疮》[ 6 ]一文中,在治疗前的基线资料对比中,有狼疮危象合并感染者在IVIG 组20 例中占7 例( 为35 %) ,在对照组15 例中只有1 例(为6.7 %) ,相差悬殊,但经直接概率法计算P = 0.0567 ,刚刚达不到< 0.05 的显著性水平。两组住院病死率为10 %∶20 % ,相差10 % ,但降低度却达50 %[ 即(0.2- 0.1) ÷0.2 ] ,但直接概率法计算P =0.32 。这些现象的不一致,显然与样本数不足有关。有关统计方面的内容,在本次专题连续讲座中另有专家著述。
  1.2  资料收集
  资料收集是科研工作中的重要环节之一。它是研究者据以分析、比较并作出结论的物质基础。收集者必须认真负责,如实地、按计划、保证质量完成。资料收集的内容、方式,以及期限和质量控制,都应在设计书中确定。
  a、 收集内容的来源:回顾性研究系采用病历记录、病人及有关亲属的回忆资料,填写(由本人、亲属或受过专门训练的访谈员代填) 问卷;对健康对照者除进行必要检查确诊不患有相关疾病外,也要作相同问卷调查。问卷内容应根据所研究疾病特点,文字表达明白具体,容易理解,经得起重复性检验。对个人隐私应予保密,有时要订出在什么环境条件下进行问卷调查。
  对前瞻性研究,应确定终极目标。如为发病危险因素或疾病预防研究,终极目标是疾病,应确定诊断标准;如为治疗性研究,应确定疗效标准,对客观资料的检测应做重复性检验并做好质量控制。
  总观察期及观察频度应结合病种、病情及干预措施起效期确定;如为成组对照,两组总观察期及观察频度应相当。观察期愈长,失访率难免增高。一般认为,失访率低于10 % ,其随访结果尚属可信;如失访率超过20 % ,由于下落不明太多,其随访结果不可信;如失访率在10 %~20 % ,需作校正处理。如为成组对照的治疗性或预防性研究,则将试验组的失访数作为无效,并将对照组的失访数作为有效,重新计算并作统计学处理,如组间差别仍有临床意义,而且统计有显著性,表明失访对研究结果影响小,其试验药物有效的结论可以接受;如组间差异变小或差异虽有临床意义,但统计无显著性,表明失访对结果影响大,使本来可能有效的研究结果,由于失访太多而无法证实。
  在预后研究中,对一定观察期之后的某种疾病的事件发生率(病死率、复发率? ?) 的正确评价也会受到失访的影响。此时,可计算最高和最低事件发生率,并与根据实际随访数计算而得的事件发生率相比较,如差别不大则此失访率可以接受。刘正乐[ 7 ]文中所举的两个失访的例子对预后的影响很能说明问题: ①对出院的晚期结核性脑膜炎95 例进行随访,失访5 例,随访率94.7 % ,因本病致死者35 例,病死率为38.9 %(35÷90) 。假定失访5 例全部死亡,其最高病死率应为( 35 + 5) ÷( 90 + 5) , 即42.1 %;假定失访5 例全部存活,其最低病死率应为35 ÷(90 + 5) = 36.8 % ,它们与38.9 %都很接近,表明失访数或失访率对病死率的观察没有显著影响,其预后结论可信。②但如事件发生率本来就很低,失访数虽然不多,但却会对结果有较大影响。随访县医院麻疹出疹期患儿102 例,失访6 例,随访率94.1 %(与前所举例子相近) ,随访到的96 例中死亡1 例,观察病死率为1.04 %。同上法求最高病死率为: (1 + 6) ÷(96 + 6) =6.86 %;最低病死率为: 1 ÷(96 + 6) =0.98 %;最高病死率为最低病死率的7倍,而且6.86 %与1.04 %也相距甚大,因此表明失访数的影响大,还不能接受麻疹随访病死率1.04 %的结论,其正确结论有待进一步研究。因此,在研究预后时,除失访率对研究结果有重要影响外,事件发生率愈低愈容易受失访数的影响。故应力求降低失访率。有的研究者在设计时,将样本数适当扩大(扩大数不超过10 %) ,但在操作时,还是要尽量减少失访数,降低失访率。文献[ 6 ] 所报道的两组失访率分别达到22 %和41 %;另一文献《出生3 天内新生儿惊厥88 例分析》[ 8 ] 的( 6 ~ 12 个月) 失访率高达68 % ,均影响了随访的质量。总观察期如太短,疗效或终极目标(如发病) 尚未出现,则无法作出评价。因此,应结合专业知识作出决定。
  b、 资料收集者应尽可能专人负责,并尽可能做到“双盲法”,即病人、收集者、出检验检查报告者都不知病人接受治疗的内容,或“单盲”。以防止期望性偏倚。
  资料的统计学处理,另有专家著述。
  设计模式中常用的英文字母及符号介绍如下。
  N :可供研究的对象或人群总数,或符合公认诊断标准的某病总人数  
  Ne :N 中符合纳入标准又不具备被排除条件的研究对象人数  
  S:分层,即在分组之前,根据对研究终极目标有较大影响的因素将对象进行分层,以保证试验组和对照组间基线状况的匀衡性。例如,在治疗研究中,将对象分为男、女,再按年龄分为6 岁以前和6 岁以后(如果性别和年龄对疾病疗效有较大影响时) ,如再按病情轻重分为两组,则一共有3 个分层因素,将全部研究对象先分为8 种组合(2 ×2 ×2 = 8) ,再进一步在每个组合中分出进入治疗组和对照组的病例  
  R :随机分组  
  QR :半随机分组  
  T :治疗组  
  C:对照组  
  ?:分配入组非研究者所能控制  
  E:暴露于所研究的可能致病因素,或干预措施  
  ?E :未暴露于所研究的可能致病因素,或干预措施  
  D :研究终极目标,如发生的疾病或有效的结果  
  D? 未实现终极目标,如未发生疾病,或无效的结果  
  -| |- :表示随访期或观察期,中间填写时间  
  a、b、c、d :在四格表中,表示例数  
  RR :相对危险度  
  OR :机遇比

下一页 >>

  参考文献
  1  王亚娟,姚德秀,燕润菊,等. 北京地区儿童急性下呼吸道感染的病原学研究. 中华儿科杂志,2000 , 38 (3) : 159
  2  孙伟,俞惠民. 硫酸丁胺卡那霉素对新生儿耳毒性作用的研究. 中华儿科杂志,2000 , 38 (6) : 383
  3  张永年,张晓春,郑传经,等. 儿童白血病危险因素的Logistic 回归分析. 中华儿科杂志,1999 , 37 (10) : 625
  4  徐灵敏,程映霞,邓春琴,等. 病毒性心肌炎和扩张型心肌病粒细胞- 巨噬细胞集落刺激因子的定量分析. 中华儿科杂志,1999 , 37 (5) : 297
  5  康宏庄,查健忠,李冰冰. 儿童幽门螺杆菌相关性胃十二指肠疾病的药物治疗研究.中华儿科杂志,2000 , 38 (4) : 213
  6  吴凤歧,何晓琥,韩彤昕,等. 静脉注射大剂量人体丙种球蛋白冲击治疗儿童系统性红斑狼疮. 中华儿科杂志,2000 , 38 (1) :42
  7  刘正乐. 疾病预后的研究与评价. 见王家良主编. 临床流行病学. 上海:上海科学技术出版社,1990. 50
  8  李秀芬,梁兰英,张蓬,等. 出生3 天内新生儿惊厥88 例分析. 中华儿科杂志,1999 , 37 (1) : 48

《中国实用儿科杂志》2001年1月 第16卷 第1期
下一页 >>