疾病分析统计数据库
Tel : 400-6010-180
Statistics
临床科研中统计指标和检验方法的选择
临床科研中统计指标和检验方法的选择
计数资料
将观察单位按某种属性或类别分组计数,得到各组观察单位数称计数资料(enumerationdata)。例如:测量人体味觉,正常30例,异常20例;诱发性耳声发射(EOAE)阳性例数,阴性例数;观察治疗效果的治愈人数与未愈人数。分属于各组的观察单位间有质的差别,不同质的观察单位不能归在同一个组内。统计指标的选择及应用
计数资料经过整理后,得到一些绝对数字,但在进一步对比分析中,仅看绝对数字是不够的,因为绝对数往往不便于相互比较,故计数资料的统计指标采用相对数。相对数是两个有联系的指标之比。常用的相对数有率和构成比。
一、率(rate)率又称频率指标,它说明某现象发生的频率或强度,常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式如下:
率=某现象发生数/可能发生某现象的总数×100%(或1000‰……)式中的100%或1000‰等,主要依据习惯,使算得的率至少保留一、二位整数。例如402例眩晕及平衡障碍患者中,出现眼震者159例,眼震发生率为159/402×100%=39.6%。
二、构成比(constituent ratio)构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。计算公式为:
构成比=某一构成部分的个体数/事物各构成部分个体数的总和×100%
例如28耳术后疗效分析结果如表1。四组构成比之和为100%。
表1 28耳术后近期听力提高结果
听力提高(dB) 耳数 构成比(%)
0~10 1 3.6
11~20 15 53.6
21~30 9 32.1
31~40 3 10.7
合计 28 100.0
注意事项:有人统计过1984年中华医学会五种主要杂志(内、外、妇、儿、中华医学)论文中,用相对数的有278篇,其中误用31篇,误用率为11.2%,可见此误用较普遍。
在应用中要注意区别率与构成比,率是频率或强度指标,而构成比只表明某事物内部构成的比重,公式亦不同,以比代率是论文中经常发生的错误。以“对汉、回族各年龄组花粉症患病情况的研究”中的资料(表2),说明率与构成比的区别。
从表2可见汉、回两组患病的构成比17~34岁组最高(46.42%及65.22%),但并不能认为花粉症好发于17~34岁年龄组。若要分析花粉症的好发年龄组应对比患病率(强度指标),可见汉族35岁以上花粉症患病率最高,回族35~44岁组最高,45岁以上有所减少。构成比只能表明在所检出患者中,年龄分布特点,而患病率才能表明各组的患病强度。在计算过程中它们的分母不同,在应用中不要以比代率。
计算相对数的分母一般不宜过小,如观察治疗两例患者,一例有效,即报道有效率为50%。显然这个有效率是不可靠的,不能正确反映真实情况。
表2 汉、回族各年龄组花粉症患病情况
汉 族 回 族
年龄(岁) 调查人数 患病人数 构成比(%) 患病率(%) 调查人数 患病人数 构成比(%) 患病率(%)
0~16 2816 17 6.41 0.60 265 1 4.35 0.38
17~34 2617 123 46.42 4.70 350 15 65.22 4.28
35~44 892 58 21.89 6.50 59 6 26.08 10.17
45~ 1048 67 25.28 6.39 56 1 4.35 1.79
合计 7373 265 100.00 3.59 730 23 100.00 3.15
计算观察单位不等的几个率的平均率时,不能将几个率直接相加求其平均率。例如计算汉族花粉症平均患病率时不能用(0.60+4.70+6.50+6.39)/4×100%=4.55%,应该用总的患病人数除以总调查人数。265/7373×100%=3.59%。
检验方法的选择及应用
对率和构成比的显著性检验方法最常用的是卡方(χ2)检验。可分为四格表及行×列表χ2检验。根据资料特点又有独立样本和配对资料之分。
一、四格表χ2检验
1.两个率(构成比)的显著性检验:例如调查饮酒是否为喉癌的发病因素资料如表3:
表3 喉癌患者与健康人饮酒情况
饮酒 不饮酒 计
病例组 54(a) 46(b) 100
对照组 35(c) 65(d) 100
两组(独立样本)原始数据包括两个相互对立、属性不同的基本数据,如饮酒与非饮酒,生存与死亡等,构成四个基本数字,在表中为a、b、c、d,这类资料称四格表。计算中根据样本含量多少及理论值的大小选择不同的公式,此例χ2=7.30,P<0.01,结论:两组饮酒率差异有高度统计学意义,病例组高于对照组。
2.四格表资料相关分析:一个观察对象,具有两种性能,为配对资料。例如:对90例疑为胃癌患者进行胃镜和组织病理学两项检查,根据诊断结果,看两项检查效果是否一致,常用相关性χ2检验,并根据列联系数大小表明相关程度。资料见表4。
表4 胃镜与病理诊断胃癌结果
胃镜
病理 阳性 阴性 合计
阳性 35 7 42
阴性 8 40 48
43 47 90
表4所示:胃镜与病理检查均为阳性者(诊断为癌)35例,均为阴性者(不是癌)40例,两者诊断不一致的为15例,分析两项检查结果是否有相关性,选用四格表关联性χ2检验,
χ2=39.90,P<0.01。结论:胃镜检查与病理检查结果往往一致。进一步计算列联系数r值,r=0.666。r值的范围在-1~1之间,绝对值越大,相关程度越高,r为正值表明是正相关,r为负值表明是负相关。
二、行×列表χ2检验
四格表的基本数据只有2行2列。当基本数字的行或列大于2时,称为行×列表,或列联表。行×列表χ2检验用于多个样本率(构成比)的比较及相关分析。
1.多组率的比较:例如比较正常对照组、癌旁组织、初诊NPC组非二倍体阳性率的资料见表5。
表5 三组非二倍体测定结果
阳性例数 阴性例数 合计 阳性率(%)
正常组 0 30 30 0
癌旁组织 9 21 30 30.0
NPC组 38 63 101 37.6
47 114 161
计算行×列χ2=15.85P<0.01。结论:可认为三组非二倍体阳性率不同。若对比各组两两间阳性率差异是否均有统计学意义,还应进一步用分割χ2的方法比较,本组资料癌旁组织与NPC组阳性率相近(30.0%及37.6%),对比二组作χ2检验,
χ2=0.58P>0.25,可认为癌旁组织与NPC组阳性率相似。将此二组合并再与正常组比较, χ2=36.05P<0.01,结论:癌旁组织和NPC组非二倍体阳性率相似均高于正常组。
2.配对资料的行×列χ2检验:例如面肌麻痹恢复时间与手术疗效关系的分析资料见表6。
表6 面肌恢复时间与疗效关系
疗 效
面肌恢复时间(周) 满意 良好 尚可 合计
0~4 28 26 0 54
5~8 14 24 0 38
9~12 4 10 6 20
46 60 6 112
此例是对同一个人测定两项指标:面肌恢复时间及治疗效果,属于配对资料,要推断面肌恢复时间与疗效有无关系,可作行×列表的相关性检验。χ2=32.45P<0.01。结论:可认为面肌恢复时间与疗效有关。进一步计算列联系数(用C代表)。C=0.4739,面肌恢复时间越短,疗效越好。
只有配对资料,才能进行相关性分析,要注意在检验中独立样本与配对资料整理计算表格的区别。
孙可淳 赵宜著
中华耳鼻咽喉科杂志1996年2月第31卷第1期