Research

临床科研中统计指标和检验方法的选择

临床科研中统计指标和检验方法的选择
II 计数资料
孙可淳 赵 宜  北京医科大学第一医院医学统计室

  将观察单位按某种属性或类别分组计数, 得到各组观察单位数称计数资料(enumerat ion data)。例如: 测量人体味觉, 正常30 例, 异常20 例; 诱发性耳声发射(EOA E) 阳性例数, 阴性例数; 观察治疗效果的治愈人数与未愈人数。分属于各组的观察单位间有质的差别,不同质的观察单位不能归在同一个组内。

  统计指标的选择及应用  
  计数资料经过整理后, 得到一些绝对数字, 但在进一步对比分析中, 仅看绝对数字是不够的, 因为绝对数往往不便于相互比较, 故计数资料的统计指标采用相对数。相对数是两个有联系的指标之比。常用的相对数有率和构成比。
  一、率( rate)
  率又称频率指标, 它说明某现象发生的频率或强度, 常以百分率(% )、千分率(‰)、万分率(1/万)、十万分率(1/10 万) 等表示。计算公式如下:
  率 = 某现象发生数/可能发生某现象的总数×100% (或1000‰……)
  式中的100%或1000‰等, 主要依据习惯, 使算得的率至少保留一、二位整数。例如402 例眩晕及平衡障碍患者中, 出现眼震者159 例, 眼震发生率为159÷402×100% = 39.6%。
  二、构成比(const ituent rat io)
  构成比又称构成指标, 说明某一事物内部各组成部分所占的比重或分布, 常以百分数表示。计算公式为:
  构成比 = 某一构成部分的个体数/事物各构成部分个体数的总和×100%
  例如28 耳术后疗效分析结果如表1。四组构成比之和为100%。

 

  注意事项: 有人统计过1984 年中华医学会五种主要杂志(内、外、妇、儿、中华医学) 论文中, 用相对数的有278 篇, 其中误用31 篇, 误用率为11.2% , 可见此误用较普遍。
  在应用中要注意区别率与构成比, 率是频率或强度指标, 而构成比只表明某事物内部构成的比重, 公式亦不同, 以比代率是论文中经常发生的错误。以“对汉、回族各年龄组花粉症患病情况的研究”中的资料(表2) , 说明率与构成比的区别。
  从表2 可见汉、回两组患病的构成比17~ 34 岁组最高(46.42% 及65.22% ) , 但并不能认为花粉症好发于17~ 34 岁年龄组。若要分析花粉症的好发年龄组应对比患病率(强度指标) , 可见汉族35 岁以上花粉症患病率最高, 回族35~ 44 岁组最高, 45 岁以上有所减少。构成比只能表明在所检出患者中, 年龄分布特点, 而患病率才能表明各组的患病强度。在计算过程中它们的分母不同, 在应用中不要以比代率。

  计算相对数的分母一般不宜过小, 如观察治疗两例患者, 一例有效, 即报道有效率为50%。显然这个有效率是不可靠的, 不能正确反映真实情况。
计算观察单位不等的几个率的平均率时, 不能将几个率直接相加求其平均率。例如计算汉族花粉症平均患病率时不能用(0.60+ 4.70+ 6.50+ 6.39) /4×100% = 4.55% , 应该用总的患病人数除以总调查人数。265/7373×100% = 3.59%。

  检验方法的选择及应用  
  对率和构成比的显著性检验方法最常用的是卡方(V2) 检验。可分为四格表及行×列表V2 检验。根据资料特点又有独立样本和配对资料之分。
  一、四格表V2 检验
  1、 两个率(构成比) 的显著性检验: 例如调查饮酒是否为喉癌的发病因素资料如表3:

  

  两组(独立样本) 原始数据包括两个相互对立、属性不同的基本数据, 如饮酒与非饮酒, 生存与死亡等,构成四个基本数字, 在表中为a、b、c、d, 这类资料称四格表。计算中根据样本含量多少及理论值的大小选择不同的公式, 此例V2= 7.30, P < 0.01, 结论: 两组饮酒率差异有高度统计学意义, 病例组高于对照组。
  2、 四格表资料相关分析: 一个观察对象, 具有两种性能, 为配对资料。例如: 对90 例疑为胃癌患者进行胃镜和组织病理学两项检查, 根据诊断结果, 看两项检查效果是否一致, 常用相关性V2 检验, 并根据列联系数大小表明相关程度。资料见表4。

 

  表4 所示: 胃镜与病理检查均为阳性者(诊断为癌) 35 例, 均为阴性者(不是癌) 40 例, 两者诊断不一致的为15 例, 分析两项检查结果是否有相关性, 选用四格表关联性V2 检验, V2= 39.90, P < 0.01。结论: 胃镜检查与病理检查结果往往一致。进一步计算列联系数r值, r= 0.666。r 值的范围在- 1~ 1 之间, 绝对值越大,相关程度越高, r 为正值表明是正相关, r 为负值表明是负相关。
  二、行×列表V2 检验
  四格表的基本数据只有2 行2 列。当基本数字的行或列大于2 时, 称为行×列表, 或列联表。行×列表V2 检验用于多个样本率(构成比) 的比较及相关分析。
  1、 多组率的比较: 例如比较正常对照组、癌旁组织、初诊N PC 组非二倍体阳性率的资料见表5。

 

  计算行×列V2= 15.85 P < 0.01。结论: 可认为三组非二倍体阳性率不同。若对比各组两两间阳性率差异是否均有统计学意义, 还应进一步用分割V2 的方法比较, 本组资料癌旁组织与N PC 组阳性率相近(30.0% 及37.6% ) , 对比二组作V2 检验, V2= 0.58 P> 0.25, 可认为癌旁组织与N PC 组阳性率相似。将此二组合并再与正常组比较, V2= 36.05 P < 0.01, 结论:癌旁组织和N PC 组非二倍体阳性率相似均高于正常组。
  2、 配对资料的行×列V2 检验: 例如面肌麻痹恢复时间与手术疗效关系的分析资料见表6。

  

  此例是对同一个人测定两项指标: 面肌恢复时间及治疗效果, 属于配对资料, 要推断面肌恢复时间与疗效有无关系, 可作行×列表的相关性检验。V2= 32.45P < 0.01。结论: 可认为面肌恢复时间与疗效有关。进一步计算列联系数(用C 代表)。C= 0.4739, 面肌恢复时间越短, 疗效越好。
  只有配对资料, 才能进行相关性分析, 要注意在检验中独立样本与配对资料整理计算表格的区别。

《中华耳鼻咽喉科杂志》1996年2月 第31卷 第1期