Statistics

医学论文中如何正确使用统计表

医学论文中如何正确使用统计表

  统计图表是一种具有综合性和总结性,完备而准确的叙述数字资料的方法。两者的形式不同,使 用场合也各有侧重,统计图在表示事物的变化趋势、事物间关系和分布方面有其特别的优势,缺 点是对资料的描述不够细致;统计表则容量大,能将数字精确到所需小数位,并有利于进一步作统 计处理,所以应用更为广泛。 根据对2000年《中华内科杂志》、《中华儿科杂志》、《中华预防医学杂志》论著的调查,统 计表的使用率分别为85.0%、87.3%、87.8%,说明统计表在医学论文中有举足轻重的作用,而统 计图的使用率远低于统计表。统计图表的质量较之10年前,应该说有了较明显的进步,但仍存在 一些不足,为了使医学论文中图表的表达更加完美、准确、清晰,在本讲挑选一些有代表性的实 例对表格加以说明,对图的实例说明放在另一讲。 统计表的绘制原则,需强调两点:一是简单明了,二是主谓语划分清楚。核心的问题就是简明可比, 便于交流。如何体现这两条原则,作者从对大量的表格修改中,总结出制表技巧的“五性”,即结构 的完整性、内容的突出性、排列的逻辑性、对比的鲜明性、表达的准确性。其中最重要的是对 比的鲜明性,因为将各组事物列在一张表上,主要的目的就是为了对比,对比就要讲求效果。 1 注意主谓语的排列位置:主语一般为分组、时间(年份、季节)、连续数量(年龄)、程度(等级)等 ,应置于表左侧;谓语为数字指标,应置于右侧。这样排列的好处是突出了主语,使具不同单位的指 标整齐划一(小数位一致,单位一致),适于习惯上的上下对比。在复合主语时,可将部分主语置表 头,在简单表时,对同性质(计数或计量)单位相同的指标亦可灵活排列。 例1:分析Ku抗体阳性和阴性患者的临床特点,结果如表1,除了主谓语倒置问题外,该表除2个平均 数外,余均为计数数据,且项目多。可将年龄和病程2项移于文字中叙述,性别不要排成分数,为加 强两组的对比性,还可增加相对数(Ku抗体阳性组总例数虽较少,但为了对比仍可计算相对数),仍 可原样排列如表2。

  表1 Ku抗体阳性和阴性SSc患者的临床特点比较

项目 Ku抗体阳性组(11例) Ku抗体阴性组(46例) P值 χ2
年龄(岁) 41.3±9.7 46 3±15 0>0 05 -
性别(男/女) 0/11 3/43 - -
病程(年) 8.7±6.3 11±9.9 0.05 -
躯干皮肤硬化 2 19 0.49 0.47
关节痛/炎 7 20 0.49 0.48
肌炎 9 6 0.005 7.88
肺间质纤维化 3 21 0.67 0.18
肾脏受累 1 5 0.70 0.15
中枢神经系统受累 0 2 - -
ANA阳性 8 40 0.73 0.12
                                表2 Ku抗体阳性和阴性SSc患者的临床特点比较 例数 百分比(或率,%)
临床表现 阳性组(11) 阴性组(46) 阳性组 阴性组 χ2 P值
性别:男 0 3 0.0 6.5    
11 43 100.0 93.5 - 0.52
躯干皮肤硬化 2 2 18.2 41.3 0.47 0.49
关节痛/炎 7 20 63.6 43.5 0.48 0.49
肌炎 9 6 81.8 13.0 7.88 0.005
肺间质纤维化 3 21 27.3 45.7 0.18 0.67
肾脏受 1 5 934 10.9 0.15 0.70
中枢神经系统受累 0 2 0.0 4.3 - 0.65
阳性 8 40 72.7 87.0 0.12 0.73
                                                           

注:表头( )中数字为总例数,无χ2值者为精确检验P值

表3 精液质量在各组男工中的比较(x+s)

精液参数 暴露组(70例) 内对照组(90例) 外对照组(132例)
凝集度(级) *1.40±0.95 1.30±0.98 1.06±0.91
体积(ml) 2.91±1. 41 3.24±1.39 2.67±1.44
酸度 7.31±0.37 7.28±0.34 7.34±0.32
活动度(级) 1.97±0.63* 1.97±0.69* 2.56±1.61
活动精子百分率 0.55±0.16* 0.55±0.17* 0.60±0.13
精子浓度(×109/L) 55.92±36.38 54.18±32.88 63.13±35.89
精子总数(×106) 149.74±106.45 165.68±118.901 56.98±109.67
                                       

*与外对照组比较P<0 05 例2 :观察低浓度混苯暴露对精液质量的影响,结果如表3。表3属于主谓语倒置,应调整排列为表 4。

2 注意数字间联系性: 例3:表5为南方汉族人群中血管紧张素转换酶(ACE)基因型的性别间分布情况。表头中3种分型 是有联系的,其和为总人数,对比的也是两性的基因型分布,故排列时应按绝对数和相对数归类排 列,这样有利于数字核对(表6)。

表5 ACE基因多态性在我国汉族人群中的分布 ACE基因型

性别 例数 II DI DD
54 31(57 0) 20(37 0) 3(5 6)
96 51(53 1) 39(40 6) 6(6 3)
合计 150 82(54 7) 59(39 5) 9(6 0)
                括号内为百分数 表6 ACE基因多态性在我国南方汉族人中的分布 各型例数 百分比(%)
性别 总例数 II DI DI II DI DD
54 31 20 3 57.4 37.0 5.6
96 51 39 6 53.1 40.6 6.3
合计 150 82 53 9 54.7 39.3 6.0

括号内为百分数 表6 ACE基因多态性在我国南方汉族人中的分布 各型例数 百分比(%) 例4表7各种副反应是独立的,它们只需组间上下对比,故不必按绝对数、相对数分列。表7中还应 列出各组的总例数,以表示各相对数计算的基数(本例分别为20、18和20例),在表中不列出实际 观测例数的缺点较常见,应予注意。

表7各种副反应发生情况

组别 例数 发生率(%) 例数 发生率(%) 例数 发生率(%)
1 1 5.00 1 5.00 10 50.00
2 0 0.00 2 11.11 8 44.44
3 4 20.00 6 30.00 8 40.00
P值 0.116 0.098 0.851
荨麻疹 发热
组别 例数 发生率(%) 例数 发生率(%) 例数 发生率(%)
1 11 55.00 2 10.00 0 0.00
2 8 44.44 0 0.00 0 0.00
3 11 55.00 0 0.00 3 16.67
0.845 0.322 0.100
                       

3 注意简明清晰可比:例5:表8为对慢性肾功衰竭透析患者缺铁治疗的疗效。该表除主谓语位置 不当,造成例数在表中重复,而且对比的指标未能靠近排列,降低了表达效果,可修改为表9。

表8 治疗组与对照组的疗效比较

治疗组 对照组
疗效 例数 百分率(%) 例数 百分率(%) 例数 百分率(%) 例数 百分率(%)
显效 21/68 30.9 14/60 23.3 0/24 0.0 3/31 9.7
有效 43/68 63.2 44/60 73.3 21/24 87.5 26/31 83.9
无效 4/68 5.9 2/60 3.4 3/24 12.5 2/31 6.4
总有 64/68 94.1 58/60 96.7 22/24 87 5 29/31 93.5
效率
表9 不同治疗剂量的治疗组和对照组疗效
- 疗效例数 总有效
组别 总例数 显效 有效 无效 例数 率(%)
治疗组 128 35 87 6 122 95.3
常规剂量 68 21 43 4 64 94.1
大剂量 60 14 44 2 58 96.7
对照组 55 3 47 5 50 90.9
常规剂量 24 0 21 3 21 87.5
大剂量 31 3 26 2 29 93.5

 

例6: 作者报道不同年龄组肝硬化病人幽门螺杆菌感染情况,结果如表10。表10中有2栏相对数, 一个为年龄构成比,一个为阳性率,前者表达不明确;年龄组段只写下界更清晰;Hp(-)栏可省略,只 突出阳性结果,修改如表11。

表10 肝硬化病人的Hp感染及其年龄分布

年龄(岁) 例数(%) Hp(+)例数 Hp(-)例数 Hp阳性率(%)
20~29 39(7.86) 10 29 25.64
30~39 95(19.15) 24 68 28.42
40~49 151(30.44) 52 99 34. 44
50~59 108(21.78) 44 64 40.74
60~69 69(13.91) 26 43 37.68
70~79 34(6.86) 13 21 38.24

 

表11 不同年龄肝硬化病人Hp感染率 Hp(+)

年龄(岁) 总例数 构成比(%) 例数 率(%)
20~ 39 7.86 10 25.64
30~ 95 19.15 27 28.42
40~ 151 30.44 52 34.44
50~ 108 21.78 44 40.74
60~ 69 13.91 26 37.68
70~ 34 6.86 13 38.24
       

合计496100 0017234 68

例7:颅内恶性胶质瘤术后早期MR影像学表现结果如表12。由于例数多,只用绝对数表示可比性差,应计算相对数进行比较;同时表12为复合表,厚度等分组可排在左栏。格式调整后,表下统计处理结果可列入表中,更加一目了然(表13)。 此外,影响对比效果的现象,还常见于在表中夹杂n、P值、指标、数值范围等情况,这里不一一列举。

表12 术后反应性增强与术后残存增强的影像学表现

厚度 结节 边界
增强特点 例数 <3mm ≥3mm 清楚 模糊
反应性 525 497 28 98 757 509 16
残存性 135 60 75 123 45 8 127
    注:对增强灶的厚度、有无结节以及边界情况进行了χ2检验,结果χ2值分别为213.44、262、63、544.12,P值均<0.01;表内数字均为例数 表13 颅内胶质瘤术后反应性和残存性增强者的影像学比较
增强例数 百分比(%)
影像学表现 反应性(528例) 残存性(135例) 反应性 残存性 χ2 P值
厚度(mm)
<3 497 60 94.7 44.4 213.44 <0.01
≥3 28 75 5.3 55.6
结节
98 123 18.7 91.1 262.63 <0.01
427 12 81.3 8.9
边界
清楚 509 8 97.0 5.9 544.12 <0.01
模糊 16 127 3.0 94.1

4 注意表达的准确性: 例8:表14为2个不同年代疑难发热病的诊断情况,目的在比较2个不同阶段疾病病种的变化。由表14可见,作者是用129人次为分母(124例病人中有5例有2种病),分别以各时期各病例次为分子计算,称为百分率。这样计算的相对数并不是率,只是各时期各种病例数占总例(次)数的百分比,也不是两个年代的疾病病种分布(构成)。以感染为例,前阶段为18例,后阶段为29例,以同一总例(次)数来比,后阶段比例22 5%高于前阶段的14 6%,但前阶段总共只33例(次),后阶段共计96例(次),病人总数高出很多。正确的计算应是分别以各阶段总人数为基数,分别计算两阶段的疾病构成。由表15可见,这样计算的结果,感染在前阶段占54 55%,后阶段占30 21%,与表14相反。表15可以对两阶段的疾病构成作分布数列χ2检验。

表14  124例发热性疾病两个不同年代的比较

50~70年代 80~90年代 总计
疾病 例数 百分率(%) 例数 百分率(%) P值 例数 百分率(%)
感染 18 14.6 29 22.5 <0.05 47 36.4
肿瘤 8 6.2 19 14.7 >0 05 27 20.9
血液系统 4 3.1 35 27.1 <0.05 39 30.2
胶原系统 1 0.8 5 3.9 39 4.7
呼吸系统 1 0.8 3 2.3 4 3.1
消化系统 1 0.8 2 1.6 3 2.3
神经系统 0 0.0 3 2.3 3 2.3
合计 33 25.6 96 74.4 129* 99.9

 

*5例病人同时有2种严重疾病 表15 两个不同年代发热性疾病的构成

例(次)数 构成比(%)
疾病 50~70年代 80~90年代 合计 50~70年代 80~90年代 合计
感染 18 29 47 54.55 30.21 36.43
肿瘤 8 19 27 24.24 19.79 20.93
血液系统 4 35 39 12.12 36.46 30.23
胶原系统 1 5 6 3.03 5.21 4.65
呼吸系统 1 3 4 3.03 3.12 3.10
消化系统 1 2 3 3.03 2.08 2.33
神经系统 0 3 3 0.0 3.12 2.33
合计 33 96 129* 100.00 100.00 100.00

*5例病人同时患2种疾病 5 注意自身对照表的合理表达:

例9[10]:表16为胃癌病人端粒酶活性变化与化疗的关系。这是一个自身对照的资料,说明化疗前后端粒酶活性变化,但表16中只有化疗前后总的活性等级,而没有说明究竟有多少人活性增强、减低或无变化,分析不细致,也不便于进一步作相关处理。修改格式如表17,表中空白处数字尚待补充,表中双斜线内的数字为治疗前后活性等级完全相同的人数;双斜线右上方各格数字为化疗后活性等级下降人数;双斜线左下方各格数字为化疗后活性等级上升人数。 表16 非手术胃癌病人全身与局部化疗前后端粒酶活性变化 端粒酶活性 例数 +++ ++ + - 合计(%) 全身化疗 25 化疗前 10 6 4 5 20(80.0) 化疗后 8 5 3 9 16(64.0) 局部化疗 31 化疗前 12 8 6 5 26(83.9) 化疗后 7 5 2 17 14(45.2) 注:化疗前后比较P<0.05,χ2=5.464 总之,统计表看似只是一个表达形式问题,但统计表的内容往往是论文的核心,表达质量的高低,直接反映出论文的质量,应该引起重视。

李晖著 中华预防医学杂志2002年3月第36卷第2期