疾病分析统计数据库
Tel : 400-6010-180
Statistics
医学论文中如何正确使用统计表
医学论文中如何正确使用统计表
统计图表是一种具有综合性和总结性,完备而准确的叙述数字资料的方法。两者的形式不同,使 用场合也各有侧重,统计图在表示事物的变化趋势、事物间关系和分布方面有其特别的优势,缺 点是对资料的描述不够细致;统计表则容量大,能将数字精确到所需小数位,并有利于进一步作统 计处理,所以应用更为广泛。 根据对2000年《中华内科杂志》、《中华儿科杂志》、《中华预防医学杂志》论著的调查,统 计表的使用率分别为85.0%、87.3%、87.8%,说明统计表在医学论文中有举足轻重的作用,而统 计图的使用率远低于统计表。统计图表的质量较之10年前,应该说有了较明显的进步,但仍存在 一些不足,为了使医学论文中图表的表达更加完美、准确、清晰,在本讲挑选一些有代表性的实 例对表格加以说明,对图的实例说明放在另一讲。 统计表的绘制原则,需强调两点:一是简单明了,二是主谓语划分清楚。核心的问题就是简明可比, 便于交流。如何体现这两条原则,作者从对大量的表格修改中,总结出制表技巧的“五性”,即结构 的完整性、内容的突出性、排列的逻辑性、对比的鲜明性、表达的准确性。其中最重要的是对 比的鲜明性,因为将各组事物列在一张表上,主要的目的就是为了对比,对比就要讲求效果。 1 注意主谓语的排列位置:主语一般为分组、时间(年份、季节)、连续数量(年龄)、程度(等级)等 ,应置于表左侧;谓语为数字指标,应置于右侧。这样排列的好处是突出了主语,使具不同单位的指 标整齐划一(小数位一致,单位一致),适于习惯上的上下对比。在复合主语时,可将部分主语置表 头,在简单表时,对同性质(计数或计量)单位相同的指标亦可灵活排列。 例1:分析Ku抗体阳性和阴性患者的临床特点,结果如表1,除了主谓语倒置问题外,该表除2个平均 数外,余均为计数数据,且项目多。可将年龄和病程2项移于文字中叙述,性别不要排成分数,为加 强两组的对比性,还可增加相对数(Ku抗体阳性组总例数虽较少,但为了对比仍可计算相对数),仍 可原样排列如表2。
表1 Ku抗体阳性和阴性SSc患者的临床特点比较
项目 | Ku抗体阳性组(11例) | Ku抗体阴性组(46例) | P值 | χ2值 |
年龄(岁) | 41.3±9.7 | 46 3±15 | 0>0 05 | - |
性别(男/女) | 0/11 | 3/43 | - | - |
病程(年) | 8.7±6.3 | 11±9.9 | 0.05 | - |
躯干皮肤硬化 | 2 | 19 | 0.49 | 0.47 |
关节痛/炎 | 7 | 20 | 0.49 | 0.48 |
肌炎 | 9 | 6 | 0.005 | 7.88 |
肺间质纤维化 | 3 | 21 | 0.67 | 0.18 |
肾脏受累 | 1 | 5 | 0.70 | 0.15 |
中枢神经系统受累 | 0 | 2 | - | - |
ANA阳性 | 8 | 40 | 0.73 | 0.12 |
临床表现 | 阳性组(11) | 阴性组(46) | 阳性组 | 阴性组 | χ2值 | P值 |
性别:男 | 0 | 3 | 0.0 | 6.5 | ||
女 | 11 | 43 | 100.0 | 93.5 | - | 0.52 |
躯干皮肤硬化 | 2 | 2 | 18.2 | 41.3 | 0.47 | 0.49 |
关节痛/炎 | 7 | 20 | 63.6 | 43.5 | 0.48 | 0.49 |
肌炎 | 9 | 6 | 81.8 | 13.0 | 7.88 | 0.005 |
肺间质纤维化 | 3 | 21 | 27.3 | 45.7 | 0.18 | 0.67 |
肾脏受 | 1 | 5 | 934 | 10.9 | 0.15 | 0.70 |
中枢神经系统受累 | 0 | 2 | 0.0 | 4.3 | - | 0.65 |
阳性 | 8 | 40 | 72.7 | 87.0 | 0.12 | 0.73 |
注:表头( )中数字为总例数,无χ2值者为精确检验P值
表3 精液质量在各组男工中的比较(x+s)
精液参数 | 暴露组(70例) | 内对照组(90例) | 外对照组(132例) |
凝集度(级) | *1.40±0.95 | 1.30±0.98 | 1.06±0.91 |
体积(ml) | 2.91±1. 41 | 3.24±1.39 | 2.67±1.44 |
酸度 | 7.31±0.37 | 7.28±0.34 | 7.34±0.32 |
活动度(级) | 1.97±0.63* | 1.97±0.69* | 2.56±1.61 |
活动精子百分率 | 0.55±0.16* | 0.55±0.17* | 0.60±0.13 |
精子浓度(×109/L) | 55.92±36.38 | 54.18±32.88 | 63.13±35.89 |
精子总数(×106) | 149.74±106.45 | 165.68±118.901 | 56.98±109.67 |
*与外对照组比较P<0 05 例2 :观察低浓度混苯暴露对精液质量的影响,结果如表3。表3属于主谓语倒置,应调整排列为表 4。
2 注意数字间联系性: 例3:表5为南方汉族人群中血管紧张素转换酶(ACE)基因型的性别间分布情况。表头中3种分型 是有联系的,其和为总人数,对比的也是两性的基因型分布,故排列时应按绝对数和相对数归类排 列,这样有利于数字核对(表6)。
表5 ACE基因多态性在我国汉族人群中的分布 ACE基因型
性别 | 例数 | II | DI | DD |
男 | 54 | 31(57 0) | 20(37 0) | 3(5 6) |
女 | 96 | 51(53 1) | 39(40 6) | 6(6 3) |
合计 | 150 | 82(54 7) | 59(39 5) | 9(6 0) |
性别 | 总例数 | II | DI | DI | II | DI | DD |
男 | 54 | 31 | 20 | 3 | 57.4 | 37.0 | 5.6 |
女 | 96 | 51 | 39 | 6 | 53.1 | 40.6 | 6.3 |
合计 | 150 | 82 | 53 | 9 | 54.7 | 39.3 | 6.0 |
括号内为百分数 表6 ACE基因多态性在我国南方汉族人中的分布 各型例数 百分比(%) 例4表7各种副反应是独立的,它们只需组间上下对比,故不必按绝对数、相对数分列。表7中还应 列出各组的总例数,以表示各相对数计算的基数(本例分别为20、18和20例),在表中不列出实际 观测例数的缺点较常见,应予注意。
表7各种副反应发生情况
红 | 肿 | 痛 | ||||
组别 | 例数 | 发生率(%) | 例数 | 发生率(%) | 例数 | 发生率(%) |
1 | 1 | 5.00 | 1 | 5.00 | 10 | 50.00 |
2 | 0 | 0.00 | 2 | 11.11 | 8 | 44.44 |
3 | 4 | 20.00 | 6 | 30.00 | 8 | 40.00 |
P值 | 0.116 | 0.098 | 0.851 | |||
痒 | 荨麻疹 | 发热 | ||||
组别 | 例数 | 发生率(%) | 例数 | 发生率(%) | 例数 | 发生率(%) |
1 | 11 | 55.00 | 2 | 10.00 | 0 | 0.00 |
2 | 8 | 44.44 | 0 | 0.00 | 0 | 0.00 |
3 | 11 | 55.00 | 0 | 0.00 | 3 | 16.67 |
0.845 | 0.322 | 0.100 |
3 注意简明清晰可比:例5:表8为对慢性肾功衰竭透析患者缺铁治疗的疗效。该表除主谓语位置 不当,造成例数在表中重复,而且对比的指标未能靠近排列,降低了表达效果,可修改为表9。
表8 治疗组与对照组的疗效比较
治疗组 | 对照组 | |||||||
疗效 | 例数 | 百分率(%) | 例数 | 百分率(%) | 例数 | 百分率(%) | 例数 | 百分率(%) |
显效 | 21/68 | 30.9 | 14/60 | 23.3 | 0/24 | 0.0 | 3/31 | 9.7 |
有效 | 43/68 | 63.2 | 44/60 | 73.3 | 21/24 | 87.5 | 26/31 | 83.9 |
无效 | 4/68 | 5.9 | 2/60 | 3.4 | 3/24 | 12.5 | 2/31 | 6.4 |
总有 | 64/68 | 94.1 | 58/60 | 96.7 | 22/24 | 87 5 | 29/31 | 93.5 |
效率 |
- | 疗效例数 | 总有效 | ||||
组别 | 总例数 | 显效 | 有效 | 无效 | 例数 | 率(%) |
治疗组 | 128 | 35 | 87 | 6 | 122 | 95.3 |
常规剂量 | 68 | 21 | 43 | 4 | 64 | 94.1 |
大剂量 | 60 | 14 | 44 | 2 | 58 | 96.7 |
对照组 | 55 | 3 | 47 | 5 | 50 | 90.9 |
常规剂量 | 24 | 0 | 21 | 3 | 21 | 87.5 |
大剂量 | 31 | 3 | 26 | 2 | 29 | 93.5 |
例6: 作者报道不同年龄组肝硬化病人幽门螺杆菌感染情况,结果如表10。表10中有2栏相对数, 一个为年龄构成比,一个为阳性率,前者表达不明确;年龄组段只写下界更清晰;Hp(-)栏可省略,只 突出阳性结果,修改如表11。
表10 肝硬化病人的Hp感染及其年龄分布
年龄(岁) | 例数(%) | Hp(+)例数 | Hp(-)例数 | Hp阳性率(%) |
20~29 | 39(7.86) | 10 | 29 | 25.64 |
30~39 | 95(19.15) | 24 | 68 | 28.42 |
40~49 | 151(30.44) | 52 | 99 | 34. 44 |
50~59 | 108(21.78) | 44 | 64 | 40.74 |
60~69 | 69(13.91) | 26 | 43 | 37.68 |
70~79 | 34(6.86) | 13 | 21 | 38.24 |
表11 不同年龄肝硬化病人Hp感染率 Hp(+)
年龄(岁) | 总例数 | 构成比(%) | 例数 | 率(%) |
20~ | 39 | 7.86 | 10 | 25.64 |
30~ | 95 | 19.15 | 27 | 28.42 |
40~ | 151 | 30.44 | 52 | 34.44 |
50~ | 108 | 21.78 | 44 | 40.74 |
60~ | 69 | 13.91 | 26 | 37.68 |
70~ | 34 | 6.86 | 13 | 38.24 |
合计496100 0017234 68
例7:颅内恶性胶质瘤术后早期MR影像学表现结果如表12。由于例数多,只用绝对数表示可比性差,应计算相对数进行比较;同时表12为复合表,厚度等分组可排在左栏。格式调整后,表下统计处理结果可列入表中,更加一目了然(表13)。 此外,影响对比效果的现象,还常见于在表中夹杂n、P值、指标、数值范围等情况,这里不一一列举。
表12 术后反应性增强与术后残存增强的影像学表现
厚度 | 结节 | 边界 | |||||
增强特点 | 例数 | <3mm | ≥3mm | 有 | 无 | 清楚 | 模糊 |
反应性 | 525 | 497 | 28 | 98 | 757 | 509 | 16 |
残存性 | 135 | 60 | 75 | 123 | 45 | 8 | 127 |
增强例数 | 百分比(%) | |||||
影像学表现 | 反应性(528例) | 残存性(135例) | 反应性 | 残存性 | χ2值 | P值 |
厚度(mm) | ||||||
<3 | 497 | 60 | 94.7 | 44.4 | 213.44 | <0.01 |
≥3 | 28 | 75 | 5.3 | 55.6 | ||
结节 | ||||||
有 | 98 | 123 | 18.7 | 91.1 | 262.63 | <0.01 |
无 | 427 | 12 | 81.3 | 8.9 | ||
边界 | ||||||
清楚 | 509 | 8 | 97.0 | 5.9 | 544.12 | <0.01 |
模糊 | 16 | 127 | 3.0 | 94.1 |
4 注意表达的准确性: 例8:表14为2个不同年代疑难发热病的诊断情况,目的在比较2个不同阶段疾病病种的变化。由表14可见,作者是用129人次为分母(124例病人中有5例有2种病),分别以各时期各病例次为分子计算,称为百分率。这样计算的相对数并不是率,只是各时期各种病例数占总例(次)数的百分比,也不是两个年代的疾病病种分布(构成)。以感染为例,前阶段为18例,后阶段为29例,以同一总例(次)数来比,后阶段比例22 5%高于前阶段的14 6%,但前阶段总共只33例(次),后阶段共计96例(次),病人总数高出很多。正确的计算应是分别以各阶段总人数为基数,分别计算两阶段的疾病构成。由表15可见,这样计算的结果,感染在前阶段占54 55%,后阶段占30 21%,与表14相反。表15可以对两阶段的疾病构成作分布数列χ2检验。
表14 124例发热性疾病两个不同年代的比较
50~70年代 | 80~90年代 | 总计 | |||||
疾病 | 例数 | 百分率(%) | 例数 | 百分率(%) | P值 | 例数 | 百分率(%) |
感染 | 18 | 14.6 | 29 | 22.5 | <0.05 | 47 | 36.4 |
肿瘤 | 8 | 6.2 | 19 | 14.7 | >0 05 | 27 | 20.9 |
血液系统 | 4 | 3.1 | 35 | 27.1 | <0.05 | 39 | 30.2 |
胶原系统 | 1 | 0.8 | 5 | 3.9 | 39 | 4.7 | |
呼吸系统 | 1 | 0.8 | 3 | 2.3 | 4 | 3.1 | |
消化系统 | 1 | 0.8 | 2 | 1.6 | 3 | 2.3 | |
神经系统 | 0 | 0.0 | 3 | 2.3 | 3 | 2.3 | |
合计 | 33 | 25.6 | 96 | 74.4 | 129* | 99.9 |
*5例病人同时有2种严重疾病 表15 两个不同年代发热性疾病的构成
例(次)数 | 构成比(%) | |||||
疾病 | 50~70年代 | 80~90年代 | 合计 | 50~70年代 | 80~90年代 | 合计 |
感染 | 18 | 29 | 47 | 54.55 | 30.21 | 36.43 |
肿瘤 | 8 | 19 | 27 | 24.24 | 19.79 | 20.93 |
血液系统 | 4 | 35 | 39 | 12.12 | 36.46 | 30.23 |
胶原系统 | 1 | 5 | 6 | 3.03 | 5.21 | 4.65 |
呼吸系统 | 1 | 3 | 4 | 3.03 | 3.12 | 3.10 |
消化系统 | 1 | 2 | 3 | 3.03 | 2.08 | 2.33 |
神经系统 | 0 | 3 | 3 | 0.0 | 3.12 | 2.33 |
合计 | 33 | 96 | 129* | 100.00 | 100.00 | 100.00 |
*5例病人同时患2种疾病 5 注意自身对照表的合理表达:
例9[10]:表16为胃癌病人端粒酶活性变化与化疗的关系。这是一个自身对照的资料,说明化疗前后端粒酶活性变化,但表16中只有化疗前后总的活性等级,而没有说明究竟有多少人活性增强、减低或无变化,分析不细致,也不便于进一步作相关处理。修改格式如表17,表中空白处数字尚待补充,表中双斜线内的数字为治疗前后活性等级完全相同的人数;双斜线右上方各格数字为化疗后活性等级下降人数;双斜线左下方各格数字为化疗后活性等级上升人数。 表16 非手术胃癌病人全身与局部化疗前后端粒酶活性变化 端粒酶活性 例数 +++ ++ + - 合计(%) 全身化疗 25 化疗前 10 6 4 5 20(80.0) 化疗后 8 5 3 9 16(64.0) 局部化疗 31 化疗前 12 8 6 5 26(83.9) 化疗后 7 5 2 17 14(45.2) 注:化疗前后比较P<0.05,χ2=5.464 总之,统计表看似只是一个表达形式问题,但统计表的内容往往是论文的核心,表达质量的高低,直接反映出论文的质量,应该引起重视。
李晖著 中华预防医学杂志2002年3月第36卷第2期