疾病分析统计数据库
Tel : 400-6010-180
Research
医学临床科研中统计分析方法的正确应用
李旭清 山西省肿瘤研究所
统计分析是医学科研不可缺少的一部分, 其实质就是让我们通过众多的、带有偶然性的观测值来导出事物内在的、规律性的结论,
以使研究结果更具科学性。
统计学内容有许多较难理解, 其计算过程又较繁杂, 再加上我国医学本科教育中不重点讲授统计学内容, 故许多临床医生对其大伤脑筋。近年来,
随着计算机的普及, 医学统计软件日益增多, 使以往复杂的计算过程变得越来越简单了。但计算机进行统计分析亦有出错的时候,
其原因不是由于计算过程出错, 而在于人给予其指令是否正确, 因此统计分析方法的正确选择显得尤为重要。
临床研究按目的大致可分三类: 比较几种药物或治疗方法的好坏或几种现象间的差别, 这种差别一般用显著性检验;
判别几个变量间有无关系, 需用相关性分析; 优化观察指标、主要成分分析等。
1 显著性检验
选择检验方法前必须明确数据资料的类型、数据的分布及组间方差是否齐性。
1. 1 数据类型
1. 1. 1 计量资料 对每个观测单位用定量方法测定某项指标的大小, 可用度量衡单位表示; 如身高(cm
)、体重(kg)、血压(kPa) 等。计量资料常用t 检验、t′检验、U 检验、F 检验、秩和检验及序号检验。
1. 1. 2 计数资料 将观测单位按性质或类别分组, 然后再计算各观测单位的数目, 如调查某人群血型分布,
按A、B、O、AB 分组, 得各血型组人数。计数资料多用X 2 检验、零反应检验等。
1. 1. 3 等级资料 将观测单位按某种属性的不同程度分组, 所得各组的观测单位数。等级资料既具计数资料特征,
又有半定量性质, 常用R idit 检验。
1. 2 数据分布
医学测定值多数服从正态分布或近似正态分布, 如同一年龄的身高、同一性别的红细胞数等均属正态分布, 但也有些数据不属正态分布。正态分布的资料用参数统计的方法,如t
检验、t′检验、U 检验、F 检验等; 非正态分布资料用非参数统计方法, 如秩和检验、序号检验、R idit
检验等。
数据资料属哪种分布, 可用目测法、正态分布、概率表达、矩法及D- 检验结果来确定。
1. 3 方差
方差的齐性检验用F- 检验。方差齐性是t 检验所要求的, 如通过上述分析已知是用X 2 检验或非参数统计,
方差是否齐性就无关紧要了。一般方差齐时用t 检验、U 检验, 方差不齐时用t′检验。
1. 4 常用显著性检验
1. 4. 1 t 检验 适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,
三者的计算公式不能混淆。
1. 4. 2 t′检验 应用条件与t 检验大致相同, 但t′检验用于两组间方差不齐时, t′检验的计算公式实际上是方差不齐时t
检验的校正公式。
1. 4. 3 U 检验 应用条件与t 检验基本一致, 只是当大样本(n> 1000) 时用U
检验, 而小样本时则用t 检验, t 检验可以代替U 检验, 而U 检验一定不能用在n< 1000
时。
1. 4. 4 方差分析 用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,
方差分析首先是比较各组间总的差异, 如总差异有显著性, 再进行组间的两两比较, 组间比较用q 检验或L
ST 检验。
1. 4. 5 X 2 检验 是计数资料主要的显著性检验方法。用于两个或多个百分比(率) 的比较。常见以下几种情况:
四格表资料、配对资料、多于2 行×2 列资料及组内分组X 2 检验。
1. 4. 6 零反应检验 用于计数资料。是当实验组或对照组中出现概率为0 或100% 时, X 2
检验的一种特殊形式。属于直接概率计算法。
1. 4. 7 符号检验、秩和检验和R idit 检验 三者均属非参数统计方法, 共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。
1. 4. 8 Ho telling 检验 用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。
2 相关性分析
统计学中相关表示相互关系, 回归表示从属关系。有相关关系的两因素不一定有回归关系, 但能建立回归方程的两因素一定相关。
2. 1 直线相关与回归 均适用于计量资料、正态分布的两变量间的关系。相关分析是计算相关系数C, 再对相关系数进行显著性检验,
即判断相关的程度。直线回归是将两变量间的数量关系用方程式表示, 从而达到从一个变量推算另一个变量的目的。
2. 2 等级相关 用于非正态分布或不明分布及等级资料的两变量间的关系。方法是算出等级相关系数, 再对相关系数进行显著性检验。
2. 3 多元相关及回归 多元线性回归是研究一个变量和另一些变量间线性关系的统计分析方法, 多元线性相关研究的是多变量间的线性关系。多元逐步回归是从回归方程式中剔除对变量作用不显著的自变量,
而保留作用显著的变量。
3 其他常用的统计方法
3. 1 判别分析 首先要有一批分类明确的样品, 根据这些样品制定出一个分类标准来指导以后对新样品的归类,
临床上常见的诊断软件就是判别分析在临床上的应用实例。
3. 2 聚类分析 是按照“物以类推”的原则研究事物分类的一种多元统计分析方法。它有别于判别分析的是事先不知道事物的分类,
需要根据事物的数量表现来聚类。
3. 3 主要成分分析 分析的目的在于精选少数有代表性的综合指标, 来反映原来众多指标中所含的大部分信息。
4 结 语
科学性是衡量科研结论是否成立的基础和前提, 而正确的统计处理又是保证科学性的重要环节。因此, 临床医生只有不断提高对统计学的认识,
应用统计思维和方法去认识问题、解决问题, 才能使临床科研工作得到长足发展。
《山西临床医药杂志》2000年5月 第9卷 第5期