Research

应用于临床、科研的SAS实用系统

应用于临床、科研的 SAS 实用系统
戴海伟 中国医学科学院肿瘤研究所计算机室

  摘要 在临床医学和科研中, 经常有大量的实验数据需要用高级统计分析软件SAS 进行各种统计分析。但是,使用者需具有一定的统计学知识,并熟悉SAS 设计语言,故医学工作者使用时困难很多。为了让医学科研工作者不需编程, 又能在实验数据的统计分析过程中学习统计学的基础知识, 作者开发了一个通用的、有医学特色的医学数据综合处理实用系统,为用户提供友好的使用界面,使统计学知识更好地应用于医学科研中。
  关键词 医学统计 SAS 软件

  为了对人们在科研和工作中获取的大量信息, 进行存储、整理、特别是分析处理。多年来国内外学者编制了许多数理统计软件, 在这众多的软件中, 美国的SAS 研究所经过数十年的努力,研制的一套具有数据管理、高级统计和制表绘图功能的第四代编程语言SAS (StatisticalAnalysis System) 软件包,则是其中的姣姣者,用它能处理你想作的一切数据整理和分析工作。
  1966 年,美国North Carolina 州立大学开始开发SAS 软件包,1976 年SAS 研究所成立,开始进行SAS 的维护、开发、销售和教育工作。到1985 年,SAS 研究所陆续推出了运行在大、小型计算机和微机上的各版本的SAS 软件。由于SAS 语言功能日益强大, 所以在世界各地SAS 用户非常多, 约有2 万台各型计算机安装有此软件,用户约75 万人。国际SAS 协会SU GI (SAS User Group International) , 每年都要开会对该软件的使用进行交流和研究, 而SAS 公司每年也在改进SAS 系统, 可以认为SAS 是一个功能较完善的统计软件包, 此统计分析软件的开发居于领先水平。但SAS 软件是为统计、计算机专业人员设计的,使用者需要具有一定的统计学知识, 并熟悉SAS 设计语言,通过编制并运行SAS 程序才能解决一定的问题,故医学科研工作者使用时困难很多,如何将这样一个极为有力的工具从统计和计算机专业人员中“解放”出来, 供广大医务临床和科研人员直接使用是一个很实际的问题, 作者基于这一现实,借助SAS 软件,与医学临床、科研人员配合,开发了一套适合医学工作者使用的程序,使医学工作者不需编程, 又能在实验数据的统计分析过程中学习统计学的基础知识, 选择正确的统计模型, 使统计学更好地应用于医学中。

  1 系统特点:
  1. 1 提供友好的使用界面, 用户不需要编程,就能在逐层的中文菜单的提示下按步骤完成所有实验数据的统计分析工作。
  1. 2 可对实验数据进行存储、整理和再加工,并给出数据输入、编辑的格式说明。
  1. 3 对同一批数据, 在用户不能确定使用何种数学方法的情况下, 本服务系统可按SAS 软件提供的多个同类过程自动进行计算, 得出各自的计算结果, 并为医学工作者逐项分析各结果的统计学意义,提供选择参考,使统计结果更符合医学实际。
  1. 4 本系统具备初步的教学功能,包括(1) 实验设计和数据统计分析方法的联机学习。(2)对每一类不同的统计过程,通过菜单引导,用一个具体的实例详细讲解、说明,使用户能借助本软件,学习统计学和本软件的用法。
  1. 5 适用于通常配置的IBM 兼容机, 汉字操作系统及数据库管理系统。

  2 系统功能构成:

  

  3 数据统计分析过程:

  

  4 各部分功能简介:
  第一部分:简要介绍了统计软件SAS/ PC 系统的作用、本软件的应用范围及使用注意事项。
  第二部分: 主要讲述了医学试验设计的要素, 试验设计的原则等概念。重点举例说明了医学试验设计的类型,包括(1) 考虑1 个试验因素、不考虑区组因素。(2) 考虑1 个试验因素、1 个区组因素。(3) 考虑1 个试验因素、2 个区组因素。(4) 考虑K( K≥2) 个试验因素、不考虑区组因素。(5) 考虑K( K≥2) 个试验因素、1 个区组因素。
  第三部分: 这一部分选择了医学试验数据处理中常用的8 个模块, 其中第5 个模块“一元方差分析”是重点,包括(1) 单因素设计资料的方差分析, 这其中选择了SAS 软件提供的多种数学方法。(2) 配伍组设计资料的方差分析。(3) 平衡不完全配伍组设计资料的方差分析。(4) 交叉设计资料的方差分析。(5) 拉丁方设计资料的方差分析。(6) 不平衡的2 ×7 析因设计资料的方差分析。(7) 系统分组设计资料的方差分析。(8) 裂区设计资料的方差分析。(9) 具有1 个重复测量的双因素设计资料的方差分析。(10) 具有1 个重复测量的3 因素设计资料的方差分析。(11) 具有2个重复测量的双因素设计资料的方差分析。(12) 6 因素2 水平正交设计资料的方差分析。
(13) 具有4 次重复试验的3 因素3 水平正交设计资料的方差分析。(14) 考虑交互作用的5 因素3 水平正交设计资料的方差分析。
  第四部分: 这一部分选择了医学试验数据处理中最常用的11 个模块,其中第2、9、10 模块是重点。第2 模块“多元方差分析”包括(1) 单因素多元方差分析。(2) 双因素析因设计资料的多元方差分析。第9 模块“LO GISTIC 回归分析”是医学流行病学研究中最常用的研究方法。使用第10 模块“, 生存分析”对大部分癌症或其它险恶疾病的病人的生存时间及影响生存的因素进行分析,计算出寿命表,绘制出生存曲线等。

  5. 实际应用
  在开发本软件的过程中与临床及科研人员一起合作, 运用本软件对临床、科研中得出的一些试验数据进行了处理。例如:
  (1) 对41 例肝细胞性肝癌(HCC) 病例与12例肝转移癌病例、8 例非肿瘤病例进行对照研究,在与HCC 有关的形态特征(如:多角型细胞中位核、N/ C ↑、大核仁、多核巨细胞、胆汁、小胞浆空泡、大胞浆空泡、不典型裸核、窦内皮细胞、血窦分割细胞团、小梁状排列) 的多因素中, 用软件的第四部分的第9 模块分析找出其中主要因素, 对鉴别HCC 有重要的意义。
  (2) 根据我国常见的恶性肿瘤鼻咽癌(NPC) 目前还缺乏可靠的判断患者预后指标的情况下, 与临床医生一起用本软件的第三部分的第7 模块及第四部分的第10 模块分析了P53基因能否作为判断预后的指标。分析了以下几项:
  ①P53 过量表达与NPC 原发灶、颈部转移灶的肿瘤放射敏感性的关系。
  ②P53 过量表达与NPC 的临床分期有无关联。
  ③P53 过量表达与患者放疗后局部复发或远地转移的关系。
  ④P53 表达阳性患者与阴性患者的远期生存率有无显著性差别。

  6 讨论
  本软件是基于现代医学临床、科研所设计, 具有一定的通用性, 容易与国际流行统计软件接轨。随着医学统计学方法的发展, 我们将不断完善其功能, 使其更好地为医学临床、科研服务。

  参考文献:
  1 SAS ,6. 04 微机版说书。
  2 胡良平, 周士波. 医学统计方法与SAS 应用技巧. 第1 版. 中国科学技术出版社,1991 ;10

《医学信息》1998年8月 第11卷 第8期