编码机

调查研究类医学数据采集及录入SPSS软件

发布时间:2023/6/26 15:07:21   

数据统计分析在临床医学科研、试验研究、生物学科研、生物医药研究等领域有着广泛的应用,它也是我们认识医学、生物学现象及数量特征的重要工具。人们广泛运用数理统计的原理和方法,使用数据分析软件,通过模型设计和数据处理,对人类疾病、其他生物现象的各种变异和影响因素进行统计分析,阐明其规律,不断提升医疗水平。

广大医务工作者、生物科研人员如何能够正确、高效的进行数据统计分析,完成自身的科研任务以及临床试验研究,首先应该正确的采集数据,这第一步工作非常重要。

医学研究包括调查研究、实验研究和临床实验研究,我们将结合实际案例,分几次课程来详细介绍不同类别医学研究的数据采集及录入spss软件的方法。我们首先来看看调查研究的数据采集及录入要点。调查研究也称为观察性研究,是指在没有任何干预措施的条件下,客观地观察和记录研究对象的现状及相关特征。

一、调查研究类医学数据采集的原则

调查研究的数据采集我们讲求“四定”原则。

(1)定双标(TargetIndex)

即目标和指标。要正确的采集一份可以用于调查研究的医学数据,首先需要明确自身的研究目标,然后根据研究目标将调查具体到统计指标,针对这些指标对每一个个体进行数据采集。其中,数据指标的选取需注意:

要全面(Comprehensive)我们根据研究目的在采集数据之前一定要反复、详细地确定需要采集的指标项,很多医生朋友在采集数据之前为了节省时间,没有详细分析自己的研究目的,草率地确定了一些指标,就开始数据采集,结果到统计分析时才发现,一些重要的指标没有采集到,导致采集的数据没有使用价值,浪费了大量的时间和精力。

宜精选(Selected)而同样,数据指标也不是越多越好,同样两个指标都可以反映研究目标特征的,可以经仔细对比筛选后,有选择性的剔除使用价值较差的指标项,保留最能够反映研究目标的指标项,不贪多,以免分散精力,做到简洁明了、重点突出。

(2)定范围(Range)

指标确定了,就需要理清楚收集相应指标数据的具体对象范围、时间范围和空间范围,简称“物-时-空”范围,这对于进行参数估计时非常重要。组成总体或样本的对象可以是某空间范围内、在时点、时段上的人、病例、家庭或者集体。如对某一地区食道癌症高发的影响因素的研究,观察范围应该是该地区内的近10年或20年内的居民生活及环境情况调查。注意,不管是对象、时间或者空间范围,都需要连续性。

(3)定方式(Way)

医学数据的采集一般包括直接采集、采访采集或者委托采集。直接采集一般通过科室收诊数据的记录,采访采集则是通过有意识的对患者进行一些合理情况的咨询,这两种方法一般可结合起来使用。也可以委托第三方专业机构采集,注意在选择第三方机构时要明确其是否具有专业资质;并在数据采集前和过程中,与其充分沟通,保证数据的真实、准确性和可用。

(4)定格式(Format)

最后就是保存采集数据的格式,数据保存的结构格式对于后期数据分析非常重要,一份结构合理、格式明了、可持续更新的数据保存格式一方面可以便于收集者查验、更新,同时也可为后期数据分析打下了良好的基础!

EG:患者长时间用药对肾脏的损害情况研究

在进行该调查研究的数据采集及录入过程展示之前,我们一起来看看这位医生朋友录入数据存在哪些问题。

问题一:目标不明

想知道ADV用药时间对肾损的影响,但是他的Excel数据文件中完全没有ADV用药时间指标。他采集的数据指标见下图:

问题二:考察因素不全面

肾损的影响因素有很多,他从医学角度考察了患者的性别、年龄以及用药的因素,但其实还包括有生活作息情况、工作强度、是否存在高血压糖尿病等病症、家庭是否安装净水器等这些可能的影响因素的收集。从严谨性角度来讲,这些因素也应该尽可能纳入。

问题三:采集数据时间上不连续,存在缺失

他采集的数据时间跨度较长,最远的有从年开始的,这么长的时间跨度,能够收集这样多因素的数据已经非常不容易,但也正因为跨时间长,部分数据存在较大丢失,这应该是收集医学数据普遍会遇到的问题。

问题四:数据表录入格式不可用

他的Excel数据表中没有ADV使用时间数据,但有“就诊时间”。通过“就诊时间”可以推算出每一个患者的ADV使用时间,但此次的数据样本达到个,通过日期一个一个的推算时间长。

为有效避免大家数据收集时出现类似问题,我们以“患者长时间用药对肾脏的损害情况研究”为例,根据其数据收集存在的问题,并根据以上步骤,进行该调查研究的数据采集过程展示。

(1)定“双标”

本例中,目标是研究病人长时间用药对肾脏的损害情况,具体到观察指标,可以知道,肾脏的损害情况是结果变量,而具体到指标的话,可以反映肾脏损害情况的指标包括有CYS、CKD、MDRD、肌酐、尿素,通过这些指标的临界范围,作为肾脏有损和无损的判别。而长时间服用的药物具体到相关的影响变量,对于患者个体需要采集的指标应该包括性别、年龄,同时,详细记录就诊时间,这个非常重要,是作为“长时间用药”的时间观察指标,而用药信息则可以包括每个患者ADV用药情况、ADV使用时间、ADV联合使用其他药物情况、HBsAg、HBeAg、HBV、DNA、ALT、Pi、GLU、以及生化指标等指标。至此,“双标”就定好了。

(2)定范围

本例的“物-时-空”范围,医院内分泌科室就医的患者,患者的就医时间跟踪记录,医院。

(3)定方式

本例的数据采集以直接采集为主,医生对来科室就医的患者做好长期的跟踪记录。

(4)定格式

本例的数据格式采集表设计。

二、数据录入需注意事项

做好了以上步骤,在数据录入之前,还需要做好数据的检查工作。数据录入的过程我们简称为CCI过程,即数据检查、编码和录入。

(1)数据检查(Check)

内容完整性检查

检查内容应该检查是否有缺项,缺项的范围有多大,重要的调查因素是否缺项,缺项是否可以补充,缺项较多的样本是否要酌情考虑删除。

格式逻辑性检查

逻辑检查主要检查内容逻辑上的矛盾,如出生日期与发病日期、死亡日期的矛盾,患病种类与性别不符等。可提前设计指标项的范围,通过录入是自动进行错误提醒或自动更正。

(2)数据编码和录入(CodeInput)

数据编码即是对存在分类的调查项目的所有可能的调查结果分配一个代码,主要方便记录、勾选;针对连续性指标数据则直接记录就好。若存在开放性问题,则根据调查中的各种回答,归纳整理出回答的主要类型,给予恰当的编号,方便计算机录入和识别。

数据录入则包括事前纸档记录转为电子记录和直接电子记录,事前纸档记录转为电子记录容易逐样本、逐项发现可能存在的记录错误,但在转录入时也容易出现误差。两种录入方式都需要对录入的电子表格进行录入后的检查。

下期,我们将详细讲述实验研究类医学数据采集及录入的正确方法,欢迎大家订阅我们,每日更新,每周推送精品医学统计文章、案例教学视频。

本期供稿:Dana

文本编辑:飞雪

内容审核:陈老师

本文系杏花开医学数据分析原创文章,未经允许,禁止转载,违者追究法律责任。



转载请注明:http://www.aideyishus.com/lkgx/5093.html
------分隔线----------------------------