多语言展示
当前在线:1238今日阅读:167今日分享:16

哈佛著名的护士健康研究学习如何构建数据库(二)

上一期讲了怎样才是一个合格的,并可以长期使用的数据库。那么,下面就要说一说数据库的构建过程了。从某种意义上说,临床科研就是在构建数据库,从临床设计到实施,再到数据的分析和文章的发表,数据库就是贯穿始终的核心。简单归纳,数据库的构建可以分为以下几个步骤:第一步设立试验目的:将决定数据库中变量的种类和多少。如果设定的课题越狭窄,那么收集的变量越有针对性,量也会相对少。而像前文提到的“护士健康研究”,因为是一个大的论题“导致女性主要慢性疾病的风险因素”,则必须收集相对较多的变量以供多方面的研究所需。第二步设计研究方案:包括临床试验设计、数据收集和存储、生物样品收集和储存及数据库的维护及更新等;a)文件准备和审批(包括伦理审批,研究者手册,知情同意书等);b)试验人群定义(包括入组人群定义、入排标准、疾病诊断标准等)。人群的定义不是简单的描述,而是融入于试验设计的起初;人群的定义决定试验的成败,也将决定数据分析结果试用的范围;c)干预措施/暴露:主动的干预(试验用药,试验手术)和暴露因素等;d)生物样品收集(收集方案和样品检测SOP);e)试验终点定义(试验终点和长期随访终点)。所有的这些信息,都需要设计专门的病例报告表(CRFs)进行信息的收集和储存。第三步临床试验执行:从数据库角度,需要数据录入员根据试验方案,主要是CRF的填表说明,将数据录入到数据库中;- 传统上,纸质CRFs的数据登记方式最为普遍。当需要填写的问题较多,切较复杂时,纸质CRF较为方便和准确,但却不利于多中心合作,需要很高的数据维护成本,也无法进行数据的实时查看和纠错;- 互联网的发展,让数据库也有了新的方式。现在,越来越多的研究机构开始使用电子数据收集系统(EDC)进行数据的收集,这样大大提高了医院间的远程合作,数据的汇总及监察。第四步数据整理,清理,数据分析和文章发表。到此为止,为正常临床试验结束;如果需要建立长期的数据库,则根据长期目标进行随访。第五步数据库扩大效益:数据库除了供构建者使用外,往往会吸引更多对其感兴趣的智囊进行数据库的二次开发。那么一个好的数据库描述变得非常重要。经验告诉我们,一个完善的数据库需要包含如下一些信息,才能吸引更多的科研爱好者,将数据库变得更有价值。1.研究描述:研究目的、研究人群、样本量,甚至是最新发表成果等;2.问卷描述:问卷描述,变量编码,变量名称及相关数据收集标准;3.实验数据:试验变量信息等;4.试验样本及ID记录:血液,粪便,组织等;5.样本储存条件;6.生物标记物评价方法;7.数据库使用说明。比如哈佛“护士健康研究”,就将数据库的历史,数据收集的过程,问卷信息及最新成果公布在网站上,吸引非常多的外部合作者。只要你申请成为数据库的使用者,还将收到更多跟数据库相关的信息帮助数据库。当初我使用的时候,根据我的方案还收到了相关的SAS code,真的是太受益了。LinkLab预告数据库的构建是一个长期而漫长的过程,但是时间的积累是最大的财富。有了好的数据库,就该谈谈怎么利用了。有两方面的使用,1)如何使用数据库的数据;2)如何使用数据库平台。未来两期我们将重点分享。
推荐信息