*仅供医学专业人士参考
全国心血管疾病管理能力评估与提升工程——
CDQI (Cardiovascular Disease Quality Initiative)
,由国家心血管疾病临床医学研究中心、中华医学会心血管病学分会共同开展。
目标是推出一个面向全国、信息共享、分级诊疗、区域协同并举的心脏病救治新模式,成为推进“健康中国”全面向前的重要驱动力。
05月13日19:00-19:40,临床科研培训第五期活动邀请首都医科大学附属北京天坛医院谷鸿秋教授担任主讲专家,带来精彩的科普宣教内容!现整理会议内容如下,以供读者学习与交流!
谷鸿秋教授对如何利用统计图表,讲好研究故事,做了细致的讲解分析。
图1
谷教授介绍道,当前的统计方法繁多复杂,按照在论文中出现的频次,在图1中列举了一些常用的方法,比如Cox回归分析、Kaplan-Meier曲线、方差分析等。面对这些统计学常用方法,对于临床医生而言,如何区分并有取舍地使用,是一个值得深思的问题。
谷教授讲道,统计学的学习过程一般是按照由简入难的顺序,从最基础过渡到偏难再到偏高级的顺序,逐渐深入学习。在最开始学习统计学时,一般从单因素的统计分析方法入手,在涉及到混杂因素的情况下,需采用多因素分析的方法,如线性回归、Logistic回归、Cox回归,并统一到一般线性模型、广义线性模型等更复杂的统计模型里。但要注意的是,学会统计学的具体步骤和方法,但不了解其内在联系,是很难在临床研究中做到灵活运用的。
谷教授强调,既往学过的的统计学内容,是一个基础性内容,在此基础上,从已发表的逻辑非常清楚的临床研究中,倒推其统计学思维,例如,在这个过程中,如何呈现统计图表,运用了哪些具体的方法,来完成临床研究的分析。因此,在提出统计分析需求前,不要急于撰写统计分析计划,而应先厘清研究思路,明确研究目的,按照“PICO”的原则进行临床试验,并对最终要呈现的统计学量表、在数据库中的具体定位等都有一个详细的认知。在这种情况下,研究者才能将“研究故事”讲清楚。这样的研究思路也是非常清晰的,在选题合适、统计学方法把控较好的前提下,临床研究的发表也会事半功倍。
那么如何具体地进行统计学分析呢?谷教授认为,可以从已发表的文章中学习和参考,如上图中所罗列出的一些图表,存在一些共同的特征。这些图一般是研究结果的第一部分,即supplemental figure one或figure one,通常叫做study flow chart。从这部分内容,可了解到研究人群是如何筛选的,研究过程的每一步是如何进行的,以及研究中的细节等。
接下来,谷教授讲解了统计学中的其他常用图表。K-M生存曲线可回答的内容是最核心的问题,即试验组对比对照组的临床效果。柱状图一般是用于统计连续性的变量,比较试验组和对照组的具体差异,并根据研究需求,绘制一些更加具体的数据对比,进而判断其具体分层,用镶嵌度的方式展示出来,从而了解到中位数、平均数等数值水平,两组间的差异也能一目了然,从不同的时间点,也能观察到平均值的变化,进而做出合适的干预。
之后,谷教授继续介绍了一组统计学图表,即Table 1,也就是表1。不同研究的表1往往会有不同的呈现方式,可能为两组数据和P值,也可能只有两组数据,没有第三列,或有其他呈现形式,不一而足。此外,不同的研究,数据展现形式也是不同的,通过统计学方法来进行比较时也会采用不同的方法。这部分图表的重点在于数据的描述和比较。
接下来的一组图表是Table2-4的内容,谷教授介绍道,这部分图表主要是展现效应指标,即OR或HR。在这类图表中,根据不同的研究类型和研究结局,把比较容易混淆的OR值、RR值或HR值等指标展现出来,侧重于回答试验组相对于对照组对心血管不良事件的具体下降幅度、强化降压相对于标准降压的疗效变化等核心问题。这类图表的目的是类似的,但形式略有区别。
上图中展现的图表是较为常见的森林图,具有多种类型。谷教授讲道,这种森林图与荟萃分析中的森林图不同,在荟萃分析中,每一层代表的是一个研究,而上图中的森林图中,每一层代表的是一个亚组,对比试验组对于对照组的疗效。在很多的文章中,针对RCT研究,需要回答主效应以及不同亚组中的效应结果,森林图可以很好地总结和展现。
以上是临床研究中常用的一些统计学图表,将这些图表有序地组合,可以让临床分析更加完整清晰。那么,应该如何将这些图表进行组合呢?
谷教授用两个案例给出了思路,一个是心血管领域的SPRINT研究,一个是神经内科领域的CHANCE研究,均发表在新英格兰杂志。谷教授认为,常规的统计分析思路可以分为四个步骤,首先是确定分析人群,从Fig 1可以体现失访数据/退出研究/缺失数据,其次是基线描述比较,Table 1可以体现社会人口学/疾病史/临床特征,第三是效应估计,Main Table/Fig体现单因素或多因素线性/Logistic/Cox回归分析内容,最后是敏感性分析,Sup Table/Fig体现人群/模型/定义。遵循这样的步骤,基本可以讲好一个“研究故事”。
谷教授具体讲解了SPRINT研究中的具体分析思路。在SPRINT研究中,研究者遵循了“PICOS”的准则,快速获取这个“研究故事”的核心要义。P是SBP>130mmHg、年龄超过50岁,并伴有心血管危险因素的人群,研究目的是比较强化降压(SBP降至120mmHg以下)和标准降压(SBP降至140mmHg以下)(I),对心肌梗死、冠脉综合征、卒中、心衰以及心源性死亡等终点(O)的效应差异。Study type(S)是RCT研究,T是指研究所用的时间,大约是3.46年。
这个“研究故事”如何展现?首先是要确定分析的研究人群,从study flow chart中可以看到初始筛选的人群,然后找到伴有心血管危险因素的高危人群,可能会有不符合或不愿意参加研究的人群,还需要不断筛选,最终入选的人群中,试验组和对照组均为4600人。在试验过程中,部分研究人群可能因多种原因中断。研究者最终得到一个分析人群,但是其中有一些专业数据,如RCT研究中的ITT、FSG、PBS、SSG等,观察性研究一般这些要求,仅需把入选/排除标准以及每个步骤的人群明确即可。需要注意的是,同一个病人可能同时符合多条入/排标准,为了避免这种情况,建议采用层次排除法,先按照最重要的标准排除,之后再按照第二个排除标准,逐层级排除,这样人群一般不会出现重叠的情况。
了解第一步之后,接下来需要用Baseline Table来描述研究人群的具体特征。对于连续性变量,一般用均数±标准差或IQR来描述,对于分类变量,用频数(百分比%)描述即可。对于大样本RCT,一般不提供P值,对于小样本RCT研究则需提供P值,所有的P值均小于0.05,虽然有统计学差异,但在临床上可能无任何差异。在观察性研究中,样本量可能较大,无统计学差异,但需要评价是否存在临床差异,这种情况下通常使用标化差(ASD)来描述,如果大于10%,可能存在临床差异,需要校正混杂因素。
第三步是效应估计,主要用于回答最核心的问题,即试验组相比对照组的效应如何,一般需要使用一些图表来辅助描述效应变化。在RCT研究中,一般会用到Primary outcome或Secondary outcome等指标,在观察性研究中,可能不会详细区分,但在各自的效应终点都会用列表的方式来列举出来。表格会展示一个Summary式的汇总比较,图则可以更加生动形象地展现出效应情况。
第四步是敏感性分析,SPRINT研究中强化降压相对于标准降压能够降低20%的风险,但在不同的人群中差异如何?对于强化降压,临床中最关注的点在于对肾功能代谢异常的影响,由上图可知,在慢性肾功能障碍的患者中,强化降压也是有效的,但效果相对较差。对于不同的性别、年龄、种族以及不同血压值等均进行敏感性分析,可以回答这项研究结果是否稳健,在不同的人群中是否存在差异。
欢迎转发,欢迎参加!
CDQI
全国心血管疾病管理能力评估与提升工程
,