文章来源:中华糖尿病杂志, 2021,13(3) : 296-300

作者:张珮真 刘德英 张惠杰

单位:南方医科大学南方医院内分泌代谢科

摘要

随机对照试验(RCT)是评价某种药物或某种干预手段安全性和有效性的金标准,合理的设计是高质量RCT和科学评判试验结果的核心。笔者将以经典的糖尿病临床干预试验,包括糖尿病患者健康行动(Look AHEAD)及糖尿病心血管风险控制行动(ACCORD)试验为例,对RCT的设计要点进行探讨,以期为未来开展糖尿病防治RCT研究的设计和开展提供参考。

随机对照试验(randomized controlled trial,RCT)是一种对临床某种疗法或药物的效果进行检测的手段,其基本方法是将研究对象随机分组,对不同组实施不同的干预,比较不同干预手段临床效果的差异。在循证医学临床证据的分级中,RCT证据等级最高是Ⅰ级证据,被公认为是评价某种药物或某种治疗方式疗效和安全的金标准,是指南中主要推荐的证据。目前而言,我国主导的糖尿病临床研究仍较多为描述性,干预性研究偏少,尤其是严谨、合理设计的高质量RCT不多[1, 2]。基于我国庞大的糖尿病患者基数,提高我国RCT的设计质量,对于制定适合国民的糖尿病防治策略意义非凡。他山之石,可以攻玉。我们通过学习既往研究者如何开展RCT研究探讨糖尿病综合管理策略,结合经典案例剖析RCT设计要点,旨在为未来我国糖尿病防治RCT研究的设计和开展起到积极作用。

一、RCT的设计要点

简单来说,RCT试验的步骤就是从目标人群中选出合适的研究对象,进行随机化分组,对不同组实施不同的干预,随访一段时间,然后比较试验组和对照组之间的结局,以比较干预效果的不同(图1)。临床试验之所以优于观察性研究,在于RCT具备阐明某个特殊干预措施和结局之间因果关系的能力,而采用随机分配的干预措施可以降低混杂因素的影响,设盲可以降低在结局确认和疗效判定时产生的偏倚。因此,把握RCT的设计就是要关注如何选择合适的研究对象、设立恰当的对照、具体的干预措施、定义合理的结局,以及把握随机化和盲法的实施方法。

随机对照实验(随机对照试验实例解析)(1)

图1 随机对照试验的实施步骤

二、临床研究问题的提出

研究科学问题通常来源于一个普通的临床问题,但是需要经过一定的凝练,将其转化为一个具体的可研究的科学问题[2]。例如,在临床工作中医生会思考“减重对2型糖尿病(type 2 diabetes mellitus,T2DM)患者有帮助吗?”,提出这样一个问题就是一个很好的起点。为了解决这个问题,需要将问题聚焦,通常研究者会将一个问题根据观察的人群、检测的指标、干预手段等拆分成具体的要素,并根据其中某些要素进行研究设计。比如本问题就可以拆分成:减重对于合并超重或肥胖的T2DM患者血糖控制是否有帮助?通过严格的饮食和运动管理是否可以减轻糖尿病患者体重?通过严格的饮食和运动管理降低体重对于合并超重或肥胖的T2DM患者的远期心血管疾病(cardiovasecular disease,CVD),控制是否有帮助?再如,糖尿病患者经常会向医生提问的“血糖控制在什么水平好?”,研究者可以将其转化为:血糖控制在正常值范围内(强化血糖控制)是否比以常规血糖控制目标更好?年龄、性别、微血管并发症、心脑血管疾病史不同的人群血糖血压控制目标是否不同?强化血糖和血压的控制目标安全性、可行性及经济效益如何?

RCT通常是需要一定经费且比较耗时的,只能关注一个具体问题,有时还需将受试者暴露于不明确的潜在危险因素中,因此,把普通的临床问题转化成具体的研究问题非常重要。研究者需要丰富知识储备,建立批判思维,充分回顾文献,查询待研究的问题是否已有人研究过、该问题目前都有哪些解决方法、有哪些问题是还没有得到解决的,还需充分分析以往研究的局限性和不足,以便提出新的方法加以改进,也可以借鉴其他领域的设计思路,把普通的临床问题转化成一个具体的、可研究的科学问题。

三、研究对象的选择

糖尿病患者健康行动(Look AHEAD)研究纳入的目标人群是超重或肥胖T2DM患者,纳入标准主要是年龄45~74岁、体质指数(body mass index,BMI)≥25 kg/m2(使用胰岛素者BMI≥27 kg/m2)的T2DM患者。排除标准包括:糖尿病并发症未得到良好控制,包括糖化血红蛋白(glycated hemoglobin A1c,HbA1c)>11%,血压≥160/100 mmHg(1 mmHg=0.133 kPa),血清甘油三酯≥6 g/L;存在可能限制坚持干预或影响试验进行的因素;合并可能限制寿命和(或)影响干预措施安全性的潜在疾病。糖尿病心血管风险控制行动(ACCORD)研究的目标人群是合并CVD风险的中老年糖尿病患者,纳入标准包括超过3个月糖尿病病程、稳定3个月以上降糖用药史、HbA1c>7.5%、有临床冠心病病史的年龄在40~79岁的个体或有≥2项CVD事件危险因素的年龄在55~79岁的个体,符合血压或血脂临床试验的标准。主要的排除标准包括频繁的或者最近发作的严重低血糖、1型糖尿病、不能或不愿进行胰岛素或血糖的监测、BMI>45 kg/m2、血清肌酐>15 mg/L、研究开始3个月内发生心血管事件(过程)或纽约心脏病协会心功能分级Ⅲ~Ⅳ级充血性心力衰竭及其他严重疾病。

研究对象选择好才能保证研究中的发现能够推广到所关注的目标总体中。目标总体是根据临床与人口学特征定义的(如T2DM患者),可获得总体是可获得的患者,例如具备条件到各个临床研究中心就诊和随访合并超重或肥胖的T2DM患者;预期研究样本是希望入选研究的子集,如上述患者中可以依从研究人员指导坚持饮食控制和体力活动的部分。定义研究对象的选择标准,是研究开展的第一步,需要保证纳入的受试者具备可依从干预、符合伦理要求(表1)。一般纳入的人群结局发生的风险越高,预期出现临床结局的比率越高,则试验所需要的受试者数量相对较小。此外,受试者选择还需要考虑到试验结果的可外推性和完成招募的难易程度。

随机对照实验(随机对照试验实例解析)(2)

Look AHEAD研究计划2.5年内通过16个临床研究中心招募5 000名合适的受试者,其样本量计算是基于推测对照组糖尿病患者以每年3.125%的速度出现主要结局以及每年2%的脱失率,5 000名受试者有92%的效能可以检测组间主要结局发生率18%的差异。而ACCORD研究需要纳入10 000例受试者(其中血压干预试验4 200例,血脂干预试验5 800例)[3],能达到89%的效能检测到强化降糖与标准降糖间15%主要结局发生率的差异,87%的效能可以检测到血脂试验中试验组与对照组间20%主要结局发生率的差异,94%的效能可以检测到强化降压与标准降压组间20%主要结局发生率的差异。最后ACCORD研究实际招募的血压试验受试者比计划增加了13%,血脂试验的人数减少了5%,但ACCORD数据和安全监控委员会证明实际纳入人群仍然有足够的效能验证血脂试验的假说。由此可见,能够提供足够的统计效能的样本量,对于RCT研究科学问题的回答极为重要。研究者首先要根据已设定的主要结局提出等效、非劣效、优效假设,基于已有的观察性研究或是与本研究入选标准类似的试验中观察到的主要结局发生情况,选择合理的效应值以及根据变量的类型选择恰当的统计检验方法,设定合适的假设检验Ⅰ类错误概率α(通常取双侧α=0.05)及Ⅱ类错误概率β(通常取β=0.2,Power=1-β=0.8),进行样本量计算。

四、研究设计和制定干预措施

Look AHEAD研究旨在评估超重或肥胖T2DM患者采用强化生活方式干预减轻体重能否减少心血管事件和死亡,采用经典的开放性平行对照设计,将受试者随机分为强化生活方式干预组以及常规糖尿病支持和教育对照组[4]。对照组受试者仅遵从糖尿病管理指南的建议接受每年不超过3次的糖尿病宣教课程以及门诊复查的干预;而强化生活方式干预组则有系列的干预措施以达到研究者设立的减重10%目标,比如受试者需要定期参加规定的糖尿病宣教课程(在干预1~6个月共有24次课程;7~12个月期间每月1次面对面咨询和2次小组课程学习;13~48个月期间,每月至少2次随访;49个月后,每年至少2次面对面随访),并且研究者建有专门的网站可以提供一个持续的开放的学习平台,整个试验期间提供研究小组支持,研究者通过严密课程和随访,指导与监督受试者进行饮食调整(设定热量目标以及营养素占比等)和增加体力活动(鼓励每周至少175 min中等强度的体育锻炼)。

ACCORD研究聚焦于研究3种重要的CVD危险因素(血糖、血压、血脂)管理策略是否可以降低T2DM患者的心血管事件的发病率,使用2×2双析因设计(2个处理因素,如血糖和血压或血脂,每个处理因素有2个水平,如强化治疗和标准治疗,通过不同组合对两个处理同时进行评价,检验每个因素各水平间的差异),将受试者随机分入到8个治疗小组[5]。所有的受试者都开放性随机分配到强化降糖组(血糖控制目标HbA1c<6%)或标准降糖组(HbA1c为7.5%左右)[6];ACCORD血脂干预试验采用双盲设计[7],受试者在标准辛伐他汀降低低密度脂蛋白胆固醇治疗背景下,随机分配至联用非诺贝特干预组或者联用安慰剂对照组;ACCORD血压干预试验采用的是开放性设计[8],受试者随机分配至强化降压组(收缩压控制目标120 mmHg)或标准降压组(收缩压控制目标140 mmHg)。

选择干预措施是临床试验设计关键的一步,可以是某种药物、某种行为干预治疗方法或是这些方面的组合。如同Look AHEAD研究和ACCORD研究,在研究实施过程中,对于干预措施以及干预随访的具体实施均有详细的定义,比如药物干预的剂量、用法、频率、疗程等,启动和增加治疗的时机和标准,由于不良反应而减少或停止干预治疗的标准和后续措施,是否联合应用其他药物或其他治疗方式,饮食干预的热卡目标、营养结构等,行为疗法的定义与执行标准等,疗效和不良反应评估计划,访视的开展形式、开展密度等等,保证整个临床研究过程在事先设定的干预措施下开展,并确保符合临床判断标准规范。

常见的RCT设计类型除了平行组设计、析因设计,还有交叉设计等。平行组设计是目前最经典也是应用最广泛的设计类型,如Look AHEAD研究、对比强化降压和标准降压对高血压合并CVD高危的非糖尿病患者心血管影响的SPRINT研究[9]以及对比强化生活方式干预、二甲双胍和安慰剂预防糖尿病发生的DPP研究[10]等,采用的都是平行组设计。析因设计看上去很完美,如ACCORD研究、ADVANCE研究[11]同样也采用降压与降糖的2×2析因设计分析对CVD高危的T2DM患者的影响,析因设计可以在同一个研究中回答多个科学问题,但需要注意的是在析因设计中,通常预先假设干预措施之间彼此相互独立、不存在交互效应,而正如研究者无法识别出所有混杂因素一样,现实情况往往是研究者也很难检测出所有的交互效应[2]。而交叉设计RCT包含两个阶段,第一阶段中试验组和对照组的试验对象将会在第二阶段中交换位置,此种设计在一定意义上节约了样本量,也可以消除个体差异,但无法消除先后两阶段的干预对彼此的影响,需要设立一定的洗脱期,因此,研究时间也相对较长。

RCT中常用的对照形式有安慰剂对照、阳性对照、空白对照等。对照的设立既要为说明科学问题服务,也不能违背伦理,不允许所设立的对照干预措施对受试者的健康构成危害。设立好的具有对比性的对照组,是评价干预疗效或安全性的关键。Look AHEAD研究和ACCORD研究均依据指南采用标准化的临床治疗措施作为对照。

五、临床结局的评估与统计策略的确定

Look AHEAD研究和ACCORD研究的主要结局都是复合心血管事件的发生率,评价指标包括心血管死亡、非致死性心肌梗死和非致死性脑卒中。在Look AHEAD试验开展2年后,研究者发现对照组的主要结局事件发生率低于预期,因此,研究者将心绞痛住院也加入到主要复合结局中,并将随访计划延长至最长13.5年。研究的次要结局包括糖尿病微血管并发症、生活质量、寿命、医疗费用等。

RCT结局的定义会影响研究设计的其他要素,也会影响试验的成本和可行性。临床试验通常会观察几类结局事件以丰富研究结果并为后续二次分析提供基础。通常,研究者会采用多个结局变量从不同方面描绘干预产生的影响,比如Look AHEAD研究或ACCORD研究都想观察心血管的变化,不稳定心绞痛、短暂性脑缺血事件、心力衰竭的发生情况等都可以作为结局变量描绘强化生活方式干预减重或强化CVD代谢风险因子控制对心血管的影响;此外,糖尿病微血管并发症的发生、血糖的改变、体重和体脂的变化等都可以作为结局来阐述干预的作用,但是,为了计算样本量和确定随访周期,需要在众多结局观测指标中选择一个设定为主要结局。通常,采用连续变量评价结局(如血糖、胰岛功能、体重、血压、生活质量等)通常比二分类变量的结局所需要的样本量更少。以二分类变量指标(如糖尿病发生、心血管死亡等)为主要结局的RCT需要更多的受试对象、更长的干预时间,所需的费用也更加昂贵,但是能够直接反映和回答所提出的科学问题。相比于单一的主要结局变量,复合终点法(如本文介绍的复合心血管事件发生率)将结局定义为许多不同结局变量组成的结局,每一个结局都有重要的临床意义,研究干预措施对每一种情况起效的机制是相似的,通常比单一结局提供更高的效能。但是在设计复合结局时,要注意避免将没有临床意义的事件或相对更常见的结局纳入复合结局(如因为胸痛而住院纳入心血管事件的复合结局),可能会削弱复合结局的统计学效能,甚至可能会误导研究者得出假阳性结果。

统计策略包括统计方法和纳入统计分析的人群的确定,通常根据结局变量的类型进行选择。对于Look AHEAD研究及ACCORD研究,每个受试者发生终点时间,也就是随访的持续时间不一样,研究选择使用生存时间的分析方法、Cox比例风险分析等。选择分析人群纳入时,通常采用意向性治疗分析,不管研究对象是否遵从规定的干预措施,都纳入组间结局的比较,可能低估总体的干预疗效,但可以避免重要的结果出现偏倚[2]。而另一种分析策略,符合方案分析,只包括遵从方案的受试者,因其未能保持随机化的价值,并且只能支持无效假设,通常以意向性治疗分析为主导。

六、随机化和盲法

控制偏倚是RCT中最重要的一项内容,方法主要包括随机和设盲。同样是关注降糖治疗与血管并发症的大学组糖尿病研究项目,因随机化存在疏漏[12]造成基线组间性别、CVD风险因素并不均衡,导致其甲苯磺丁脲治疗相比于安慰剂心血管发生风险更高的研究结论不受到认可。Look AHEAD研究和ACCORD研究都采用了将中心作为分层因素的中心分层区组随机化方式[13],保证多个临床研究中心的均衡性。

随机化最重要的实际操作过程中要保证分配过程是真正的随机分配且不受人为干扰。常见的随机策略有简单随机化、区组随机化、分层随机化、协变量适应随机化等。通常情况下,首选的方式是将纳入的受试者个体采用简单的随机化方法分配到每个干预组。区组随机化,是指在预先确定好一个“区组”,比如6个人(也可以是4或8个人等),在这个区组内进行随机化,对每个区组内的6个人进行随机化分配,是一种可以平衡对照组和试验组受试者人数的常用方法。分层区组随机化是为了确保组间与结局紧密相关的变量水平均匀分布,比如研究CVD发病率的试验中,根据有无CVD病史、合并心血管风险因素的个数等进行分层,因而能确保基线每组分配的受试者发生CVD的风险组间均衡,也能提高小样本试验的效能,而对于受试者超过1 000名的大型试验中,分层随机化则获益甚微,因为随机分配可以保证基线变量的均匀分布。

此外,研究者应该尽可能采用盲法设计,即受试者本人、接触受试者的研究者、进行指标测量的工作人员以及确定和判断结局的人,对分组情况不知情。在一些情况下,由于技术或伦理等现实原因,类似于Look AHEAD生活方式干预类型的研究,分配的干预措施为教育、饮食、运动的干预,那么很难对受试者设盲,研究者也应该保证对确定和判断结局的个人设盲,比如收集受试者信息与提供生活方式指导分配给独立各不相干的研究人员。

在RCT中,随机化可以使基线时的混杂因素影响最小化,分层区组随机化可以减少小样本试验中关键预测变量的机会性分布不均;而对干预措施设盲同样重要,可以使联合干预和结局确定、判断时的偏倚最小化。

综上所述,笔者以Look AHEAD研究和ACCORD研究为例,剖析了RCT设计的要点,包括从临床问题到研究问题的转化、研究对象的选择、干预的选择和对照的设立、结局的分析以及研究实施中偏倚的控制。完整的RCT研究从提出明确的科学研究问题开始,制定详细、可实施、符合伦理的干预随访计划,选择合适的目标受试者,计算合适的样本量,明确临床相关结局的定义以及制定合适的统计分析策略,采用随机化和设盲的方法控制偏倚,注重研究实施过程的监督和质量控制是RCT研究取得成功不可或缺的重要环节。

参考文献略

作者投稿及专家审稿请登录中华糖尿病杂志官方网站:zhtnbzz.yiigle.com

,