抽象性
后台
外部实验或可行性研究可用来估计关键未知参数,为确定随机控试设计提供参考然而,对于需要多大的实验研究几乎没有共识,有些人建议增缩估计值以适应规划确定性RCT时缺乏精度的问题
方法论
模拟法说明标准偏差采样分布持续结果和事件率二分结果我们展示提高实验样本规模对精确度和偏差的影响,以及三种现实假设下预测功率并用信任区间推理推高估计结果,限制注意力到外部实验和可行性研究
结果
正常分布结果集合标准偏差相对增益公元前不到10%(每组5个题目加法),样本总尺寸为700.1至0.5之间的真比例,我们发现,样本大小为60时,实验样本所增加的5个对象的精度小于5%调整实验研究估计不精度所需的样本大小可产生过大确定RCT并需要60-90试样尺寸
结论
外部实验研究估计SD时至少有70个测量对象(每组35个)公元前持续结果如果干预组事件速率需要由实验者估计,则共需要60-100个对象因此,如果初级结果二进制,实验试验中可能需要至少120个主体(每组60个主体)。使用大型实验研究比使用夸大估计避免精度缺失效率高得多
后台
2012/13年度,国家卫生研究所资助了2.089亿英镑研究赠款,涵盖广泛的方案和举措,以确保患者和公众尽快从最经济合算的最新卫生干预和治疗中受益一号..很大一部分研究赠款随机控制测试评估新卫生技术的临床有效性和成本效益设计周全RCT被公认为评价新卫生技术最小偏差研究设计,决策者如国家保健英才学院正越来越多地期望RCT结果指导实践和政策
RCT旨在提供精确估计处理效果,因此需要设计得当,以便有良好能力回答具体的临床重要问题上压和下压审判都不受欢迎,每种审判都产生不同的道德问题、统计问题和实际问题。良好的实验设计需要预先表示临床重要效果大小的大小然而,对控制群中结果或事件率变化的一些知识是必要的,然后才能进行稳健样本规模计算。如果结果完全确定,这些关键群或控制参数可以从以前的研究中估计(RCTs或组研究)或通过元分析估计然而,在某些情况下,如果可靠数据不存在,对拟接受调查的审判群而言,则查找强估计量可能构成相当大的挑战。
系统审查发布RCT并持续结果发现证据表明,与测试完成时观察到的变异相比,样本规模计算中人口变异被低估(占报告端点的80%)2..这项研究还发现,25%的研究极弱,如果试验中观察到的变异用在样本规模计算中,则需要样本大小五倍之多最近对实验审查,同时产生二进制和连续结果3发现有50%的可能性低估密钥参数但他们也发现样本规模计算中所用估计与确定性试算出估计大相径庭这表明许多RCT确实严重下压或上压系统审查RCT建议送达研究伦理学委员会4发现超过半数的研究不报告假设人口参数基础关键群参数假设值可能是RCT设计中最弱部分
公费RCT经常报告的一个问题是,参与者的招聘往往比预期慢或难,许多审判未能达到原设想试算和试算信封内原计划样本规模由联合王国医学研究理事会和NIHR卫生技术评估方案资助的122项试验集审查发现,不到三分之一(31%)的试验实现原创病人录用目标,55/122(45.1%)实现原创目标不足80%,半(53%)获延期[5..最近更新审查中报告类似结果6..因此,许多审判似乎招聘率不切实际。不在允许时间框架内录入目标样本规模的试验将减少检测预定目标效果大小的功率
确定性RCT成功与否主要取决于是否有可靠信息为设计提供参考设计周全、实施分析试办或可行性试办可帮助设计确定性试办并增加确定性试办实现其目的和目标的可能性术语和可行性研究与实验研究之间有一些混淆NIHR组合内联合王国公共供资机构已商定实验和可行性研究定义7..另一些作者则反对使用“可行性”一词并区分三种预科试验工作8..
辨别实验和可行性研究特征
NIHR指南写道:
可行性研究是在主研究前完成的研究小片,上下文中可使用这些参数估计设计主研究所需的重要参数[九九万事通.例举 :
- 一)
标准差结果度量,在某些情况下需要估计样本大小;
- 二)
参与者愿意随机化;
- 三)
临床医生招聘参与者的意愿;
- 四)
特定时间段合格病人数;
- v)
拟结果计量特征和在有些情况下可行性研究可能涉及设计适当结果计量
- 六)
后续率、对问卷回复率、守法率、集群内关联系数等
随机控件测试可行性研究本身可能不随机化关键点是可行性研究不评价兴趣结果左转主学习
如果可行性研究小RCT,则不需要初级结果,通常不进行电量计算。样本规模应足以估计临界参数(例如招生率)至必要精度
实验实验版主研究以微量运行测试主研究组件能否齐头并进[九九万事通.因此它与主研究在许多方面相似,包括对初级结果的评估在某些情况下,这将是实质性研究的第一阶段,实验阶段提供的数据可能有助于最终分析称内部实验或实验研究结束时,数据可分析并置放,即所谓的外部实验[10万事通.
为了本文件的目的,我们将使用实验研究术语指为估计确定性试验设计关键参数而展开的实验性工作使用内部实验研究双级RCT设计有广泛但单独的文献11-14..
关于试试应用样本规模以通知确定性RCT设计有分歧15-18号..虽未就此达成共识,但已拟出一些建议此外,大多数建议侧重于估计持续结果的变异性,相对较少注意二分结果分歧出自两个竞争压力小型研究可能不精确偏差(定义方式是将采样分布中值与实值比较),因此需要大采样规模来减少偏差和不精确度然而,从总体上讲,外部实验或可行性试验测算的参与者无助于估计最终试验处理效果,所以我们的目标应该是保持适当功率,同时将学习科目总数保持在最小值上。最近一些作者推广实践,将差异估计不精确推向持续结果数个建议使用单方信任区间法保证至少50%时间需要电量15,18号,19号..
本文旨在就两个考虑因素提供建议和指南第一,外部测试RCT估计不确定关键参数需要的题数(SD持续结果!和同意率、事件率和损耗率二分结果)第二,这些实验研究估计值应如何用于为确定RCT样本规模(和设计)提供参考假设实验研究(和确定性RCT) 由二分制组优异测试 新的处理对控
为了这项工作的目的,我们假设确定性RCT样本大小使用意义和功率参数计算这种方法目前在RCTs常用然而,提出了计算样本大小的替代方法,例如使用宽置信区间[20码贝叶斯方法允许不确定性21号-23号..
方法论
我们的目的是展示小研究取人口参数估计值的变异虽然采样分布从统计理论中完全理解这些参数,但我们选择通过模拟而不是理论推理展示分布行为,因为所产生分布的视觉表示使广大对象能获取结果
随机化不是估计所有兴趣参数的必要条件应当指出,可行性阶段中某些兴趣参数与随机化过程本身相关,如随机化主动率和随机化臂中保留或退出率此外,随机化确保随机化分组间已知和未知共变平均均衡分布保证我们可以估计武器内参数而不必担心混淆因素这项工作中,我们因此决定允许随机化参与者模拟估计所有参数的一般设置,尽管人们承认某些参数独立于随机化
我们先考虑正常分布结果 测量成两组相同大小研究组从10到80使用增量5实验体积为10,000模拟免失泛性, 我们假设真实人口平均结果0和真实人口差1并用SD估计值以及其他信息计算确定RCT所需样本大小(使用值阈值方法)。
目标差分或效果大小被视为最小临床重要差分通常是方法上的差分,以持续结果比较干预与控制组结果时的差分差分转换成标准效果大小文献中可找到更多详细统计假设测试框架24码,25码..
双组实验RCT使用新处理组或控件/常用照理组SD估计值或合并二组SD估计值并使用集合标准偏差公元前)从二组特样SD估计样本规模计算时,我们一般假设结果变异性在两个组中相同或相等,尽管这一假设可以松散并可用方法计算样本规模,假设每个组中不平等自定义26,27号..类似使用标准t级带两个独立样本测试(或多线性回归)并假设等差分析结果数据t级-不假设等差测试Satterthwaite或Welch校正)
假设二分结果二分分布并考虑数种不同的真实人口比例,因为比例估计值变化取决于真比例函数估计事件速率时,不一定总能把研究的双臂集合起来,所以我们研究从单臂估计比例的影响,研究规模增加五题0.1至0.5乘以0.05视假设真实比例而定,我们模拟了每种假设和样本大小至少10,000次可行性研究二元结果模拟数通过要求在0.001标准误差内估计比例来确定最大模拟数为250,000次,而实比为0.5Stata12.1版本实施模拟28码和R13.2版29..
常用分布结果
计算每次模拟样本差 并 集合自定义计算如下:
我们还计算样本集成SD标准误差
量化精度相对变化时,我们比较95%置信区间的平均宽度2N级面向SD公元前学习尺寸为2N级平均宽度提高至2N级+5我们使用宽置信区间,因为它能测量估计精度
基于SD采样分布,其上下95%置信限值由
精度相对百分率增量量化为95%置信区间宽减值,如果样本大小每组增加5分
比亚斯评估方法从每次估计中减去真值并取这些差值的平均值
我们还考虑按Browne1995年原创建议调整实验SD估计效果15..此处建议单方置信限值以提供校正值使用50%单向置信限值时,会调整估计偏差,使用小实验时也建议修改17..if we express 50%置信度sim和Lewis18号表示合理要求样本规模计算保证期望功率,规定置信度大于50%为了图解,我们将考虑 80%置信度 通货膨胀因子要求置信区间限值超过值80%因此通膨系数应用SD公元前实验出自 :
考虑对电量和规划样本大小的影响时,我们需要说明合理的具体替代假设试验中,难得看到处理方法大相径庭,因此我们认为中小标准效果大小(组方法差异)为0.2、0.35和0.530码..每种真特效大小为0.2、0.35或0.5,用SD除法公元前估计每次复制并使用此值计算所需样本大小假设未经调整或调整SD公元前机师估计使用规划样本大小公元前估计)然后计算原计划研究的真正功率 假设我们知道真人SD公元前事实一
二分结果
二分结果将只测量同质组下图对每个真实人口成功概率重复九大成功概率介于0.1至0.5间间距0.05由五题复数组成 从10到200不等下标一并j大全表示实比和实验研究大小面向每次模拟实验研究尺寸N级j大全数例成功Y级JI测试~Bin(bin)N级j大全,θ一)模拟N级j大全计数 。先观察比例 计算九大成功概率
相关95%置信区间使用Wilson评分计算21号由 :
第二,进程重复使用N级s级模拟数估计真正成功概率不到标准误差0.1%,平均测得成功概率九大成功概率θ定点实验规模计算如下:
去哪儿 华府市 面向kTh模拟实验研究第三,由于试运行样本规模相对小, 我们计算出95%置信度间平均宽度 真正成功概率平均超出N级s级使用威尔逊评分法模拟31号定样大小由 :
精度相对增百分率接近5个学习参与者增量二分法
关于连续结果,偏差评估方法从每一项估计中减去真实人口值并取签名平均值95%覆盖概率32码..
结果和讨论
常用分布结果
图一号复选框和插图生成样本SD分布公元前.模拟下真SD等于1图一号清晰显示估计分布随着集合样本规模增加和估计SD分布而缩小公元前集合样本规模增加后也变得更对称性偏差和斜率比较小样本大小偏差方向表示SD往往被低估样本总规模超过50后,平均偏差变得可忽略不计,并低于真值0.005更值得注意的是较小采样大小采样分布大变异,即使采样规模大,大量采样变异仍然存在。
图2显示百分位增精度公元前中加十名参赛者精度随样本规模的增加而提高,但精度相对增益(总正值)随着样本规模的增加而下降。样本总尺寸为70, 增加更多参赛者学习尺寸时精度提高不到10%从精度和最小偏差(持续结果)看,样本总尺寸为70似乎对实验研究是可取的。3显示真功率分布规划样本尺寸为0.2,假设我们在5%双向值水平上需要90%功率真实功率分布其他特效大小非常相似(可以证明取决于实验估计SD分布应相同,但归整为整数在小采样大小时引起微小变化)。和预期的一样,图显示较小样本大小的功率大相径庭计划研究至少80%的功率检测目标效果大小(当我们表示需要90%功率时)超过75%时间图3并显示真功率常超过90%,但从总参赛者计算高功率成本无法从图中量化对比度图4能够显示高功率转换为样本规模的“成本”。
图4显示使用估计SD时计划样本大小分布公元前出实验物(带免通货膨胀SD公元前)可以看到这些块的整体形状相似所有三种特效大小,但随着特效大小下降,规划样本大小成比例更高图4a显示样本大小(表示0.2方法之间的真差)使用非调整式SD公元前和夸大SD公元前平面图使用夸大SD公元前表示我们已经具体说明,我们希望计划研究拥有90%功率并有80%置信或确定性比较这两块图并叠加样本规模1,052, 这正是我们实际需要检测效果大小0.2, 功率90%和5%双向意义, 当实战SD已知等于1时,你很容易看到通缩因子效果图解4bc显示与图相同的对比4a实差0.35和0.5通缩系数的主要作用是保证80%计划研究实战大点比需要大50%测试百分数显示,计划样本规模提供至少80%的功率并置信于90%,同时使用至少70分的实验研究研究人员需要仔细考虑最小功率水平,准备在人口差异高估时允许最坏情况假设。5实验研究的大小加到计划研究的大小,这样就可以看到所需题目总数分布通膨因素的影响现在取决于真效果大小假设我们计划使用通缩系数 效果大小为0.5 实验研究约30最优相同平均题数使用70号实验研究非调整估计结果,结果计划题数变换较小效果大小为0.2,而应用通货膨胀系数最优实验规模为约90,但最优规模仍然比仅仅使用大小为150的实验研究非调整估计大采样总规模
总样本规模分布使用实验样本导出SD公元前估计并免通货膨胀(a)效果大小=0.2(b)效果大小=0.35(c)效果大小=0.5下图相似图4脱机样本总规模包括实验研究规模虚虚垂直线表示90%和80%电量所需的样本规模,如果实战SD已知和实验研究没有必要的话。
二分结果
估计比例时采样分布函数真实人口比例,所以从集合群估计这一点似乎是不明智的,除非它独立于处理组,并强烈假设群体间平等采样分布增量5比10,因为我们允许从一臂估计的可能性统计理论预测采样变异最大时真比为0.5并随着真比比比比比0.5大而下降时,我们显示两种最极端比例的结果,即:0.1和0.56)实比为0.1时采样分布略偏斜,并倾向于低估真值,即使使用不均匀试臂大小然而,当真比例为0.5时,在低或高估计实验参数方面没有系统性偏差大部分波动是由于采样大小推算出估计值,而真比例并非可能结果(例如,如果真比例为0.5,样本规模为25,则最接近真值为12/25或13/25)。实验样本规模60或60以上后,这些波动稳定图中正式显示估计精度相对百分比增益7中平均宽度95%置信区间与平均置信区间比较精度相对百分比增益显示真比例0.1和0.5持续结果建议截取10%作为阈值二进制结果使用5%阈值精度图相对百分率增量跨5%阈值时样本规模为55至60,并跨3%阈值时样本规模为100图8显示五大真实比例的覆盖概率显示95%置信区间包含真值的频率图显示相当大的波动样本大小为100后,这里所考虑的真正比例的覆盖概率提高微乎其微
结论
模拟数据直观显示大采样变异,这是从小采样大小估计关键参数时的主要弱点小样本大小确实引出偏差估计值,但偏差与采样变异相比微小取精度相对百分数增益样本时, 数据显示估计正常分布高精度变量标准偏差可能至少需要70分之和估计事件率单组60至100题似乎合情合理依赖处理参数可以通过集合两组估计,所以在许多情况下,我们推荐样本规模将是总样本规模平均说来,当使用实验研究估计值规划确定性RCT时,计划研究势必力不从心确定性RCT计划持续结果需要90%的功率,真正功率为80%,至少76%保证,只要估计出自至少20题的实验三次现实效果大小为0.2、0.35和0.5标准偏差评价调整对实验估计中预期不确定性的影响18号..对所考虑的所有效果大小使用小实验并应用通货膨胀调整效率不高,因为这将共产生较大的样本大小(实验加主研究)。并检验条件电量 假设我们知道真正的替代平均使用不精确估计但需要高功率将产生可接受功率,比样本总尺寸测算少得多的“成本”。因此,使用大型外部实验研究减少定点RCT目标功率的变异实际上效率更高
使用小型实验研究关键参数估计的隐含作用是超载和低载研究的风险压倒式研究似非如此尖锐问题,但有可能引起代价错误并可能导致判断某项研究高得令人望而却步似乎支持使用内部实验研究,但内部实验需要测试关键设计特征固定化,因此内部实验后处理效果测量方面的任何变化都会导致分析难点
公开审判中的一个主要和有据可查的问题正在招聘中,有比目标少选对象的趋势受聘原因之一很可能是小实验者无法准确估计事件率,如招聘和随机化意愿,事实上将试运行规模提高至每组60至100人可能提供更可靠的关键招聘参数数据
现实中,设计外部实验时需要平衡两个竞争问题:最大精度(你希望估计的关键参数)和最小化外部实验规模,这影响到资源、时间和成本。精确度(关键参数估计值)和大小(主体数)之间的取舍设计外部实验时,研究人员需要理解,当他们决定用小样本进行外部实验研究时,他们交换估计精度与定题研究总样本大小
缩写
- NICE:
-
国家保健英才学院
- NIHR:
-
国家卫生研究所
- RCT:
-
随机控制试验
- SD:
-
标准偏差
- UK:
-
英国
引用
NIHR2012/2013年度报告[http://www.nihr.ac.uk/publications万事通
Vickers AJ:随机测试弱化报告样本大小计算JClinEptimol2003年56(8):717-72010.1016/S0895-4356(03)00141-0.
Charles P,Giradeau B, Dechartres A, Baron G,Ravaud P报告随机控制试验样本规模计算:审查BMJ2009年338:b1732-101136/bmj.b1732
Clark T,Berger U,Mansmann U:随机临床实验原创研究协议样本大小判定提交英国研究伦理委员会审查BMJ2013346:F1135-101136/bj.f1135
麦当劳AM、KnightRC、CampbellMK、EntwistleVA、GrantAM、CookJA、ElbourneDR、FrancisD、GarciaJ、RobertsI:随机控制测试受召由两个英国供资机构资助的测试审查审判2006年7(1):9-10.1186/1745-6215-7-9
Sully BG, Julious SA,Nichol J:重新调查随机控制多中心测试招聘:审查由两个英国供资机构资助的测试审判2013年14(1):166-10.1186/1745-6215-14-166
NIHR可行性实验研究[http://www.nets.nihr.ac.uk/glossary万事通
Arnold DM、BurnsKEA、AdhikariNKJ、KhoME、MeadeMO、CookDJ:关键护理临床实验设计解释Crit Care me2009年37(1):S69-S74
塔巴内L、MaJ、ChuR、 ChengJ、IsmaaA、RiosL、RobsonR、ThabaneM、GiangregorioL和GoldsmithC教程BMC医学解法2010年10(1):1-101186/1471-2288-10-1
Lee EC,Whitehead AL,Jacques RM,Julius SA:实验实验统计解释:意义阈值应重新考虑吗?BMC医学解法2014年14:41-10.1186/1471-2288-14-4
ProschanMA:二级样本规模重新估计J生物药典2005年15(4):559-57410.1081/BIP-200062852.
BirketMADYSJ内部实验估计样本大小状态医学1994年13(23-24):2455-2463
Witts J,BrittainE:内部实验研究提高临床实验效率的作用状态医学19909(1-2):65-72
FrideTKiesterM:盲样大小重新估计优异性测试:偏差与差差估计药效状态2013年12(3):141-14610.1002/pst.1564.
BrowneRH:使用实验样本确定样本大小状态医学199514(17):1933-194010.1002/sim.4780141709.
Julious SA:样本尺寸为12/药效状态2005年4(4):287-29110.1002/pst.185.
Julious SA:设计诊断性试验,不确定变异估计药效状态2004年3(4):261-26810.1002/pst.139.
simJLewisM:实验实验规模应结合精度和效率考虑计算JClinEptimol2012年65(3):301-30810.1016/j.jclinepi.2011.07.011.
KieserMWassmerG:从实验样本测定样本大小差使用上限置信度生机J1996年38(8):941-94910.1002/bimj.4710380806.
BlandJM:权力暴政:有更好的方法计算样本大小吗?BMJ2009年339:b3985-10.1136/bj.b3985
ShuSK SmithTMF:贝叶斯定样法实用应用RstatSer-Ser2006年169:235-25310.1111/j.1467-985X.2006.00408.x.
O'HaganA,StevensJW,CampbellMJ:临床实验设计保证药效状态2005年4(3):187-20110.1002/pst.175.
BruttiP,de SantisF:robust贝叶斯样本大小判定以避免临床试验等值范围JStat平面推理2008 138 (6):1577-159110.1016/j.jspi.2007.05.041.
Kirkwood BR,SterneJAC:基本医学统计2003年牛津:Blackwell科学2
CampbellMJ,WaltsSJ,MachinD:医学统计:卫生科学教程奇切斯特2007年:威利4
赛德斯威特FE估计差分分布生物度量公牛1946年2月11011410.2307/3002019.
WelchBL: 泛化学生问题生物美特里卡1947年,34: 28-35
StataCorp:统计软件:12版2011 TX学院站
团队RC:R:统计计算语言环境2013年奥地利维也纳:R统计计算基础
Cohen J:行为科学统计功率分析1988年Hillsdale,NJ:Lawrence Erlbaum2
Agresti A,CoullBA:近似优于区间二度估计的精度AM统计师1998年52(2):119-126
BurtonA, AltmanDG,RoystonP,HolderRL:医学统计模拟研究设计状态医学2006年30(25):4279-4292
Acknowledgements
MDT、SJW、AW和NS由Sheffield大学资助MD完全由NIHR资助,作为博士研究团契的一部分(DRF-2012-05-182)。AH由NIHR研究设计服务公司和Sheffield大学资助表达的观点为作者的观点,不一定为国家卫生局、NIHR、卫生局或附属组织或资助组织的观点。
作者感谢三位评审员详细批评评论,大大改进手稿我们还感谢Sheffield大学卫生相关研究学院医学统计组成员对项目进行建设性讨论和投入。谢斐德大学支持此项研究
作者信息
作者和附属关系
对应作者
附加信息
竞技兴趣
作者声明他们没有竞技兴趣
作者贡献
NS、MD和AH帮助概念设计,执行模拟和汇总统计分析并制作图形输出MDT帮助设计项目并起草和修改手稿AW帮助研究设计并起草文献评论SJW为研究设计以及手稿第一稿和修改作贡献所有作者阅读并批准最终手稿
权限和权限
文章经BioMed中心有限公司许可发布开存文章依据创用CC授权分发http://creativecommons.org/licenses/by/2.0允许在任何介质上不受限制使用、分发和复制,只要原创工作正确记账创用公共域免责http://creativecommons.org/publicdomain/zero/1.0/)适用于本条提供的数据,除非另有说明。
关于此文章
点上此文章
tereMDDDMet al.样本尺寸需求估计关键设计参数外部随机控试:模拟研究审判15264(2014)https://doi.org/10.1186/1745-6215-15-264
接收:
接受:
发布:
多尔市:https://doi.org/10.1186/1745-6215-15-264
关键字
- 样本大小
- 可行性研究
- 实验研究
- 二进制结果
- 连续结果,RCTs