工具变量假设、验证和估计的介绍

Mette Lise LousdalORCID:orcid.org/0000 - 0001 - 9762 - 1927¹

流行病学新主题体积15，文章号:1（2018）引用本文

21日k访问
64引用
10Altmetric
指标细节

一个给编辑的信本文发表于2020年3月19日

摘要

在经济学中，工具变量法被用于在存在不可测量的混杂时推断因果关系。强调与随机化的相似之处可能会增加对流行病学中潜在假设的理解。仪器是预测暴露的变量，但以暴露为条件显示与结果没有独立关联。试验中的随机分配是理想仪器的一个例子，但仪器也可以在观察环境中发现自然变化的现象，例如地理差异，到设施的物理距离或医生的偏好。第四个识别假设受到的关注较少，但对于估计影响的普遍性至关重要。仪器鉴定了一组依令行事的人其中暴露量是伪随机分配的，导致与未测量混杂因素相关的互换性。基本假设只能部分地通过经验来检验，并且需要相关的知识。未来使用仪器的研究应仔细寻求验证所有四个假设，可能会采用与随机化相似的方法。

背景

曝光的随机分配确保了未测量的混杂可被视为随机[1］．根据设计，测量和未测量的混杂因素预期在分配组中平均分布。这导致了互换性，即如果暴露状态被逆转，比较两组的最终结果测量将不会改变[2，3.］．如果与结果风险相关，不依从性可能会使基于实际接受治疗的分析无效。使用随机分配作为工具，可以估计每个人都遵守的因果平均效应[4］．

在观察性研究中，因果推断因缺乏随机暴露分配而受到挑战[5］．自我选择是指患者选择自己接受特定的照射。在口服避孕药、绝经后激素治疗、他汀类药物和流感疫苗等领域已对这类混杂进行了研究，并将其称为“依从性偏倚”[6]、“预防偏误”[7]、“健康黏附效应”[8]和"健康用户效应/偏见" [9］．预防性干预对健康结果的影响可能被高估了，因为一般来说，选择参与的人比不参与的人更健康。指征混淆发生在医生或其他卫生专业人员选择患者接受特定照射时[10，11］．由于适应证的混淆，当医生选择最虚弱的患者进行治疗时，会低估治疗效果，当医生选择最健康的患者进行治疗时，会高估治疗效果[12］．健康用户偏倚和指征混淆是难以解决的偏倚，即使在对预后进行详尽控制后也难以排除[13]、社会及个人因素[6］．如果可以确定合适的工具，即使存在未测量的混杂，也可以估计编者之间的因果平均效应。

在经济学中，工具变量法通常被用于估计存在未测量混杂的因果效应[14］．工具最初被定义为与扰动相关的结构方程模型和假设中的外生变量。对于流行病学家来说，通过强调与随机化的相似之处，工具变量方法和潜在假设可能更容易概念化。本文的目的是回顾工具变量假设和潜在的验证使用有向无环图，并介绍两阶段工具回归技术。

三个基本假设

仪器被定义为预测暴露的变量，但以暴露为条件显示与结果没有独立关联。仪器仅通过对照射的影响来影响结果。试验中的随机分配是理想工具的一个例子，但在符合所需假设的观察设置中也可能发现自然发生的现象。在文献中，基本假设的特征略有不同[4，12，14，15，16，17，18，19，20.]，但可以确定三个一般假设。数字1描述一个带有分配指标的随机对照试验Z、曝光X和结果Y他们有着共同的事业U，这代表了影响关联的未测量因素X→Y．的变量Z是一种工具，因为它满足以下三个假设:

1.
的相关性假设:工具Z有因果关系吗X。
2.
的排除限制:Z影响结果Y只有通过X。
3.
的可交换性假设:Z与结果没有共同的原因Y［19］．这种假设也被称为独立假设[15，18),可忽略的处理分配［14]，或被描述为Z对Y的影响没有混淆［16］．

的相关性在随机对照试验中，假设是不言自明的，在这种试验中，分配理想地决定了暴露量。尽管由于不服从，分配和治疗不会完全相关，Z肯定是可以预测的吗X．的排除限制由有效的双盲来满足，这意味着无论是卫生专业人员还是参与者都不知道分配[16］．因此,Z不能有直接的影响Y．此外,可交换性假设是微不足道的满足，因为随机化预计将导致在分配组中均匀分布的混杂因素[14］．

对平均效应的无偏估计X→Y的平均效果可以估计Z→Y而且Z→X［4］．二分法处理的常用工具变量估计是:

$ $ \压裂{{E左\ [{Y | Z = 1} \右)- E [Y | Z = 0]}} {{E左\ [{X | Z = 1} \右)- E (X | Z = 0)}} $ $

对于连续处理，工具变量估计为:

$ $ \压裂{{X \离开({Y, Z} \右)}}{{X \离开({X, Z} \右)}}$ $

直观地说，分子对应于分配对结果的因果效应的意向治疗效果[16，19］．分母是对指定曝光的遵从性的度量。当不依从性增加时，分母缩小并扩大稀释的治疗意图估计，以估计每个人都遵守的因果影响。在随机对照试验中应用工具变量方法可考虑不依从性，参见例如[21，22］．

工具变量方法可以推广到观察性研究，如果相关性假设略有改变，以一个更普遍的版本:仪器Z和接触X有关联是因为Z有因果关系吗X，或因为X而且Z有共同的事业[16］．在后一种情况下，是不可测量的因果工具U *是被测量的替代品或代理仪器的共同原因吗Z还有曝光X，见图。2．

在文献中，可以确定观察研究中许多不同类型的建议工具，如被称为孟德尔随机化的遗传因素，基于地理差异或与设施的物理距离获得治疗，以及基于设施或医生治疗差异的治疗偏好[18，19］．一些作者鼓励利用自然变异[15]，但亦有人提醒，甄别有效文书的挑战并非微不足道[16，17］．马丁斯和同事们建立了一个仪器的层次结构[17]，其中最有效的观察工具是由研究人员控制的变量，例如随机鼓励戒烟。其次，可以发现一些自然随机化过程的例子，例如孟德尔随机化，等位基因在后代中随机分配。当既不存在主动随机化也不存在自然随机化时，第三个机会是选择自然变异的来源作为工具，并仔细证明假设得到了满足。通常，自然变异只引起仪器和暴露之间的微弱联系。随着有效随机化程度的减弱，仔细审查的必要性可交换性假设增加。此外，排除在没有致盲的情况下，必须仔细考虑限制[17］．

这三个基本假设可以确定因果效应的上限和下限[4，15，16，23］．不幸的是，这些界限通常很宽，甚至与预防效果、因果效应或根本没有效果相容[19］．广泛的界限强调了与估计因果效应相关的不确定性。此外，它们还显示了为了获得点估计值，第四个假设需要提供多少“信息”[24］．

第四个识别假设

第四个识别假设与效应同质性有关[16，19］．在临床环境中，暴露的影响往往是不同的，例如，他汀类药物在胆固醇水平高的患者中比胆固醇水平低的患者更有效。均匀暴露效应的例子很少，尽管阑尾切除术的影响被认为是一个案例[12］．在同质性假设的最极端版本中，曝光的影响X在结果Y在个体之间应该是恒定的，这在生物学上是不合理的。一个较弱的，更合理的假设是没有效果的修改Z在X- - - - - -Y暴露和未暴露亚群的因果效应[19］．换句话说，在暴露者中，因果效应与工具无关同样，在未暴露者中，因果效应与工具无关。这个假设不是自然直观的，但它可以表明，加性效应的修改由不可测混杂因素X- - - - - -Y的影响足以确保该假设不成立[19］．在实践中，一些未测量的混杂因素很可能是效果修饰符。

然而，有人提出了另一种不需要效应同质性的假设。这是假设单调性或没有挑战者［19，25］．这是以限制因果效应估计的普遍性为代价的。想象一个简单的情况，有一个二分类仪器和一个二分类曝光。如果我们假设我们能够观察到在实际分配和反事实分配下的暴露值，我们可以确定四个不同的子组，见表1［14］．在现实中，只能观察到实际分配下的暴露量，因此我们在现实生活中无法区分这些亚组。

表1根据分配和暴露相结合的反事实定义的四个亚组

全尺寸表

从来没有人这些人——不管他们被分配到哪个组——都不会被暴露。同样,总是人是那些不管任务如何都会暴露的人。的依令行事的人是按照任务进行曝光的个人。编码器也被称为边际［12]或有限公司-手术［4)科目。在这个子组中，仪器有望实现可交换性。暴露能够跟随分配，因为预后因素不是那么弱或那么强，病人要么永远得不到治疗，要么总是得到治疗。相反，治疗取决于仪器，即控制或自然发生的随机变化的现象。例如，与小型分散机构提供的传统治疗相比，仅在一个中心机构提供的一种新治疗方法可能对严重病例显示出更好的结果。轻微的病例永远不会被转到中心设施，而严重的病例总是被转到中心设施。不轻也不重的病例可根据其与中心设施的物理距离进行转诊。这意味着，当比较两个预后因素相似的患者时，一个住在附近，另一个住在很远的地方，第一个可能会被转到中央设施，而后者则不会。如果第一个住得远，另一个住得近，他们的暴露状态就会相反。通过这种方式，仪器在可交换的组之间伪随机分配治疗。 Finally, the group of挑战者是指那些与任务相反的人。在前面的例子中，这意味着住在中心设施附近的病人实际上会被转到分散的设施，如果这个病人住得很远，病人就会被转到中心设施。这个群体对于第四个确定假设是至关重要的，即没有否定者[25］．

图中有四个简单的图。3.明确命名之间的联系单调性假设和无反对者的概念[19］．总是索取者和从不索取者的曝光值都是恒定的，不管任务是什么，这是零因果关系Z在X．如果没有反抗者存在，那么唯一的亚种群Z会影响X是编码器。第三个图中的单调递增图说明了这一点。如果不存在抗辩者，则无效Z在Y只会源于一群编者。因此，如果人口中每个人都是编者，工具变量估计将把平均因果效应夸大为因果效应[15］．这种效果估计称为局部平均治疗效果[14，19，24］．这种影响估计的相关性受到了质疑，因为无法确定编写者群体，因此很难将影响估计转换为对决策者具有实际相关性的估计[26］．每项研究的编纂者群体和效果估计都会有所不同，这取决于拟议的工具[12］．然而，为了估计人群的平均治疗效果(ATE)，需要对效果同质性进行强而不可信的假设[24］．

假设验证

的相关性假设Z- - - - - -X关联是经验可验证的，并包括最常见的仪器估计技术的第一步:两阶段最小二乘估计[14，15，16，19］．第一阶段根据仪器预测暴露的期望值。使用f -统计量，r来评估关联²或者说是风险差异。根据经验，如果f统计量小于10，则该仪器被宣布为弱[19］．弱工具将导致较宽的置信区间。的排除无法从资料验证限制[16，19］．相反，必须应用主题知识来排除仪器对暴露的任何直接影响的可能性，见图。4．在随机对照试验中，有效的双盲法确保了这一点。在以医生偏好为工具的观察性研究中，如果医生将其他药物与其首选治疗方法联合使用，例如在评估不同治疗方案副作用的研究中，将缓解恶心药物与化疗联合使用，则这一假设将被违反。

的可交换性假设在使用测量协变量的数据中可以部分验证[15，19］．拟议工具各级别测量混杂因素分布的表格将揭示潜在的不平衡。然而，不能排除来自未测量协变量的混杂。数字5表明偏差可能产生，如果U有直接影响吗Z．在对照试验中，随机化可确保混杂因素在分配组中平均分布，但在观察性研究中，必须特别注意拟议的工具，特别是基于自然变异的研究。在基于物理距离的研究中，另一个影响治疗和结果的因素，如社会经济地位，也可能影响到中心设施的距离。在基于偏好的研究中，如果高风险患者根据自己的偏好选择医生，那么高风险患者可能会聚集在具有特定偏好的医生周围[15］．显然，这种自我分配将违反工具的随机性，并产生虚假的关联。虽然排除限制,可交换性假设无法从数据中验证，已经提出了不同的伪造无效票据的方法[20.，27］．

第四个假设单调性或没有挑战者在随机对照试验中被设计排除，因为致盲消除了反抗的可能性[15］．在观察性研究中，验证需要相关的主题知识，并且很难进行实证检验[12，19］．当使用医生的偏好作为工具时，具有多因素的复杂决策过程可能违反单调性假设[25］．以偏好为基础的工具分析可以辅以医生之间的治疗计划和偏好调查，以便经验地评估单调性假设[25］．

任何违反排除而且可交换性假设将导致有偏差的估计。然而，一个弱仪器将对分子中的偏差产生乘法效应，因为这是由小分母膨胀[16，17］．这可能导致工具变量估计比基于实际暴露的传统估计更有偏见。因此，需要仔细考虑可能的违规行为。

对估计的直观介绍

最常用的仪器估计技术是两阶段最小二乘估计器[15，19］．第一阶段基于线性模型的仪器预测暴露的期望值:

$ $ E左\[正确{X | Z} \] = \ alpha_ {0} + \ alpha_ Z $ $ {1}

然后，第二阶段预测的结果是第一阶段预测的暴露量的函数:

$ $ E左\[正确{Y | Z} \] = \ beta_ {0} + \ beta_ {1} E (X | Z) $ $

的参数\ (\ beta_ {1} \)等价于工具变量估计器。任何用于预测暴露的测量协变量都可以在第一阶段添加，并在第二阶段再次添加。对这些协变量的条件作用将把边际可交换性的假设放宽为基于协变量的条件可交换性的假设[15］．

为了直观地理解估计过程，常规线性回归和工具线性回归如图所示。6基于假设数据。通常，在常规回归中，暴露的观测值构成预测因变量的自变量。在仪器回归中，第一阶段是基于仪器对暴露量的线性预测。第二阶段采用上述拟合线的预测值代替观测值作为自变量。实际暴露量已被预测暴露量所取代。基于预测值的仪器回归线显示出比常规回归虚线更陡的斜率，这可能受到未测量的混杂因素的影响。其基本思想是，预测值不受常见的无法测量的因素的影响X→Y关系。

结论

文献中已经描述了工具变量法的三个基本假设，但第四个识别假设是单调性受到的关注较少。未来使用仪器的研究应仔细寻求验证所有四个假设，可能会采用与随机化相似的方法。

参考文献

随机化、统计学和因果推断。流行病学。1990;1:421-9。
文章中科院 PubMed 谷歌学者
绿地S，罗宾斯JM。可识别性、互换性和流行病学混淆。国际流行病学杂志1986;15:413-9。
文章中科院 PubMed 谷歌学者
绿地S，罗宾斯JM。可识别性、可交换性和混淆性重新审视。流行病学展望。2009;6:4。
文章 PubMed 公共医学中心谷歌学者
流行病学家的工具变量介绍。中华流行病学杂志2000;29:722-9。
文章中科院 PubMed 谷歌学者
Hernán MA, Robins JM。观察性研究(第3章)。见:因果推断，第一部分，博卡拉顿:查普曼和霍尔/CRC;2017.25 - 39 p。(即将出版)．
Petitti DB。冠心病和雌激素替代疗法依从性偏倚能否解释观察性研究的结果?安流行病学。1994;4:15 15 - 8。
文章中科院 PubMed 谷歌学者
Barrett-Connor E.绝经后雌激素与预防偏向。安实习医学1991;115:455-6。
文章中科院 PubMed 谷歌学者
Simpson SH, Eurich DT, Majumdar SR, Padwal RS, Tsuyuki RT, Varney J，等。坚持药物治疗与死亡率之间关系的荟萃分析。BMJ。2006; 333:15。
文章 PubMed 公共医学中心谷歌学者
Brookhart MA, Patrick AR, Dormuth C, Avorn J, W, Cadarette SM，等。坚持降脂治疗和使用预防性保健服务:对健康用户效果的调查美国流行病学杂志2007;166:348-54。
文章 PubMed 谷歌学者
黄志刚，张志刚，张志刚，等。医学技术评价中混杂因素的控制。国际流行病学杂志1980;9:361-7。
文章中科院 PubMed 谷歌学者
比赛当天艳阳高照操作系统。在研究预期效果时需要随机化。统计医学1983;2:267-71。
文章中科院 PubMed 谷歌学者
Harris KM, Remler DK。谁是边缘病人?理解治疗效果的工具变量估计。卫生服务决议1998;33(5 Pt 1): 1337-60。
中科院 PubMed 公共医学中心谷歌学者
Bosco JLF, Silliman RA, Thwin SS, Geiger AM, Buist DSM, Prout MN，等。最顽固的偏倚:在观察性研究中，没有任何调整方法能完全解决指征混淆。中华流行病学杂志。2010;63:64-74。
文章 PubMed 谷歌学者
Angrist JD, Imbens GW, Rubin DB。使用工具变量确定因果效应。美国统计杂志，1996;91:444-55。
文章谷歌学者
Rassen JA, Brookhart MA, Glynn RJ, Mittleman MA, Schneeweiss S.工具变量I:工具变量利用非实验数据中的自然变化来估计因果关系。临床流行病学杂志，2009;62:1226-32。
文章 PubMed 公共医学中心谷歌学者
Hernán MA, Robins JM。因果推断的工具:流行病学家的梦想?流行病学。2006;17:360 - 72。
文章 PubMed 谷歌学者
马丁斯EP，佩斯特曼WR，德布尔A，贝利瑟SV，克伦格尔OH。工具变量:应用和限制。流行病学。2006;17:260-7。
文章 PubMed 谷歌学者
Davies NM, Smith GD, Windmeijer F, Martin RM。工具变量研究报告和实施中的问题:系统回顾。流行病学。2013;24:363-9。
文章 PubMed 谷歌学者
Hernán MA, Robins JM。工具变量估计。在:因果推断，第二部分。博卡拉顿:Chapman & Hall/CRC;2017.53 - 68页(即将出版)．
柏occhi M，程杰，小DS。因果推断的工具变量方法。统计医学2014;33:2297-340。
文章 PubMed 公共医学中心谷歌学者
Holme Ø， Løberg M, Kalager M, Bretthauer M, Hernán MA, Aas E，等。乙状结肠镜筛查对结直肠癌发病率和死亡率的影响。《美国医学协会杂志》上。2014; 312:606。
文章中科院 PubMed 公共医学中心谷歌学者
Swanson SA, Holme Ø， Løberg M, Kalager M, Bretthauer M, Hoff G，等。随机试验中每方案效应的限制:在结直肠癌筛查中的应用。试验。2015;16:541。
文章 PubMed 公共医学中心谷歌学者
Davies NM, Smith GD, Windmeijer F, Martin RM。COX-2选择性非甾体类抗炎药与胃肠道并发症和心肌梗死的风险。流行病学。2013;24:352 - 62。
文章 PubMed 谷歌学者
Swanson SA, Hernán MA。评论:如何报告工具变量分析(欢迎提出建议)。流行病学。2013;24:370-4。
文章 PubMed 谷歌学者
Swanson SA, Miller M, Robins JM, Hernán MA。基于偏好的工具的单调性条件的定义和评价。流行病学。2015;26:414-20。
文章 PubMed 公共医学中心谷歌学者
Swanson SA, Hernán MA。全球思考，全球行动:一个流行病学家对工具变量估计的观点。科学通报2014;29:374 - 4。
文章 PubMed 公共医学中心谷歌学者
Glymour MM, Tchetgen Tchetgen EJ, Robins JM。可信的孟德尔随机化研究:评估工具变量假设的方法。美国流行病学杂志，2012;175:332-9。
文章 PubMed 公共医学中心谷歌学者

下载参考

确认

作者感谢Timothy L. Lash和Henrik Støvring对初稿的深刻评论。

相互竞争的利益

作者声明她没有竞争利益。

数据和材料的可用性

不适用。

发表同意书

不适用。

伦理批准并同意参与

不适用。

资金

奥胡斯大学资助了这项研究，但没有参与研究设计、数据收集、分析或手稿起草的任何部分。

出版商的注意

伟德体育在线施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

作者信息

作者及隶属关系

奥尔胡斯大学公共卫生学系，巴索林斯Allé 2, 8000，奥尔胡斯C，丹麦
Mette Lise Lousdal

作者

Mette Lise Lousdal

查看作者出版物

您也可以在PubMed谷歌学者

相应的作者

对应到Mette Lise Lousdal．

权利和权限

开放获取本文根据创作共用属性4.0国际许可协议(http://creativecommons.org/licenses/by/4.0/)，允许在任何媒介上不受限制地使用、分发和复制，前提是您对原作者和来源给予适当的赞扬，提供到创作共用许可证的链接，并注明是否进行了更改。创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)除另有说明外，适用于本条所提供的资料。

转载及权限

关于本文

引用本文

Lousdal, M.L.工具变量假设、验证和估计的介绍。新兴主题流行病学15， 1(2018)。https://doi.org/10.1186/s12982-018-0069-7

下载引用

收到了：2017年5月8日
接受：2018年1月7日
发表：2018年1月22日
DOI：https://doi.org/10.1186/s12982-018-0069-7

关键字

工具变量
单调性
因果推论
无边无际的混淆
随机化
可交换性

工具变量假设、验证和估计的介绍

摘要

背景

三个基本假设

第四个识别假设

假设验证

对估计的直观介绍

结论

参考文献

确认

相互竞争的利益

数据和材料的可用性

发表同意书

伦理批准并同意参与

资金

出版商的注意

作者信息

作者及隶属关系

相应的作者

权利和权限

关于本文

引用本文

分享本文

关键字

流行病学新主题

联系我们