政策制定者应该相信综合指数吗?政策制定中不恰当的指标的缺陷评述

卫生研究政策和系统体积19文章编号:40（2021）引用这篇文章

3756访问
8引用
10Altmetric
指标细节

摘要

背景

本文批判性地讨论了全球指数的使用和优点，特别是全球卫生安全指数(GHSI;卡梅隆et al。https://www.ghsindex.org/#l-section--map)在危机迫在眉睫的时候，例如当前的大流行。该指数根据195个国家对大流行或其他生物威胁的预期准备情况对其进行排名。2019冠状病毒病(Covid-19)大流行为比较全球健康指数对每个国家的预测与实际表现提供了背景。一般来说，预测的业绩与实际业绩之间存在一种反向关系，也就是说，预测的业绩最好的员工往往是受打击最严重的员工之一。显然，这反映出该指数在即将到来的危机管理中的潜在政策用途很差。

方法

该报告分析了全球健康指数，并确定了为什么它可能难以预测实际的大流行准备情况，Covid-19大流行就是明证。该论文还使用了两组不同的数据集，一组来自关于Covid-19大流行传播的世界计量表，另一组来自国际政府科学咨询网络(INGSA)从证据到政策跟踪器，对29个选定国家的大流行应对政策的实际实施情况和相应的死亡率进行比较。

结果

本文分析了该指数预测与实际不相符的原因，并提出了适用于这方面的全球指数的六条一般性意见。这些观察是根据方法和概念分析得出的。这些全局指数中的抽象级别将不确定性建立在不确定性之上，并隐藏了隐含的价值假设，这可能将它们从实际的政策需求中移除。

结论

从分析中提出的问题是，政策界是否有更好的工具在大流行病中进行决策。基于INGSA的证据-政策追踪数据，并在社会心理学和科学哲学研究的支持下，提出了一些简单的启发式方法，这些方法可能比全球指数更有用。

同行评审报告

意义的声明

《政策制定者应该相信综合指数吗?》——关于政策制定中不适当的指数的缺陷的评论”讨论了构建一个作为政策指南的全球指数的潜在实际影响问题。全球指数产生于多个领域，但本文重点对2019年10月的全球卫生安全指数进行了批判性分析。尽管该指数旨在预测各国在大流行期间的潜在表现，但Covid-19期间的实际表现基本上与这些预测相反。分析了产生这种现象的原因，并提出了简单的启发式方法可以更好地进行策略设计。本文最后对全球指数的实际应用提出了一些质疑。

背景

为什么会有人想为任何东西建立一个全球综合指数呢?标准答案是，它将为政策设计和决策提供一个有用的工具。从理论上讲，综合评分比幸福或可持续性等复杂概念更容易理解，因为它提供了量化的衡量标准。接下来的问题是:用户如何知道索引是否好、是否有用?试探性地，我们可能会认为，如果使用该指数会比没有它的情况下产生更好的政策和决策，那么该指数是有价值的。然而，大多数全局综合指标从未真正进行测试，因为性能通常不能直接测量。我们推测，全球卫生安全指数(GHSI)的情况[1可能是个例外。该指数在经过2.5年的研究后于2019年10月发布，包含195个国家的排名，以及它们对全球流行病和大流行的准备情况的相关得分。全球温室效应全球倡议的目标是在“面对高后果性和全球灾难性生物事件日益增加的风险，以及防范国际融资方面的重大缺口”时成为一种关键资源。[1］．开发人员“相信，随着时间的推移，全球卫生系统指数将促进国家卫生安全方面可衡量的变化”，并寻求“阐明防范和能力差距，以增强国家和国际两级填补这些差距的政治意愿和资金”[1］．它使用了6个类别的140个问题，34个指标和85个子指标，所有这些都是从开源信息构建的。在100分的总分中，这些国家的平均得分为40.2分，介于83.5到16.2之间。只有不到7%的国家被评为能够有效预防病原体的出现或释放。

方法

我们的指导问题是:GHSI有多准确?为了回答这个问题，我们比较了两组数据:关于2019冠状病毒病(Covid-19)大流行传播的世界计量表数据和政府科学咨询国际网络(INGSA)的证据到政策跟踪数据，这两组数据都根据家庭总收入减少到选定的29个国家。然后，本文的大部分内容分析了GHSI，并确定了为什么它可能不太适合预测大流行应对的绩效的挑战，然后演示了一个简单的启发式的力量结论．

在全球健康指数发表不到半年后，新型严重急性呼吸综合征冠状病毒2 (SARS-CoV-2)导致了Covid-19大流行。这就有可能将该指数以前的评估结果与各国卫生系统的实际表现进行比较。首先，我们可以看到全球健康指数是如何将各国划分为三个防范级别的。美国和英国分别排在第1和第2位(分别为83.5和77.9分)，瑞典(72.2分)、韩国(70.2分)和法国(68.1分)分列第7、9和11位。还有一些国家，如德国(66.0)，西班牙(65.9)，挪威(64.9)，意大利(56.2)，新西兰(54.0)和其他国家，被置于中等级别，显然准备不充分。巴西(59.7分，排名22)的排名略好于新加坡(58.7分，排名24)。蒙古至少高于平均水平，为49.5分，而牙买加(29.0分，排名147)和斐济(25.7分，排名168)都在准备非常差的国家之列。

结果

对于那些一直在关注Covid-19全球传播的人来说，全球健康指数排名和每个国家的病例数之间的不一致性将是显而易见的。2020年6月数据来自Worldometer网站[https://www.worldometers.info/coronavirus/]显示出的结果与我们对全球健康指数排名的预期相反，美国、英国、瑞典和巴西是受影响最严重的国家(这一趋势后来继续下去)，而其他国家，即德国、挪威、新加坡、新西兰和越南，则超出了从该指数得出的预期。牙买加和斐济当然也是如此，这两个国家几乎消除了Covid-19，但却被列为准备最不充分的国家之一。两个表现最好的经济体(2020年6月)，台湾和香港，甚至没有被包括在全球指数中。我们确实注意到，使用像Worldometer这样的数据聚合器存在一些限制，在一些国家，测试的可靠性可能存在一些问题，但我们认为这些数据足以证明问题的严重性。表格1根据家庭总收入对29个国家进行了比较。这一群体被选为家庭收入最高的群体，以关注那些卫生保健系统的资源限制不是主要决定因素的国家。等级差越小，说明GHSI与现实的估计越接近，等级差越大，说明期望与实际绩效的差距越大。在178个国家中，只有20个国家的世界里程表排名在其全球健康指数排名的20个名次之内。

表1家庭总收入最高的29个国家[2］

全尺寸表

通过量化这29个国家的预期和实际业绩数据，我们可以更深入地了解差异如此之大的原因。人们并不总是很清楚什么应该被算作绩效数据——可以选择每百万居民感染的人数，或者像我们现在这样，每百万人死亡的人数。我们认为避免高死亡率通常是可取的。我们没有做的是将GHSI总分分成六个子类别，这会使情况有些复杂。^脚注1GHSI报告中的这些子类别是:

1.
防止病原体的出现或释放
2.
及早发现和报告可能引起国际关注的流行病
3.
快速应对和减缓流行病的蔓延
4.
有足够和健全的卫生系统来治疗病人和保护卫生工作者
5.
承诺改善国家能力、筹资和遵守规范
6.
总体风险环境和国家对生物威胁的脆弱性。

任何一个国家在这些子类别上的得分都不一样，因此全球健康倡议声称提供了更详细的信息，说明在哪里采取行动，以提高总体防范能力。我们推测，对于这些国家的一些长期政策改进来说，这可能确实成立。然而，总得分是用来进行国际比较和排名的，也是在政治讨论中传递最大权重的。今年2月底，美国总统唐纳德·特朗普援引全球应对新冠病毒指数称，美国为应对新冠病毒做好了充分准备，称“美国，我们被评为第一”[3.］．正是在这一点上，实际表现的差异最为明显。

在接下来的部分中，我们讨论了全球健康倡议所面临的挑战，并在结论中提出了一个更简单的启发式，可以为大流行应对的成功(或失败)提供更直接的解释。

讨论与文献回顾

我们想问为什么这个指数是错的?

针对Covid-19疫情下GHSI的表现已经进行了几次评估[4，5，6，7］．所有评估都指出了显著的不足，根据Worldometer的数据，一些评估指出了关系的逆转。拉扎维等人[6)质疑排名体系的智慧:“根据各指标的加权分数对国家进行排名，这些指标的得分变化不定，且彼此之间没有直接可比性，这是有问题的。”这些作者的这一论断是基于他们的批评，即评分系统不一致(一些指标得分为0或100分，而另一些则使用整个范围)，使用权重是随意的，包括一些指标(如城市化)的有效性值得怀疑。张和麦卡利尔[7]通过添加其他量化平均值的方法(在全球温室指数中使用的算术平均值、几何平均值和调和平均值之外)扩展了全球温室指数的分析，并看到了全球温室指数的积极潜力，但强调了六个指标的显著差异:“快速响应和检测和报告的影响最大”[7］．他们还就隐含的政治偏见发表了评论:“作为中国的一部分，香港作为一个国家没有被纳入全球服务指数，而台湾没有被纳入，无疑是出于政治原因。”[7］．艾比等人[5]观察到预测与结果之间的不一致，并强调政治领导和以往应对流行病的经验应被视为准备工作的一个关键因素，因此应被纳入全球健康倡议未来的改进。

除了艾特肯等人的批判[4]，大多数批评集中在建立综合指数的技术方面，特别是当涉及到结合子类别以创建分配给个别国家的总分时。艾比等人[5]似乎发现主要的缺点是不正确的权重和不完整的相关类别的定义。然而，值得注意的是，他们似乎在不同的子类别中找到了实用主义政策价值，从而搁置了如何从大量指标和子指标构建这些指标的问题。

鉴于大多数国家的预期和实际表现之间的极大差异，人们必须问，这种失败可能是由于指数的基本概念存在更深层次的固有弱点，还是由于其他环境因素。例如，表现不佳是否仅仅是因为政治决策者没有利用本国的能力或过于自信?业绩超出预期是否可能是因为政治决策者通过更严格的干预措施弥补了预防能力的不足，或许还得到了地理运气的支持?所有这些都可能是在即将到来的危机中实际表现的一个因素。然而，我们认为，当所有这些国家的决策都是基于证据的时候，把指责或赞扬完全放在政治一边是错误的，GHSI旨在捕捉当时似乎相关的、公开可得的事实的全部范围。

值得注意的是，我们几乎没有证据表明该指数实际上是世界各国政府决策的关键组成部分，但很明显，该指数的建立是考虑到了这一意图。鉴于全球健康指数显然是根据大量国际专家的大量数据精心准备的，我们甚至可以把这个问题概括为:当面临迫在眉睫的全球危机时，制定任何此类全球综合指标作为战略决策工具是否有意义?换句话说，在即将发生健康危机时通过全球指数提供决策支持工具的意图是否现实?

建立综合指数

最初，综合指数只是一系列基础指标的函数。构建良好的综合指标涉及许多步骤和决策。根据马乔塔和帕累托[8以下的决策步骤是至关重要的:

(1）
定义问题!对于某些问题，对于如何界定问题，以及问题的构成要素和基本类别是什么，可能存在一个明确和一致同意的定义。这里的挑战是有一个可靠的系统理论的理解，建立节点和接触点与其他系统。对于复杂的问题，比如宏大的社会挑战，这一步往往是科学争论甚至冲突的话题。关于大流行对卫生安全的威胁，选择哪些因素和类别至关重要是一项正在进行的讨论。
（2）
选择一组单独的指标!“理想情况下，应根据指标的相关性、分析的合理性、及时性、可获得性等选择指标。选择步骤是信息重叠导致的可能冗余和信息丢失风险之间权衡的结果。(同上，第70页)。同样，要做出这样的选择，必须对系统的相互依赖性有很好的洞察。它涉及对个别指标的相对重要性的判断，并避免那些与其他指标密切相关的指标，因为这增加了冗余。这些指标必须是可衡量的，即需要具体的数据来支持它们。这里还出现了其他问题;例如，在选择计量尺度(如国家、区域、家庭等)或计量单位的数字(0和1，或0和n吗?)如果一个国家的数据不足，在某些情况下可以应用蒙特卡罗方法来填补缺失的数据。
（3）
规范化所选指标!在这里，人们必须确保在不同类别的不同指标之间实现可比性，尽管测量维度不同。因此，我们可以将它们转换成简单的数字，而这些数字可以通过不同的方式实现，例如通过排名、到参考点的距离等。这通常会产生抽象细节的效果，给数字的准确性增加了不确定性。
（4）
聚合规范化指标!此步骤将所选指标组合为一个或多个综合指标。因为它们是标准化的，一个简单的方法可以是单位排名的数学加法。但是，在复杂的情况下，人们可能需要对它们进行不同的衡量，即在将每一个指标汇总成最后的指数之前对它们分配权重，以强调某些指标而不是其他指标。同样，权重的分配显然是一个主观判断的问题，我们可以推测，这经常受到所选择的价值视角的强烈偏见:“可以选择不同的权重技术，但没有一种是可自由选择的豁免”[9］．此外，我们如何结合不同的指标?最常见的方法是使用加权算术平均值，但由于这可能意味着在一个指标上的糟糕表现可以通过其他指标上的良好表现来抵消，因此它可能不足以满足我们想要在组合指标中衡量的东西。然后可以为这些值选择一个加权几何平均值。有一些正式的方法可以减少对单纯判断的依赖，例如根据指标的可变性分配权重，因为可变性越大，我们认为它对我们试图用指标衡量的东西的影响就越大。然而，即使这样，我们的描述也将取决于一个全面的判断。

在科学文献中，有许多关于如何提高综合指数表现的贡献，例如在粮食安全领域，这是一个公认的非常复杂的问题，从不同的角度进行研究(cf. [9，10，11])。在制订这些指标所涉及的一些技术问题上取得了重大进展。

然而，从上面的描述可以很容易地推断出，建立一个综合指数不是简单的，它涉及到一系列的主观判断。它还涉及到处理系统的不确定性和处理价值预设。12，13])。马乔塔和帕累托[8用以下方式表达:

“没有通用的方法来构建综合指数。在每种情况下，它们的构造在很大程度上取决于特定的应用，包括形式和启发式元素，并包含一些关于现象的专家知识。”((8], p . 72)。

人们可能会问这样一个问题:如果构建全球综合指数的过程如此复杂和困难，为什么我们会有如此多的综合指数?愤世嫉俗的回答是，因为这就是科学家能做的。更中立，也可能更现实的答案是，他们很容易与决策者沟通。典型的政策问题可能是:“我们在X方面做得怎么样?”’其中X是一个相当复杂的社会问题，那么接下来就会问:‘与其他国家相比，我们在X方面做得怎么样?“如果我们能够提供一个简单的答案，最好是用数字关系(比如等级)来表示，那么决策者就会认为这是非常有用的，特别是在随后提出如何提高这个数字的建议措施时。”通常的问题是，由于X本身的复杂性，它没有在任何单一的科学竖井中处理，而是需要翻译和分解成子问题，这些子问题有利于各种科学学科的机构。这是一项涉及跨学科的任务。因此，我们同意构建综合指数作为规划工具的意图是有效的，但我们也认为有价值的信息损失发生在从科学家到决策者的过程中。信息损失通常与隐性不确定性或隐性价值有关，因为人们离决策者越近、越高，它们就越不可见[14］．正是这种信息的丢失和结果的简化严重限制了在迫在眉睫的危机情况下使用全局索引作为管理工具。

我们对此有以下看法:

(1）
像GHSI这样的指数包含了几层特异性，目的是寻找被认为是高级属性所必需的可测量(可量化)特征。由此可见，更高层次的属性是不能直接测量的，这就是为什么人们试图通过使用间接影响更高层次属性的从属指标来规避这个问题。通常，由于这些高级属性的复杂性，它们不能直接测量，这意味着出现各种突发和不可预测现象的可能性。这个问题在文献中被称为主观性和争议性，首先确定问题本身，然后将问题分解为可测量的子单位。一些全局指数已经成功地确定了一个简单的参数列表，人们一致认为这些参数对问题至关重要。一个典型的例子是人类发展指数[15]，对此已就三个基本个别指标达成广泛协议。就全球健康指数而言，生物防范被分为6类，有34个指标和85个子指标。然而，虽然对类别的选择可能会受到质疑，人们当然也可以质疑所选择的指标和分指标。卫生安全的构成是有争议的，是一个主观判断的问题。选择中隐含着一些有问题的问题，比如某些指标是可替代的还是不可替代的。例如，社会对保护措施的广泛遵守和良好的风险沟通能减少必要的重症监护床位数量吗?
（2）
从具体到更抽象的上升过程意味着在不确定性的基础上建立不确定性，而没有精确量化这些不确定性的方法。在全球研究中，由于当地基础数据登记和统计方式的差异，通常已经存在较大的不确定性。传达每个国家的单一指数得分或排名掩盖了测量中固有的不确定性和波动性。虽然现有的统计方法可以将不确定性与敏感性分析结合起来[10，它们并没有消除深层的不确定性，而只是将不确定性转化为可量化的单位[11］．
（3）
在形成一个共同概念时，属于一个共同概念的属性组被假定为一致的线性和可加性。这排除了对研究中索引的威胁/属性的响应的局部变化。其中一个差异可能是风险沟通中的文化差异。这种方法还忽略了本构性质的相互依赖性和相互强化或削弱。通常情况下，人们试图通过将各种指标标准化来避免这种情况，使它们彼此具有可比性。虽然规范化过程可以以各种方式进行，但它必然涉及对系统依赖性的一些主观判断。
（4）
构建一个全球综合指数作为决策的战略工具，前提是存在一个理想状态的规范性基准。任何这样的基准都会间接引入一种社会政治和文化偏见，这对专家和非专家之间观点的多样性是不公平的。遵约程度高的国家可能比遵约程度低的国家在准备方面有其他需要。如果用户有时间批判性地评估建立该指数的方法，特别是基本问题(在我们的情况中，是对健康威胁的准备)和所选指标与当地条件的匹配程度，那么这一点就不那么重要了。然而，在危机迫在眉睫的时候，我们必须假设，每一场危机都有其复杂的挑战，最初的努力集中在了解威胁的特殊性质上。例如，传播的种类和速度、防护装备(PPE)的需求、接触者追踪方法、重症监护病房的可用性或疫苗接种的可能性和可及性逐渐成为评估任务，而当前的Covid-19危机已经成为事实。
（5）
虽然扎实而全面地报告全球综合指标的编制方式可能会使人免受一些学术批评，但事实仍然是，指数的使用者，即决策者，几乎肯定会把重点放在指数所反映的总体业绩数字上。在当前的例子中，全球卫生安全指数的作者指出，“世界各地的国家卫生安全从根本上很薄弱”，“没有一个国家对流行病或大流行做好充分准备，每个国家都有重要的差距需要解决”[3.］．但这并没有阻止南非国民议会的一名议员声称，“2019年全球卫生安全指数报告显示，南非在195个国家中排名34……这让人们相信，南非政府正在通过国家卫生部尽其所能加强其卫生系统，保护公众免受任何其他形式感染的爆发”[16］．全球指数的关键效用在于最终能够依赖于整体表现排名。
(6）
将一项政治上重要的特性分解为其子指标和其他要素总是有遗漏系统相互作用和相互依赖的风险，而这在具体的学术学科中是没有例行评估的。例如，虽然冠状病毒大流行在大多数国家激活了流行病学家和病毒学家，但在一些国家也激活了心理学家、经济学家、社会科学家和哲学家。因此，在问题的框架中已经存在偏见，而在跨学科方法中可能出现的替代框架很少被考虑。

科学系统化总是包含不确定性，而且永远不会是完全客观的，这一点一点也不奇怪。事实和价值观在科学政策中相互交织。后常态科学的框架[12，13长期以来，他一直强调这一点。在卫生以外的领域也有人指出，综合指数可能具有误导性，在某些要素中可能隐藏了重要信息。詹皮特罗和萨尔泰利[17就全球生态足迹提出了这个问题，这激起了许多反应[18，19，20.］．我们还注意到其他依赖劣质代理的综合指数[8，11]，例如经济合作及发展组织(经合组织)的“美好生活指数”[21或大学排名[22］．危险在于，基于有缺陷的指数和排名的政策决策很可能同样有缺陷。

什么可能更好呢?

让我们反过来问这个问题:如果没有这些全球指标或指数，我们能制定出明智和科学的政策吗?由于我们对Covid-19的经验记忆犹新，我们大胆地认为，良好的大流行政策(暂时不考虑其他问题)可以基于合理的数据展示和一些简单的启发式，而不是过分夸大的模型及其固有的局限性。有效控制大流行的一个关键是在早期阶段采取预防性行动，并实施应对措施，如广泛检测、封锁和关闭边境[23］．台湾是这方面最好的例子之一:2019年12月底，台湾注意到邻国中国大陆感染病例迅速上升，对入境人员进行了广泛检测，并启动了国家卫生指挥中心。它很快关闭了边境，隔离了所有病例，并迅速传播了口罩的使用。台湾当然没有在GHSI中得到任何建议，因为它一开始就没有被包括在内。早期发现和早期反应是在许多国家控制大流行的关键，它们显示了成功。像英国、瑞典和美国那样的自由放任态度被证明是致命的。联合国的一份报告传递了这样一个关键信息:“尽早采取果断行动，防止Covid-19的进一步传播或迅速遏制其传播，挽救生命”[24］．其他作家已经注意到，简单可能是一个更好的指南，而不是迷失在复杂中:“优先考虑简单而非复杂的必要性是社会健康的核心”[25］．

此外，在所有的建模中，人们普遍认为在精度和复杂性之间存在权衡。复杂的模型被认为更准确，而简单的模型被认为更笼统，缺乏细节，导致预测中的系统性偏差——但向模型添加细节并不能保证可靠性的提高，除非添加的过程是必要的、被充分理解的和可靠估计的[26］．奥尼尔的猜想是，在模型复杂性和模型误差之间可能存在一种最佳平衡([26], p . 70)。在我们的例子中，这意味着增加GHSI中基本类别的复杂性实际上可能会增加而不是减少模型错误。这也是[27］．引用这篇文章:

“复杂性可能是相关性的敌人。大多数建模者都意识到，在模型的有用性和它试图捕捉的广度之间存在着一种权衡。但许多人被增加复杂性的想法所诱惑，试图更准确地捕捉现实。随着建模师融入更多的现象，一个模型可能更适合训练数据，但这是有代价的。它的预测通常会变得不那么准确。随着更多参数的加入，不确定性就会增加(不确定性级联效应)，误差可能会增加到预测变得无用的地步。”((27], p . 483)。

在这里，我们想强调的是，我们关心的是如何应对一场迫在眉睫的健康危机，我们想知道，像全球健康指数这样的指数是否可以被视为我们管理这场危机工具箱中有用的补充。在前面的章节中，我们已经声称，事实上，它是没有用的，肯定不是一个精确的预测。但我们想问的真正潜在的问题是，我们是否完全用错了工具箱。与所有工具一样，工具的效用取决于它的预期用途。因此，我们并不认为像全球健康指数这样的综合指数毫无用处，因为我们可以假设，它可以很好地作为卫生政策长期战略设计的工具。然而，我们主张的是，在大流行等迫在眉睫的危机中，如果将综合指数视为危机管理的指南，那么这种政策是不明智的。这并不意味着科学不能对危机管理做出贡献，恰恰相反:如果正确的信息以正确的形式、在正确的时间提供正确的剂量，科学是非常有用的。这只意味着，科学建议可能会采取全球综合指数以外的其他方式来制定政策。一个问题可能是要抵制提供数字的诱惑，即量化，因为人们对问题的理解还很差。

“量化可能适得其反。对产生数字的过分关注会把一门学科从大致正确推向精确错误。”((27], p . 484)。

人们需要认识到决策者面临迫在眉睫的危机的迫切需要。显然，决策者试图提出健壮的决策，而健壮的决策通常是关于深度不确定性下的一系列不同的未来情景，并由不同的健壮性标准指导;例如，决策者可能从乐观主义者转变为悲观主义者，也可能从悲观主义者转变为乐观主义者。28，29］．随着危机的发展，决策者需要进行学习，从而采用适应性管理方法[30.)在危机的不同阶段。在这一过程中，风险登记册的可用性可能是一种决策支持工具。众所周知，科学-政策的界面充满了陷阱，制度化的经纪可能是一种重要的支持[31，32，33，34]，旨在在信息稀缺和深受深度不确定性困扰的情况下进行综合。启发式可能比正式的工具更重要，它旨在描述手头问题的整个复杂性。Todd和Gigerenzer [35观察发现，简单的启发式通常与更高级的算法表现相当或更好，而且它们增加了人们渴望的简单性，从而导致更健壮的决策。这一点并不否定量化形式指数或模型的其他一些使用，但它强调科学输入需要满足危机决策情况的约束和背景。

在这种情况下，关于风险出现的可靠数据的可用性通常为决策启发式提供了良好的输入。我们通过参考INGSA的证据到政策跟踪来说明这一点。

结论

基于我们的INGSA证据-政策追踪项目[https://www.ingsa.org/covid/policymaking-tracker-landing/]，我们已经能够分析120多个国家采取的干预措施及其发生时间。到目前为止，我们从这些数据中看到了两种特定的模式。在日本和韩国等东亚国家，政府迅速采取行动，增加了个人防护装备和口罩的供应，并在非常早期的阶段——至少在第三例死亡病例的14天前——开始了公共教育运动，从而避免了实施严厉限制的必要性。在其他一些发达国家，限制集会规模、关闭学校、限制非必要的流动和关闭边境等封锁措施早在Covid-19的威胁失控之前就已实施。就每百万人死亡人数而言，情况最糟糕的国家在实施类似政策之前等待的时间更长，如表所示2．POLITICO的记者在比较欧洲各地的封锁措施时采用了类似的分析方法[36］．应当指出的是，一些国家在国家一级的反应分散，没有列入表中2．这样的模式显然不能说明情况的复杂性;例如，它不包括这些政策的实现或执行，也不区分不同规模的政策。虽然总是有例外，但从数据中可以看出，采取预防和快速行动的简单启发。

表2选择的国家和政策，突出显示自第三例Covid-19死亡病例以来每项政策实施的天数。

全尺寸表

根据前几节的分析，我们假设有一些决策步骤可以作为在大流行中表现良好的有用和简单的启发式方法:

(1）
认识到你的国家面临的威胁和尽早作出反应的必要性
（2）
在广泛和透明的社会基础上商定贵国最可接受的应对战略，例如在贵国境内消灭病毒、"压平曲线"或将感染发生率保持在预先确定的损害阈值以下
（3）
在选定的应对战略中加入适合流行病学、经济和社会文化情况的实际措施组合，并随着危机的发展监测其有效性
（4）
根据预定义的目标和当前数据调整或改变您所选择的策略，最好包括各种专业知识来源和与社会的良好沟通。

通过对INGSA证据-政策追踪数据的进一步分析，我们旨在了解干预的时机、应对水平以及这些方法背后的证据来源和理由的作用。这将使我们能够对世界各国政府采取的不同类型的战略进行分类，并确定不同的领导风格和意识形态基础。值得注意的是，世界卫生组织没有将成功使用的最明显的控制机制——关闭边境视为关键应对措施，但关闭边境是在岛屿国家消除COVID-19的关键，因为岛屿国家可能更容易及早关闭边境。然而，很可能没有全球性的灵丹妙药来避免或遏制一场正在出现的大流行病。将价值的多样性以及流行病学、经济和文化方面的考虑纳入一项强有力的战略，也是通向社会服从的桥梁。

保持简单

我们的结论是，为了应对大流行病或管理其他迫在眉睫的危机，我们可能不需要在构建全球综合指标方面更加复杂。在这些情况下，这些指数可能并不像它们所宣称的那样有用。事实上，我们可能在很大程度上不需要它们，而是可以从过去中学习，认识到简单的启发式的力量，它对环境有意义，并为我们指明正确的方向。我们在制定各领域政策改进的长期战略时，仍可以批判的精神和深刻理解其内在假设的心态，参考全球指数。然而，在当前这样的大流行中，我们认为简单的启发式和适应性管理是稳健政策的关键。

数据和材料的可用性

在当前研究期间生成和/或分析的数据集可在INGSA COVID-19证据到政策跟踪库中获得，https://www.ingsa.org/covid/policymaking-tracker-landing/；worlddometer COVID-19冠状病毒大流行知识库，https://www.worldometers.info/coronavirus/?;以及2019年全球卫生安全指数，https://www.ghsindex.org/#l-section--map．

笔记

然而，快速浏览一下这6个类别的排名就可以看出，不能指望有什么重大变化会使综合排名更接近Worldometer的数据。

缩写

GHSI:: 全球卫生安全指数
INGSA:: 国际政府科学咨询网络
人:: 世界卫生组织

参考文献

Cameron EE, Nuzzo JB, Bell JA，等。全球卫生安全指数。建立集体行动和问责制。核威胁倡议和约翰霍普金斯健康安全中心。2019年10月。https://www.ghsindex.org/#l-section--map．2020年6月19日访问。
Phelps G, Crabtree S.全球，平均家庭收入约10,000美元。盖洛普》2013。https://news.gallup.com/poll/166211/worldwide-median-household-income-000.aspx．2020年6月19日访问。
约翰霍普金斯大学(中心)。以下是小特在冠状病毒新闻发布会上提到的约翰·霍普金斯大学的研究。2020年2月28日。https://hub.jhu.edu/2020/02/27/trump-johns-hopkins-study-pandemic-coronaviruscovid-19-649-em0-art1-dtd-health/．2020年6月19日访问。
Aitken T, Chin KL, Liew D, Ofori-Asenso R.反思大流行准备:全球卫生安全指数(GHSI)可以预测Covid-19负担，但方向相反。J感染。2020;81 (2):318 - 56https://doi.org/10.1016/j.jinf.2020.05.001．
Abbey EJ, Khalifa BAA, Oduwole MO, Ayeh SK, Nudotor RD, Salia EL，等。全球卫生安全指数不能预测经济合作与发展组织国家对冠状病毒大流行的反应。PLoS ONE。2020; 15 (10): e0239398。https://doi.org/10.1371/journal.pone.0239398．
文章中科院 PubMed 公共医学中心谷歌学者
Razavi A, Erondu NA, Okereke E.全球卫生安全指数:它增加了什么价值?BMJ Glob Health. 2020;5:e002477。https://doi.org/10.1136/bmjgh-2020-002477．
文章 PubMed 公共医学中心谷歌学者
Chang CL, McAleer M.用于Covid-19风险分析的替代全球卫生安全指数。《国际环境研究与公共卫生》，2020;17(9):3161。https://doi.org/10.3390/ijerph17093161．
文章中科院公共医学中心谷歌学者
构建综合指数的方法:我为人人，人人为我。中国科学(d辑:自然科学版);2013;
谷歌学者
Santeramo FG。关于粮食安全的综合指标:决策很重要!食品学报2015;31(1):63-73。https://doi.org/10.1080/87559129.2014.961076．
文章谷歌学者
Caccavale OM, Giuffrida V. Proteus综合指数:朝着更好的衡量全球粮食安全的方向发展。世界Dev。2020;126:104709。https://doi.org/10.1016/j.worlddev.2019.104709．
文章谷歌学者
邵泰利A, Ratto M, Andres T, Campolongo F, carboni J, Gatelli D，等。全局灵敏度分析。底漆。奇切斯特:威利;2008.https://onlinelibrary.wiley.com/doi/book/10.1002/9780470725184．
《政策科学中的不确定性与质量》，第15卷。多德雷赫特:施普林格;1990.
书谷歌学者
Funtowicz SO, Ravetz JR.后正常时代的科学。期货。1993;26(6):568 - 82。
文章谷歌学者
《论科学的不确定性和预防原则》。在:Gethmann CF, Carrier M, Hanekamp G, Kaiser M, Kamp G, Lingner S等人，编辑。跨学科研究和跨学科有效性声明。德国海德堡:施普林格;2015.138 - 58页。https://www.researchgate.net/profile/Stephan_Lingner/publication/268149000_Interdisciplinary_Research_and_Trans_disciplinary_Validity_Claims/links/54623db80cf2c0c6aec1ac99.pdf．2020年6月19日访问。
联合国开发计划署(开发计划署)。2010年人类发展报告。纽约:帕尔格雷夫·麦克米伦;2010.
书谷歌学者
议会监督组织。未经修订的国会议事录，2020年3月5日。https://pmg.org.za/hansard/29979/．2020年6月19日访问。
詹皮特罗·M，萨尔泰利·a。生态。2014;46:610-21。https://doi.org/10.1016/j.ecolind.2014.01.030．
文章谷歌学者
Goldfinger S, Wackernagel M, Galli A, Lazarus E, Lin D.足迹事实和谬误:对Giampietro和Saltelli(2014)《无处可去的足迹》的回应。生态。2014;46:622-32。https://doi.org/10.1016/j.ecolind.2014.04.025．
文章谷歌学者
Galli A, Giampietro M，金手指S, Lazarus E, Lin D, Saltelli A，等。质疑生态足迹。生态。2016;69:224-32。https://doi.org/10.1016/j.ecolind.2016.04.014．
文章谷歌学者
范登博，张志强。生态足迹的政策相关性研究。环境科学技术2010;44(13):4843-4。https://doi.org/10.1021/es1003582．
文章中科院谷歌学者
经济合作与发展组织。经合组织美好生活指数，2020年。http://www.oecdbetterlifeindex.org/．2020年6月19日访问。
Shin JC, Toutkoushian RK, Teichler U.大学排名:理论基础、方法及对全球高等教育的影响。多德雷赫特:施普林格;2011.
书谷歌学者
吕宁，郑克伟，Qamar N，黄克春，Johnson JA。应对新冠肺炎风暴:五个亚洲国家的成功控制措施。感染控制，2020。https://doi.org/10.1016/j.ajic.2020.04.021．
文章 PubMed 公共医学中心谷歌学者
联合国。分担责任，全球团结:应对Covid-19的社会经济影响。2020年3月。https://unsdg.un.org/sites/default/files/2020-03/SG-Report-Socio-Economic-Impact-of-Covid19.pdf．2020年6月19日访问。
简单、清晰和极简:Covid-19期间的社会健康。经合组织论坛。2020。https://www.oecd-forum.org/users/389156-julia-hobsbawm/posts/66165-simplicity-clarity-and-minimalism-social-health-during-covid-19．2020年6月19日访问。
特纳MG，加德纳RH。介绍模型。在:特纳MG，加德纳RH，编辑。景观生态学的理论与实践。纽约:施普林格;2015.p . 63 - 95。
Saltelli A, Bammer G, Bruno I, Charters E, Di Fiore M, Didier E，等。确保模范为社会服务的五种方法:宣言。大自然。2020;582:482-4。
文章中科院谷歌学者
波普尔西南。在缺乏正式模型的情况下进行健壮的决策制定和场景发现。期货预测科学2019;1(3-4):e22。
谷歌学者
鲁棒性真的是鲁棒性吗?鲁棒性的不同定义如何影响气候变化下的决策。这一改变。2016;135(3 - 4):409 - 24。
文章谷歌学者
麦克莱恩RJ，李RG。适应性管理:承诺与陷阱。环境等,1996;20(4):437 - 48。
文章中科院谷歌学者
Todd PM, Gigerenzer G. Précis的“让我们变得聪明的简单启发式”。行为脑科学2000;23(5):727-41。
文章中科院谷歌学者
经济合作与发展组织。“政策制定的科学建议:专家机构和科学家个人的作用和责任”。经合组织科学、技术和产业政策文件，第21期。巴黎:经合组织发布。https://doi.org/10.1787/5js33l1jcpwb-en．2020年6月19日访问。
政策:给政府提供科学建议的艺术。大自然。2014;507:163-5。
文章谷歌学者
加强循证决策。奥克兰:总理首席科学顾问办公室;2017.
谷歌学者
证据和专业知识在决策中的作用:科学建议的政治和实践。J Proc R Soc NSW。2018; 151:91 - 101。
谷歌学者
欧洲的冠状病毒封锁措施比较。政治报。2020.https://www.politico.eu/article/europes-coronavirus-lockdown-measures-compared/．2020年6月19日访问。

下载参考

确认

Matthias Kaiser感谢Norman Barry基金会的资助，使他能够在奥克兰大学的Koi tuu -知情未来中心工作，并使他能够对这篇论文做出贡献。所有作者都感谢Jackson Blewden的贡献，并感谢Tatjana Buklijas、Kristiann Allen和Anne Bardsley的有益讨论。

资金

MK非常感谢诺曼·巴里基金会的资助，使他能够留在新西兰。这项研究也得到了国际政府科学咨询网络(INGSA)的支持。

作者信息

作者和联系

科学和人文研究中心，卑尔根大学，卑尔根，挪威
马蒂亚斯•凯泽
Koi ticky:新西兰奥克兰大学知情期货研究中心
Andrew Tzer-Yeu Chen & Peter Gluckman

作者

马蒂亚斯•凯泽

看来作者出版物

您也可以在中搜索这个作者PubMed谷歌学者
安德鲁Tzer-Yeu陈

看来作者出版物

您也可以在中搜索这个作者PubMed谷歌学者
Peter Gluckman

看来作者出版物

您也可以在中搜索这个作者PubMed谷歌学者

贡献

MK一直是第一作者，提供了论文的几个版本的初稿;PD对这些版本进行了编辑和讨论;AC提供了数据分析和文本编辑。所有作者均符合本刊编辑政策中规定的作者标准。所有作者(MK, AC, PG)都对论文的最终版本做出了实质性的贡献，并已阅读并批准了最终稿件。

相应的作者

对应到马蒂亚斯•凯泽，安德鲁Tzer-Yeu陈或Peter Gluckman．

道德声明

伦理批准和同意参与

由于研究的性质和数据集，不需要伦理批准。

同意出版

不适用。

相互竞争的利益

作者声明他们没有竞争利益。

额外的信息

出版商的注意

伟德体育在线施普林格自然对出版的地图和机构附属的管辖权要求保持中立。

权利和权限

开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License)，该协议允许在任何媒体或格式中使用、分享、改编、分发和复制，只要您给予原作者和来源适当的署名，提供创作共用许可协议的链接，并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中，除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中，并且您的预期用途不被法律法规允许或超出了允许的用途，您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本，请访问http://creativecommons.org/licenses/by/4.0/．创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据，除非在数据的信用额度中另有说明。

再版和权限

关于这篇文章

引用这篇文章

凯泽，M.陈，A.TY。政策制定者应该相信综合指数吗?政策制定中不恰当的指标的缺陷评述。卫生资源政策系统1940(2021)。https://doi.org/10.1186/s12961-021-00702-4

下载引用

收到了：2020年9月23日
接受：2021年3月3日
发表：2021年3月22日
DOI：https://doi.org/10.1186/s12961-021-00702-4

关键字

大流行防备
复合指标
Science-for-policy
决策工具
启发式
科学的不确定性