协议登记和报告
我们遵循协议系统评价和元分析的首选报告项目(PRISMA-P)来开发该协议(参见附加文件)1该系统综述于2022年8月1日在国际系统综述前瞻性注册(PROSPERO)中注册。
纳入和排除标准
表格1在考虑PICO框架的情况下,本文提出了研究的纳入标准。系统评价和荟萃分析将评估中低收入国家家庭和学校体罚与儿童、青少年和成人结局之间的平均关联(以及上述特征在这种关联中的变化)。
研究类型
本综述将考虑在同行评审期刊上发表的采用定量方法的研究,包括实验方法、准实验方法(例如,工具变量、差异中的差异、匹配)和观察方法。根据先前关于体罚与儿童、青少年和成人后果的荟萃分析[5],我们将排除灰色文献(如论文、未发表的手稿)和定性、理论和案例研究。要考虑纳入,研究应提供足够的基本信息,以有信心地计算效应量(ES)。如果无法获得计算ES的信息,我们将通过电子邮件联系相应的作者索取信息。如果我们在两周内没有收到回复原始请求的回复,我们将发送提醒并延长一周。如果我们没有收到回复,我们将排除该研究。
人口
人口将仅限于生活在中低收入国家的儿童、青少年和成年人。我们将考虑在研究期间(即2002年以后)被世界银行国家和贷款小组归类为低收入和中等收入国家的所有国家[44].
曝光
本系统综述和元分析将关注所有形式的体罚,遵循上面讨论的定义。在综述中,我们将包括衡量任何形式的体罚与没有体罚的研究,以及那些使用连续体罚频率或严重程度的研究。只要作者声称他们是在测量体罚,研究就会被包括在内。我们将排除那些衡量对体罚的信念或态度而不是实际体罚暴露的研究,以及仅使用指标(例如,不良童年经历- ACEs)的研究,并且不允许将体罚与其他逆境或暴力形式独立衡量。
比较器
该综述将包括将遭受体罚的儿童与从未遭受过体罚或较少遭受过较少或严重体罚的儿童、青少年或成年人进行比较的研究。
结果
我们将遵循之前的元分析[4,5,9]体罚(或打屁股,特别是)与儿童、青少年和成人结果之间的关系,重点关注与(1)外化行为问题(如攻击),(2)内化行为问题,(3)心理健康问题,(4)酒精或药物滥用,(5)亲子关系,(6)认知发展(包括学业成就),(7)社会情感发展(如自尊和自我调节)相关的结果,(8)成为身体虐待受害者的可能性;(9)支持体罚和其他形式的暴力。在进行数据提取后,我们可以对上述结果类别添加新的或折叠的一些类别。
搜索策略
我们咨询了哈佛大学的五位图书馆员,以确定可能包括来自中低收入国家的研究的相关数据库。此外,我们在UlrichsWeb搜索了阿拉伯语、中文、西班牙语、葡萄牙语、法语、印地语和斯瓦希里语的专门关于心理学、教育、医学和公共卫生的期刊[45].随后,我们确定了期刊的索引,并包括了其他数据库,只要它们有一个同义词库(即专门的主题术语),以确保我们搜索的可重复性。有了这些信息,我们决定搜索以下10个数据库:(1)APA PsycInfo, (2) PubMed, (3) EMBASE, (4) ERIC,(5)社会学文摘,(6)全球健康,(7)CINAHL Plus全文,(8)学术搜索Premier,(9)亚洲研究书目,(10)教育资源。
我们将在数据库中搜索英语、西班牙语、葡萄牙语、法语、阿拉伯语和中文标题和摘要中的以下关键词:体罚*、体罚*、体罚*、体罚*、体罚*、严厉惩罚*、严厉纪律*和掴*(参见附加文件)2:检索代码见附录2)。在所有搜索中,我们将使用出版日期(即2002年之后出版)和出版类型(即同行评审期刊)的过滤器。
此外,我们将考虑所有符合我们纳入标准的研究,这些研究来自先前发表的关于体罚与儿童、青少年和成人结果之间关系的系统综述和荟萃分析[4,5,6,9,12,13,14,46,47].
筛选和全文审查
我们会将所有前瞻性研究输出至Covidence (www.covidence.org),以确保决策过程的重现性。在标题和摘要筛选之前,我们将从Covidence库中删除所有重复的内容。两名审稿人(JC和一名训练有素的研究助理)将根据预先建立的纳入标准独立审查所有标题和摘要。所有的分歧将通过审稿人之间的讨论以协商一致的方式解决,如果未能达成一致意见,第三个审稿人(ETG)将帮助解决剩余的冲突。随后,JC和一名训练有素的研究助理将根据纳入标准独立审查剩余记录的全文,所有分歧将按照标题和摘要筛选阶段的相同程序解决。
数据提取
至少两名审稿人将使用预先试点的标准化数据提取模板为符合纳入标准的研究提取数据。我们将从Covidence的研究中提取定性数据,并在Excel电子表格中计算ES所需的统计数据。在其他信息中,我们将提取以下数据:
- 1.
研究的基本细节(如作者、发表年份)
- 2.
与样本特征相关的细节(如国家、样本大小、性别、年龄分布)
- 3.
数据结构(如横断面、纵向、实验、回顾性)
- 4.
方法方法(例如,实验或观察)
- 5.
包括在模型中的协变量,如果有的话
- 6.
体罚措施(如观察、父母报告、孩子报告、孩子报告回溯、父母和孩子都报告)
- 7.
研究中使用的体罚的定义
- 8.
体罚发生的场所(如家里或学校)
- 9.
如有,样本中体罚的普遍程度
- 10.
体罚措施的特征(例如,频率、严重程度、实施体罚的时间[上周、一生中、上个月、去年]、体罚时的发展期[0-2岁;3 - 5年;6 - 10年;+ 10年)
- 11.
结果的衡量(例如,直接评估、家长报告、孩子报告)
- 12.
结果的定义和测量结果的年龄
- 13.
体罚措施和结果的独立性(例如,相同或不同的评分者)
- 14.
主要结果的叙事综合和调节(例如,体罚和结果之间的关系因性别、照顾者的教育程度或家庭财富等特征而变化)
- 15.
用于计算体罚与结果之间关联的效应量(例如,均值、标准差)的统计
效应量计算
至少两名审稿人将为每项研究提取所有可用的相关ES。我们将包括所有允许我们比较(1)未调整和调整模型,(2)具有不同识别假设的模型,以及(3)不同国家体罚与儿童、青少年和成人结果之间的关联的ES。我们将把所有研究水平的效应量转化为标准化的平均不同效应量(即科恩效应量)d).对于将效应大小报告为组比较的研究(例如,遭受体罚与未受到体罚),我们将使用科恩公式\ (d = \压裂{\ mu_1 -{\μ}_2}{\σ}\),在那里μ1是体罚组的均值,μ2对照组的均值,和σ合并的标准差。对于没有以组比较形式报告效应量的研究(例如,体罚的频率或严重程度),我们将遵循Borenstein及其同事[48将相关性和其他关联的定量测量转换为科恩的方法d影响大小。
数据合成
我们将首先对研究结果进行叙述综合,包括(1)在中低收入国家的研究中使用的体罚定义,(2)地理分布和方法学方法,(3)主要发现,以及(4)适度分析的结果。
本综述中包含的许多研究很可能包含不止一个效应量(例如,对于两个具有不同识别假设的模型,多个结果,未调整和调整)。单个研究中多个效应量的抽样误差可能由于同一研究内嵌套和同一样本的使用而相互关联,从而违反独立假设,威胁元分析的有效性[42].在先前关于体罚和个体结果的元分析中提出的一种解决方案是为每个样本选择一个效应量或平均各个效应量[9,46].然而,这种做法会导致信息丢失,从而降低统计效力,并可能掩盖评估估计效应量的敏感性或稳健性的重要变异性。
我们将遵循当前的最佳实践建议[42,43]来处理多效应量和非独立性,并将采用多层随机效应模型来分析数据。多水平随机效应模型将允许我们包括所有相关的效应大小,并模拟同一样本或研究中效应之间的依赖性[43].我们将采用随机效应,而不是固定效应模型,假设观察到的效应量的研究之间的差异可能是由于“真实”差异和测量误差(而不是完全测量误差)[48].随机效应元分析将允许我们估计平均效应量,以及围绕该估计的95% CI和异质性测量(我2)来评估不同研究之间效应大小的差异程度。
适度分析主要取决于最终的研究样本,以及研究样本在多大程度上提供了足够的统计能力来进行此类分析。鉴于此前没有关于体罚与中低收入国家儿童、青少年和成人结果的系统综述,我们无法对可能确定的研究数量进行先验估计。无论如何,我们希望根据上面所列的第三个研究问题所列出的特征进行一些亚组分析。我们将通过适度分析评估偏倚风险和证据质量,以评估体罚和个体结果之间的联系是否适用于不同的方法方法。
传播计划
我们将把研究结果提交给同行评议的期刊发表。我们希望在博客、会议和其他渠道上传播审查的结果。