跳到主要内容

贝叶斯基因组预测方法在全基因组关联分析中的应用

摘要

背景

开发了贝叶斯基因组预测方法,使所有基因分型标记同时适合一组可用的表型,用于预测数量性状的育种值,考虑到性状遗传结构(标记效应分布)的差异。这些方法也为全基因组关联(GWA)研究提供了一个灵活可靠的框架。本文的目的是回顾用于GWA分析的贝叶斯分层和变量选择模型的发展。

结果

通过同时拟合所有基因分型标记,贝叶斯GWA方法隐含地考虑了群体结构和经典单标记GWA的多重测试问题。使用马尔可夫链蒙特卡罗方法实现的贝叶斯GWA方法允许使用从后验分布获得的概率控制错误率。使用贝叶斯方法的GWA研究的力量可以通过使用基于先前关联研究、基因表达分析或功能注释信息的信息先验来增强。应用于多个性状,贝叶斯GWA分析可以通过多性状、结构方程或图形模型来洞察多效效应。贝叶斯方法也可用于组合基因组、转录组、蛋白质组和其他组学数据,以推断基因型与表型之间的因果关系,并建议可以提高性能的外部干预。

结论

贝叶斯分层和变量选择方法为基因组预测、GWA、先验信息整合以及来自其他组学平台的信息整合提供了统一而强大的框架,以确定复杂数量性状的因果突变。

背景

数量性状的全基因组关联(GWA)研究的目标是确定解释性状遗传变异的相当大比例的基因组区域,最终目标是确定性状遗传基础下的因果突变。标准的GWA方法是对一个群体进行基因分型,该群体已对感兴趣的性状进行表型分型,并对整个基因组中的许多遗传标记进行基因分型,并通过对每个SNP使用回归型分析来估计和测试标记基因型对表型的影响,从而分析这些数据,一次一个[12].基因分型技术的蓬勃发展,增加了每个个体可以查询的基因组位置的数量,从几十或数百个限制性片段长度多态性或微卫星到数万或数百万个单核苷酸多态性(SNPs),然而,这给经典的GWA带来了一些挑战。这些问题包括p > > n问题(要测试的标记效应比现有的表型观察要多得多)和由于种群结构造成的假阳性。为了克服后者,标准的GWA方法一直是在一个表型模型中,一次在每个SNP上匹配基因型,该模型也适合种群结构的影响,要么作为整个基因组中所有基因型的主要组成部分,要么通过包含基于谱系或基因组关系的多基因效应,或者通过这些组合[3.4].然而,这种单SNP GWA方法仅检测在被分析人群中至少有一个SNP与因果SNP存在实质性连锁不平衡(LD)的数量性状位点(QTL)。此外,在能量有限的情况下,重要标记物的效果往往被高估,即所谓的Beavis效应或“赢家的诅咒”[56].随着大量snp的测试(最常见的是数万到数百万),控制假设测试的错误率对于避免过多的假阳性非常重要。经典的多重测试修正(如Bonferroni)没有考虑到基因型在LD中相互之间的依赖性,导致非常高的严格性和较低的实验功率。相反,费尔南多等人。7]提出了控制阳性结果中假阳性(PFP)的比例,这与试验次数或它们之间的相关性无关。这种方法类似于在许多其他多重测试情况下应用的错误发现率(FDR)方法[8].

其中一些问题可以通过使用贝叶斯多元回归方法来克服,该方法最初是为基因组预测而开发的[9].贝叶斯方法能够同时拟合所有基因分型标记的效应,适应标记效应的不同先验分布,变量选择以识别重要标记,并使用其他信息源,如其他组学数据或注释信息[1011].在此背景下,本文的目的是回顾贝叶斯GWA模型的发展,以提高序列数据信息的使用,并使用额外的组学数据来探索数量性状遗传变异的生物学过程。

基因组预测和GWA的贝叶斯字母表

利用遗传标记分析数量性状的贝叶斯多元回归方法最初由Meuwissen等人开发。[9]用于基于高密度标记基因型可用性的基因组预测,允许同时考虑所有基因型标记的影响。这些方法包括最佳线性无偏预测(BLUP)(后来被Kizilkaya等人称为Bayes-C0)。12]),其中单个正态先验用于标记(单倍型)效应的分布,Bayes-A,其中每个标记(单倍型)都有一个具有自己方差的正态先验,以及贝叶斯变量选择(BVS)模型Bayes-B,等效于Bayes-A,但具有预先指定的遗传标记(单倍型)的先验比例π,具有零效应。方法采用马尔可夫链蒙特卡罗(MCMC)抽样,使用标记(单倍型)效应的相应先验分布。Gianola等人[13]回顾了基因组预测的备选贝叶斯方法,并介绍了术语贝叶斯字母表,用于提议的贝叶斯基因组预测方法的集合。他们还表明,贝叶斯- a方法相当于使用单个t分布作为标记效应的先验。Fernando小组随后通过贡献Bayes-C BVS方法大大扩展了贝叶斯字母表[12],其中标记的非零效应从单个正态分布中采样,Bayes-C0为特例,假设所有snp都具有非零效应,相当于基因组(G)BLUP。他们还介绍了贝叶斯- c π和贝叶斯- b π方法[14],其中零效应标记的比例不是预先指定的,而是从数据中估计的。

在引入贝叶斯字母表方法用于基因组预测之后,贝叶斯字母表方法,特别是BVS方法,如贝叶斯- b,很快就被用于GWA,以区分与表型相关的snp或snp窗口,与那些仅捕获谱系关系或噪声的snp或snp窗口。费尔南多和加里克[11]提供了贝叶斯字母表方法应用于GWA的早期评论之一。与单snp GWA方法相比,贝叶斯GWA方法基于指定的标记效应先验分布同时考虑所有snp的影响。然而,这也意味着来自一个致病位点的信号可以被一组与致病位点在LD中的snp联合捕获,无论是单独还是组合,即作为一种双倍型。这与单SNP GWA方法形成对比,在单SNP GWA方法中,一次只询问一个SNP的影响。Sahana等人[15]表明,如果基因型数据中不包括因果位点的基因型,这是使用SNP面板进行基因分型时的典型情况,那么围绕致病位点的SNP窗口比单个SNP更好地捕获关联信号。BVS GWA方法被证明可以准确识别模拟数据中的关联信号[16]并随后在GWA中用于牲畜物种的许多性状。在奶牛中,Kemper等人[17]表明贝叶斯多元回归方法Bayes-R [18],拟合正态分布的混合作为优先标记效应,比标准单snp GWA更精确地映射QTL。Chen等人也得到了类似的结果。[19],他们发现贝叶斯多元回归方法在模拟数据中的QTL检测中比单snp GWA具有更高的准确性(基于接受者操作曲线下的面积)。

Fernando和Garrick在Gensel软件中实现了使用贝叶斯字母表方法的基因组预测和GWA方法[20.],以及在R语言的BGLR包中[21]等。Cheng等人的Fernando组提高了基于MCMC的Bayes-B方法的GWA计算效率。[22],从而改进了JWAS软件中几种用于GWA的贝叶斯字母表方法的实现[23].莫泽等人[10]开发了实现贝叶斯r方法的软件,并将其推广到人类GWA应用程序中。

对于基因组预测和GWA的贝叶斯字母表方法的实现,一个值得关注的问题是所采用的MCMC方法的计算需求。为了克服这一问题,Meuwissen等人开发了一种基于期望最大化(EM)算法的贝叶斯- b基因组预测快速非mcmc方法。[24].该方法还提供了SNP效应的估计值,类似于Bayes-B获得的结果。在相关工作中,Stranden和Garrick [25]表明SNP效应的估计值可以使用基因组预测的标准动物模型GBLUP方法通过从基因组估计育种值(GEBV)反求得到,并且所得的SNP效应估计值与Bayes-C0方法所得的估计值相当。这使得基于这种先验的GWA可以使用标准动物模型GBLUP方法和软件来实现,即用基因组关系矩阵取代基于谱系的关系矩阵。Fernando小组随后扩展了动物模型GBLUP方法,用于基因组预测和GWA,方法是在构建基因组关系矩阵时,根据snp的影响估计对其进行加权,如Sun等人所述。[26].这种所谓的fast-Bayes-A方法是使用期望最大化(EM)算法以迭代方式实现的[26].Fast-Bayes-A的估计结果与Bayes-A方法的最大似然等价,即提供了模态估计,而不是后验分布的均值,但使用t分布作为SNP效应的先验,如Bayes-A [13].Wang等人进一步改进了EM方法,以适应类似于贝叶斯字母表的不同先验分布。[27]以及陈和坦普尔曼[28].王等。[29]开发了一种基于EM算法和MCMC相结合的高效Bayes-R方法。

Gianola [30.]指出,使用贝叶斯字母表方法进行GWA的一个问题是,结果可能严重依赖于所使用的先验。据此,Wang等在肉鸡体重分析的基础上[31]得出结论,与假设正态分布作为SNP效应先验的GBLUP方法相比,Bayes-B方法过度地将大多数基因组区域的影响缩小到零,从而高估了其他区域的影响。然而,Wolc等人[32]发现Bayes-B方法比GBLUP方法更能检测和量化大QTL对蛋鸡蛋重的影响。他们还表明,基于Bayes-B的卵子重量基因组预测的准确性比基于GBLUP的准确性更高,更持久,这表明用Bayes-B获得的SNP效应的估计更准确。最后,哪个先验最适合GWA可能取决于性状的遗传结构,即先验与SNP效应的真实分布的拟合程度。由于关于遗传结构的信息通常是有限的,因此谨慎的做法是对所分析的每个性状使用不同的先验来实现GWA,并比较结果,或者是拟合混合模型,如贝叶斯- r,它允许从数据中估计SNP效应的先验正态分布的混合比例[10].

针对GWA的贝叶斯多元回归方法的一个重要优势是,它们通过同时拟合所有标记来隐式地解释种群结构。同样,在单snp GWA方法中,基于基因组关系拟合多基因效应已被证明可以解释种群结构并避免假阳性[33].Kärkkäinen及Sillanpää [34]的研究人员发现,拟合一个额外的多基因效应对他们使用的贝叶斯LASSO方法的性能影响有限,这表明同时拟合所有标记充分解释了贝叶斯多元回归方法中的群体结构。对于混合或多品种种群,通常提倡拟合混合比例或品种组成,以进一步减少种群结构的假阳性[3.].Toosi等人对明确解释GWA中掺合物或品种组成的方法进行了综述。[35].然而,他们认为,GWA不应该通过拟合这些种群结构效应来明确地消除杂交或品种组成的影响,而是应该利用包含在品种差异中的QTL信息,并表明这可以通过使用BVS方法来实现。具体来说,他们发现没有显式拟合品种组成的BVS GWA比具有品种组成影响的单snp GWA具有更高的QTL检测能力,而不会增加假阳性率。这确实假设了表型的品种差异完全是遗传的,即由于QTL频率的差异,而不是部分与环境因素混杂的结果。

序列数据的可用性是最终的p > > n情况,在通常相对较少的测序个体上询问所有可能的基因组位置,尽管如果有适当的测序参考群体可用,可以通过将snp基因型个体输入序列来增加这一点。然而,由于种群中LD结构的不同,序列数据不一定能提高作图精度,特别是当GWA基于单snp方法或GBLUP方法时[36].然而,来自人类GWA研究的证据表明,允许对snp进行变量选择或差异加权的多标记方法会导致顶级结果中因果变量的丰富[,这些研究包括的不相关样本数量大于大多数牲畜种群的可用样本数量]。2].

使用基因型和非基因型动物的数据进行GWA

虽然越来越多的动物在不同牲畜品种的育种项目中被基因分型,但仍有许多贡献表型数据的动物没有基因分型。对于基因组预测,最初使用两步方法将来自未基因分型动物的信息纳入,该方法将使用基因组数据获得的EBV与使用基于谱系的BLUP选择指数方法获得的EBV结合起来[37].其他研究表明,来自未基因分型亲缘的数据可以作为基因分型动物的伪表型纳入基因组预测或GWA,例如,作为基于谱系的子代产量偏差[38],即解除管制的基于谱系的EBV [39],或作为family的意思[40],在残差项上加上适当的权重,以适应每个伪表型的准确性。Misztal等人[41]显示了非基因分型个体的表型如何可以基于谱系关系在所谓的单步GBLUP (ssGBLUP)方法中被纳入,这提高了基因组预测的准确性。ssGBLUP的计算方法随后被一种更直接的方法提出,以获得一个结合了基因组和基于谱系的关系矩阵(所谓的H矩阵)[42]以及Christensen和Lund [43].

王等。[27]使用ssGBLUP框架进行GWA,使用不同的迭代SNP加权方法来计算基因组关系,这是Sun等人最初提出的。[26为GBLUP。利用模拟数据,Wang等[27]表明,与仅基于基因分型动物的GBLUP相比,合并未基因分型动物的表型不仅提高了基因组预测的准确性,而且还提高了检测QTL的能力。随后,Zhang等对ssGBLUP的加权方法进行了进一步优化。[44],他发现迭代推导相邻SNP窗口的权重,而不是每个SNP的单独权重,可以产生更清晰的QTL信号,这与仅分析基因分型动物时使用BVS方法获得的结果相似。

费尔南多等人。[4546]扩展了贝叶斯字母表方法,以整合未基因分型动物的表型,用于基因组预测和GWA。在他们的方法中,使用基于谱系的回归方法对未基因分型个体的基因型进行归一化,而归一化误差则直接建模以解释不确定性[47].这些方法已经在JWAS软件中实现了[23]使用复杂模型实现单步贝叶斯基因组预测和GWA,最大限度地利用基因组、谱系和表型信息。在对真实数据的应用中,在JWAS中实施单步Bayes-B方法,与仅使用基因分型动物数据的Bayes-B方法相比,可以识别更多与鳟鱼传染性造血坏死病毒抗性相关的基因组区域[48].单步Bayes-B检测到的QTL数量与Wang等人的加权ssGBLUP GWA方法相似[27],但两种方法之间只有不到三分之一的QTL重叠,这强调了先验对结果的潜在影响。

宣布贝叶斯多元回归GWA的QTL证据

在单SNP混合线性模型GWA方法中,每个SNP一次拟合为一个固定效应,以及基于谱系或基因组关系矩阵的多基因效应,显著性检验通常使用混合线性模型中固定效应的标准检验,基于其估计值除以其标准误差。然而,Gianola等人。49]指出,将一个SNP同时作为固定效应和随机效应(作为基因组关系矩阵的一部分)进行拟合,会导致估计的协方差结构非常复杂,这对单SNP GWA的显著性检验有影响,除非被视为固定效应的SNP与所有其他被视为随机的SNP处于完全的连锁平衡。Duarte等人[50]表明,拟合基因组关系矩阵以解释种群结构的线性混合模型的单snp GWA检验统计量与从GBLUP的反解估计中获得的结果有效等效,如下[25],除以其预测误差方差的平方根,可由混合模型方程求逆得到。这允许基于单个GBLUP分析进行GWA,而不是对每个SNP进行单独分析,类似于使用贝叶斯多元回归方法时从一次运行中获得所有GWA结果。卢等人。[51]和Aguilar等人[52]表明同样适用于ssGBLUP。然而,这并不能避免与单snp GWA相关的多次测试问题。

对于贝叶斯多元回归GWA方法,已经开发了几种方法来确定哪些snp或snp窗口可以被认为是解释遗传方差的实质性或显著比例。因为在这些方法中,所有SNPs都是同时拟合的,所以这些方法必须考虑SNPs的组或窗口,而不是单个SNPs,因为一个致病突变的影响可能分布在多个SNPs上。最初的研究使用了由窗口或SNP群解释的人群中个体GEBV方差的比例,即窗口GEBV的个体间方差(为每个个体和窗口计算为后均值与每个SNP的基因型的乘积的窗口内SNP的总和)除以这些相同个体的全基因组GEBV方差[53].Onteru等人[54]和范等人。[55]使用自举方法推导出这些比例的显著性阈值。然而,这要求每个自举样本都有一个GWA,这在计算上是非常苛刻的。因此,这种方法没有得到广泛应用。

在贝叶斯多元回归GWA中识别关联信号的另一种标准是估计由一组或窗口snp解释的遗传方差的比例。而不是GEBV的方差之比,如Boddicker等。[54],该标准是窗口真育种值方差估计值与全基因组真育种值方差的比值。该标准首先由Wolc等人实现。[40]通过使用磨合后的概念,在MCMC的给定迭代中的SNP效应是从SNP效应的后验分布中采样。因此,可以根据采样SNP效应为每个个体计算的(窗口)育种值是从这些育种值的后验分布中提取的,这些育种值在个体之间的方差也是如此。与Onteru等人的方法相反。54],此方法不需要引导,而是作为原始数据的GWA的MCMC的一部分实现。这些概念在Gensel 4.0中实现。56],提供了全基因组非重叠1 mb窗口育种值方差的后验分布和均值,以及MCMC每次迭代的全基因组育种值和这些方差的比值。然而,de los Campos等人[57]指出,当因果位点没有基因分型时,多标记回归模型对遗传方差的推断存在几个问题,包括似然函数的不规范,以及估计的一致性和偏差的缺乏。

遗传方差的后验分布由[中描述的方法的窗口解释40]还可以计算一个窗口或一组snp解释非零遗传方差或在多基因模型下比预期的遗传方差更多的后视概率,即遗传方差在整个基因组中均匀分布。这些后验概率的使用是否会导致在特定频率论假设下对假阳性和假阴性的适当控制,这些假设与由窗口或snp组解释的遗传方差有关,据我们所知尚未进行调查。

对于BVS方法,老化后的MCMC样本也可以用于计算特定SNP被包含在模型中具有非零效应的样本的比例,这被称为该SNP的后验关联概率(PPA)。同样,可以计算一个窗口中至少有一个SNP的样本在模型中所占的比例,这被Fernando等人称为窗口后验关联概率(window posterior probability of association, WPPA)。[58].WPPA最初是由Sahana等人作为显著性标准引入的。[15].通过模拟,Fernando等人[58]显示了WPPA在控制后验I型错误率的情况下识别关联信号的价值。他们还展示了贝叶斯多元回归方法如何减少信号依赖问题,信号依赖是指距离QTL有一定距离的snp,并表现出GWA信号,Chen和Storey将其确定为连锁分析的一个问题[59].费尔南多等人。[58],然而,同时拟合该区域的所有snp会导致关联信号集中到QTL周围的一个小区域,特别是基于LD时。60], WPPA对低基因和多基因结构性状的QTL检测能力均优于其他方法。然而,在Fernando小组的后续工作中,Li等人。61他们观察到,当snp在基因组中的分布不均匀时,WPPA可能会导致虚假的关联。为了解决这个问题,他们提出了两种易于实现的方法,效果很好,即将基因组划分为具有固定数量SNP的窗口,或根据SNP密度调整WPPA。在相关工作中,Legarra等人[62]开发了一种使用贝叶斯因子评估基因组窗口的方法,但没有完全证明该方法的显著性阈值。

贝叶斯GWA模型检测多效QTL

除了分析个体性状外,人们还对了解性状之间的遗传相关性感兴趣,特别是对打破不利遗传相关性的基因组区域感兴趣。许多研究试图通过比较单性状GWA的结果来识别多效QTL区域,即通过识别解释性状间大量遗传方差的窗口之间的重叠[63].然而,这受到GWA通常有限的作用的阻碍,这导致了许多假阴性,因此,两个实际上可能具有高度遗传相关性的特征的重要窗口之间的重叠有限。在一个更直接的方法中,Gorbach [64]利用两个性状单变量基因组预测分析中个体窗口GEBV的相关性和协方差来识别多效区。应用于猪的生长速度和采食量,他们确定了这两个性状的窗口GEBV之间的相关性与这两个性状之间预期的不期望的正遗传相关性(即隐多效区)相反的几个区域。使用类似的方法,Bolormaa等人。[65]用两个性状的窗口GEBV之间的协方差除以每个性状的表型标准偏差的乘积。这种标准优于Gorbach[]使用的窗口GEBV之间的相关性[64因为后者对于解释一种或两种性状的遗传差异很小的窗口可能很高,因此对性状之间的全基因组遗传相关性贡献很小。一般来说,这些窗口GEBV方法的一个问题是,育种值的预测受到遗传和随机环境效应的影响(它们是表型的线性函数),因此,它们的相关性和协方差不是遗传相关性或协方差的正确估计。在第二种方法中,Bolormaa等人[65]从每个单性状BVS分析中计算出一个SNP与任何性状没有关联的概率,作为该SNP的(1-PPA)的乘积。请注意,这种方法可以通过使用WPPA而不是PPA扩展到识别多效性基因组窗口。Bolormaa等人使用的两种方法[65]用于检测多效性snp或区域,即基于窗口GEBV的协方差和基于(1-PPA)的乘积,检测到相似的多效性基因组区域和snp,但这些区域与Bolormaa等人使用的另一种方法不同。[66]基于单snp GWA单性状结果的多性状分析。然而,这些比较是基于一些任意的显著性阈值,可能无法控制相同的错误率。

在一种更为正式的方式中,Jia和Jannink [67]通过指定标记效应的多变量先验分布,将单性状贝叶斯多元回归模型扩展到多性状分析。虽然他们的研究重点是提高基因组预测的准确性,但这些相同的模型也可以用于识别和估计多效QTL的影响,特别是在使用BVS方法时。而在使用BVS时,Jia和Jannink [67通过允许snp只对全部或全部性状产生非零影响来限制变量选择。Calus和Veerkamp也使用了类似的方法[68].Cheng等人使用了一个更灵活的模型,其中任何SNP都可以对任何性状组合产生影响。69]并已在JWAS软件中实现[23].

在[的多特征贝叶斯GWA方法中676869],用于SNP效应的多变量先验分布假设所有SNP的相关性相同。为了避免这种先验对GWA结果的潜在影响,Kemper等人[70]开发并实现了一种名为Bayes-MV的多特征贝叶斯多元回归方法,该方法混合了Bayes-R之后SNP效应的先验分布。假设这些分布在性状之间是独立的,但特定的SNPs先验比例对任何性状都没有影响。影响的显著性是基于SNP对任何性状具有非零影响的平均后验概率,但这一标准可以扩展到SNP的窗口,如Fernando等人。[58].利用模拟数据,Kemper等人[70]表明,Bayes-MV方法比等效的单性状方法(即Bayes-R)检测到更多的真实QTL。

综上所述,贝叶斯多元回归方法为检测多效性QTL提供了一种灵活的方法。然而,先验假设对跨性状SNP效应的影响需要进一步研究。此外,所有试图使用基因型-表型关联来检测多效QTL的方法的一个重要限制是,它们不能区分一个多效QTL与两个紧密相连的单性状QTL的存在,这取决于该区域LD的程度。此外,类似于de los Campos等人提出的基于多标记回归模型的遗传方差推断问题。[57], Gianola等人证明,如果由于标记与QTL之间以及QTL之间的不完全LD而导致因果位点无法进行基因分型,那么基于多标记回归模型的遗传协方差和相关性估计可能会错误地反映真实的遗传参数。[71].

多效QTL的鉴定对于理解性状背后的生物学意义非常重要,多性状GWA方法有望提高QTL的检测能力,提高基因组预测的准确性。然而,目前尚不清楚多效QTL是否应该在多性状育种计划中受到特别关注,而不仅仅是在基于GEBV的标准总优选标准中受到重视。

GWA采用贝叶斯结构方程模型

结构方程模型(SEM)旨在超越相关性,对变量之间的因果关系进行推论,这是Wright [72]基于路径分析。Gianola和Sorensen提出了SEM对定量遗传学和混合模型的适应性[73,包括推断性状之间因果关系的方法。扫描电镜在动物育种中性状间关系分析中的应用综述在Inoue [74].瓦伦蒂等人[75]澄清说,尽管SEM允许研究表型性状之间的因果关系,但对于标准的多性状选择目的,它们没有提供比多性状模型的优势。这是因为遗传相关性(主要)是由多效性QTL引起的,而多效性没有因果方向,即一个QTL可以通过直接影响两个性状或通过直接影响一个性状而通过第一个性状的因果影响间接影响另一个性状而对两个性状具有多效性(假设两个性状之间存在因果联系)。因此,对性状1的选择有望通过改变多效QTL上的等位基因频率导致性状2的相关响应,而不管其与两个性状的表型之间的因果关系。然而,瓦伦特等人。75]描述了一些从扫描电镜获得的额外信息是有益的场景,包括在基因型与环境相互作用的情况下,在新的(未观察到的)环境条件下,可以更准确地估计育种值。

李等人。[76将扫描电镜应用于QTL定位,区分QTL对性状的直接和间接影响。他们根据QTL的直接作用将两性状场景下的QTL分为三组:(i)仅直接影响性状1的QTL;(ii)直接影响性状2的QTL;(iii)直接影响这两个性状的QTL。请注意,仅直接影响性状1(2)的QTL可以通过性状1(2)对性状2(1)的表型的因果效应对性状2(1)产生间接影响。此外,直接影响两个性状的QTL可以通过两种途径对一个性状产生影响,即直接影响和通过另一个性状产生间接影响。因此,与模拟QTL或标记的整体效应(直接加间接)的多性状模型相比,SEM区分了QTL或标记的直接效应和间接效应。

莫门等人[77]将SEM-QTL模型应用于单SNP SEM-GWA的数量性状,该模型基于单一SNP固定效应的混合线性模型(即类似于单个性状的单SNP GWA),并应用于SNP对肉鸡性状的直接和间接影响的估计。王等。[78]实现了多标记SEM- gwa BVS模型,引入SEM贝叶斯字母表。他们表明SEM-GWA BVS模型在检测QTL方面与多性状BVS具有相似或更强的能力,但通过直接和间接效应,可以更好地了解QTL对性状影响的生物学机制。这些方法最近被Pegolo等人应用于奶牛乳蛋白的结构基因组关系和QTL分析。[79].贝叶斯多snp SEM-GWA也已由Briollais等人使用贝叶斯图形模型在人类遗传学中实现。[80]以及Zhang等人使用贝叶斯网络分析进行元分析。[81].

使用功能信息进行(后)GWA分析

鉴于GWA研究的统计能力和制图精度通常有限,对GWA结果的解释需要大量的GWA后分析。这些可以基于来自其他组学数据的证据,先前QTL或GWA研究的结果,以及关于位于已识别基因组区域的基因的功能生物学信息,如Uffelmann等人所述。[2].Ramanan等人。[82]提出,要进一步深入了解GWA结果和不同生物途径的重要性,一种方法是联合评估属于同一生物途径一部分的标记物或基因组之间的关联证据。一种策略是使用富集分析来确定顶部GWA区域是否富集了具有某些生物学特征的基因,例如生物途径的成员资格或具有某些基因本体(GO)术语。这需要为富集分析中包含的区域设置显著性阈值,这可能对结果产生很大影响。如Subramanian等人所提出的,另一种替代方法是将所有GWA结果用于排序基因集富集分析。[83并在他们的GSEA软件中实现。这需要将GWA结果分配到基因组中的每个基因。对于单snp GWA,这可以基于一个基因内或周围所有snp的平均对数(p值)。对于贝叶斯多元回归GWA,一个可能的等级标准是由每个基因组窗口解释的遗传方差的百分比。然而,这将导致将相同的值分配给位于一个窗口的所有基因,这将导致分析中的问题。Delpuech提出了一种替代方法[84],并受雇于Cheng等人。[85就是根据窗口中存在的基因特征,为窗口赋予生物特征。

功能生物学信息也可以集成到GWA分析中,而不是用于后GWA分析。一种策略是Edwards等人采用的特征GBLUP方法。[86].在这种方法中,基于基因组特征对snp进行分类,在混合线性GBLUP模型中,使用由该类snp的基因型派生的基因组关系矩阵,为每一类snp拟合一个单独的随机遗传效应。对每个特征类的方差分量进行估计,然后允许将不同的权重分配给不同类别的snp。在处理SNP基因型或序列数据时,可以根据基因组注释、候选基因列表或已知的因果变异来分配特征类[87].

另一种方法是在Kemper等人的Bayes-R方法中纳入先前的生物学信息。[17],如MacLeod等人提出的。[87].在他们的Bayes-RC方法中,不同Bayes-R方差的正态先验分布的混合与分析的snp或变体的特征分类交叉分类。这种方法允许模型估计每个特征类的每种贝叶斯- r方差大小分布的混合。Bayes-RC方法在模拟和真实奶牛产奶表型数据的QTL发现能力和精度方面优于Bayes-R方法[87].向等。[88]使用贝叶斯- rc方法,利用大量奶牛的全基因组序列数据,结合基于功能信息的序列变异分类,成功地对种群中多个性状的潜在致病变异进行了优先级排序。

结合多组学数据,使用贝叶斯多元回归方法进行预测和精细映射

根据Uffelmann等人的评论,可以使用其他组学数据、来自其他GWA的元数据和功能信息,在GWA结果的逐步后解释中,结合多个组学数据来实现改进的表型预测和因果位点的精细映射。[2].或者,其他组学数据可以直接集成到GWA中。黄等人。[89]提供了在精准医学背景下整合多组学数据进行表型预测的方法的最新综述。在这种情况下,贝叶斯方法可以提供一个非常灵活的结构,可用于单独或同时从多组学数据中提取信息。例如,Wang等。[90]开发了一个分层BVS模型,以整合来自不同组学平台的信息,以识别与表型结果相关的基因或生物标志物。方等人。[91]扩展了这种方法,以考虑到大量缺失的数据,因为不同的组学数据通常可用于基本上不重叠的个人群体。向等。[92]利用功能注释和进化保护的信息来提高牛生产性状的测绘精度。Maity等人[93]使用贝叶斯扫描电镜来整合来自拷贝数变异和基因表达的信息,通过指定和预测拷贝数和基因表达数据基础上的一些潜在变量来预测癌症患者的生存。贝叶斯优先排序模型可用于缩小从转录组全关联(TWA)研究到包含具有预定义概率的因果位点的基因集的命中范围[94],并同时使用顺式和反式表达QTL (eQTL)的信息[95].贝叶斯稀疏线性混合模型[96]将一个基因附近的所有snp纳入一个具有两种分布的模型,从而允许对基因表达产生更大的多基因效应。基于BSLMM, Wheeler等人[97)发现独联体基因表达调控以寡原性为主。

蛋白质组是基因型和表型之间因果关系的另一层信息。98],除了解释GWA和TWA结果外,还可以为未来的功能研究和药物靶点提供靶点[99].全蛋白质组关联研究聚集了共同影响蛋白质编码基因的所有变异的信号,并评估它们对蛋白质功能和感兴趣的表型的总体影响[One hundred.].

Flutre等人。[101]介绍了一个跨组织贝叶斯模型,该模型允许在不同组织之间共享一定比例的eQTL,计算个体内部组织之间的相关性。跨组织分析有助于部分克服不同组织表达数据可用性的限制问题,这影响了大多数研究,因为生成全基因组基因表达数据的成本仍然相对较高。以类似的方式,但使用蛋白质组学数据,一种名为LOCUS [102]在全基因组范围内利用相关蛋白质水平和DNA标记的力量来有效地提高统计能力。

缺失数据的另一种解决方案是使用综合技术,利用跨数据集的相关性和共享信息来补充缺失的记录[103104].综合风险基因选择器[105是一个贝叶斯框架,它集成了多组学数据和基因网络,以推断已识别的GWA信号的风险基因。共定位的贝叶斯检验[106]整合GWA结果与eQTL、甲基组学或其他组学数据,以提供对特定环境基因调控的见解[107].蛋白质水平和与疾病风险等位基因共定位的DNA序列变异之间的关联可以提示疾病相关途径,揭示新的药物靶点和翻译生物标志物。

Hajiramezanali等人。[108]提出了一种称为贝叶斯关系学习(BayReL)的图形结构数据集成方法,用于多组学数据的整合分析,并将其应用于探索囊性纤维化中的微生物组-代谢组相互作用。他们还应用该方法通过整合基因表达谱和肿瘤样本对化疗药物的体外敏感性来鉴定乳腺癌中的miRNA-mRNA相互作用。朱等。[109]提出了另一种名为MRLocus的定向算法,以研究基因表达或个体调控元件的扰动如何影响下游表型。

挑战

虽然BVS方法在不断改进,但它们仍然需要计算,这在具有数百万个snp的数万或数十万个体的序列数据的可用性不断增加的时代成为一个挑战。改进的吉布斯采样器和非mcmc算法有望减轻部分计算负担。范德伯格等人。[110]提出了减少BVS方法的计算量,同时保持标记效应估计的准确性,将序列数据按染色体分割,删除影响较小的变体。另一种减少变异数量的策略是使用单snp GWA预选变异或通知先验,但理想情况下,这应该在单独的数据集上完成,在大多数情况下,这是不可用的。另一种可能是使用LD修剪数据进行分析,然后仅在有关联证据的区域进行完全标记饱和。强LD也会限制识别因果突变的能力,即使所有标记都可以同时拟合。今天,这主要是通过收集大量样本来解决的,希望找到足够多的具有交叉的个体来打破LD,从而缩小候选区域。增加对基因表达、调控和相互作用的理解将有助于为贝叶斯多元回归GWA方法开发更好的先验,这可以帮助缩小候选区域。最终,需要功能基因组学和基因编辑方法来验证假定的因果QTL。

结论

除了基因组预测,贝叶斯多标记回归方法还为GWA研究提供了一个灵活可靠的框架,并为整合多个功能和基因组信息来源(多组学数据)提供了一个深入了解复杂性状的遗传结构的框架。然而,有必要进一步开发不太依赖先验选择或包含更合适先验的方法,以及整合多组学、功能和生物学信息的方法。

数据和材料的可用性

不适用。

参考文献

  1. 李志刚,李志刚。人类复杂疾病基因研究的未来。科学。1996;273:1516-7。

    文章中科院PubMed谷歌学者

  2. 神经精神病学多基因信号生物学审讯的新方法和资源。《生物精神病学》2021;89:41-53。

    文章中科院PubMed谷歌学者

  3. 俞杰,Pressoir G, Briggs WH, Vroh Bi I, Yamasaki M, Doebley JF,等。一种用于关联映射的统一混合模型方法,该方法考虑了多个级别的相关性。Nat Genet, 2006; 38:203-8。

    文章中科院PubMed谷歌学者

  4. 杨军,王晓明,王晓明,杨军。混合模型关联方法的研究进展。Nat Genet, 2014; 46:100-6。

    文章PubMed公共医学中心中科院谷歌学者

  5. 导演WD。QTL分析:功率、精密度和准确度。入:帕特森·哈,编辑。复杂性状的分子解剖。纽约:CRC出版社;1998.p . 145 - 62。

    谷歌学者

  6. 徐松。比维斯效应的理论基础。遗传学。2003;165:2259 - 68。

    文章PubMed公共医学中心谷歌学者

  7. Fernando RL, Nettleton D, Southey BR, Dekkers JC, Rothschild MF, Soller M.多重依赖试验假阳性比例的控制。遗传学。2004;166:611-9。

    文章中科院PubMed公共医学中心谷歌学者

  8. Benjamini Y, Hochberg Y.控制错误发现率:一种实用而强大的多重测试方法。中国科学院学报(自然科学版);2001;

    谷歌学者

  9. 莫维森TH,海耶斯BJ,戈达德ME。利用全基因组密集标记图预测总遗传价值。遗传学。2001;157:1819-29。

    文章中科院PubMed公共医学中心谷歌学者

  10. Moser G, Lee SH, Hayes BJ, Goddard ME, Wray NR, Visscher PM。利用贝叶斯混合模型同时发现、估计和预测复杂性状的分析。PLoS Genet, 2015;11: e1004969。

    文章PubMed公共医学中心中科院谷歌学者

  11. Fernando RL, Garrick D.贝叶斯方法在GWAS中的应用。方法Mol生物学,2013;1019:237-74。

    文章PubMed谷歌学者

  12. Kizilkaya K, Fernando RL, Garrick DJ。利用观察到的5万个单核苷酸多态性基因型,模拟多品种和纯种性能的基因组预测。中国动物科学,2010;

    文章中科院PubMed谷歌学者

  13. Gianola D, de los Campos G, Hill WG, Manfredi E, Fernando R.相加遗传变异和贝叶斯字母表。遗传学。2009;183:347 - 63。

    文章PubMed公共医学中心谷歌学者

  14. Habier D, Fernando RL, Kizilkaya K, Garrick DJ。基因组选择贝叶斯字母表的扩展。生物信息学杂志,2011;12:186。

    文章PubMed公共医学中心谷歌学者

  15. 王志刚,王志强,王志强,等。复杂亲本群体关联作图方法的比较。热内流行病学,2010;34:455-62。

    文章PubMed谷歌学者

  16. Sun X, Habier D, Fernando RL, Garrick DJ, Dekkers JC。利用贝叶斯方法对QTLMAS2010数据进行基因组育种价值预测和QTL定位。BMC Proc. 2011;5:S13。

    文章PubMed公共医学中心谷歌学者

  17. Kemper KE, Reich CM, Bowman PJ, Vander Jagt CJ, Chamberlain AJ, Mason BA,等。利用非线性贝叶斯方法在多品种群体中提高QTL定位的精度,从而提高了跨品种基因组预测的准确性。《中国日报》2015;47:29。

    文章PubMed公共医学中心中科院谷歌学者

  18. Erbe M, Hayes BJ, Matukumalli LK, Goswami S, Bowman PJ, Reich CM,等。利用高密度单核苷酸多态性面板提高奶牛品种内和品种间基因组预测的准确性。中国乳制品科学,2012;

    文章中科院PubMed谷歌学者

  19. 陈超,施泰贝尔JP,谭佩曼RJ。基于先前分布、基因组窗口和估计方法的广泛不同规范的全基因组关联分析。遗传学。2017;206:1791 - 806。

    文章PubMed公共医学中心谷歌学者

  20. Fernando RL, Garrick D. GenSel手册v3。艾姆斯:爱荷华州立大学;2009.

    谷歌学者

  21. Pérez P, de los Campos G.全基因组回归和预测与BGLR统计包。遗传学。2014;198:483 - 95。

    文章PubMed公共医学中心谷歌学者

  22. 程华,曲林,加瑞克,费尔南多。全基因组分析中贝esb的快速高效吉布斯采样器。《中国日报》2015;47:80。

    文章PubMed公共医学中心中科院谷歌学者

  23. 程H, Fernando R, Garrick D. JWAS: Julia实现全基因组分析软件。在2018年2月11-16日第十一届世界遗传学应用于畜牧业大会论文集上;奥克兰,2018。

  24. 默维森TH,索尔伯格TR,谢泼德R,伍利亚姆JA。一种BayesB类型的全基因组遗传价值估计预测的快速算法。《中国日报》,2009;41:2。

    文章PubMed公共医学中心中科院谷歌学者

  25. Strandén我,加里克DJ。技术说明:推导用于基因组预测和动物优点可靠性的等效计算算法。中国乳制品科学,2009;92:2971-5。

    文章PubMed中科院谷歌学者

  26. 孙X,曲L, Garrick DJ, Dekkers JC, Fernando RL。类贝叶斯预测基因组育种价值的快速EM算法。科学通报。2012;7:e49157。

    文章中科院PubMed公共医学中心谷歌学者

  27. 王华,米斯塔尔一世,阿吉拉尔一世,李加拉A, Muir WM。全基因组关联作图,包括来自无基因型亲属的表型。热内雷斯(Camb)。2012; 94:73 - 83。

    文章中科院谷歌学者

  28. 陈超,谭佩文。经验贝叶斯全基因组预测模型的综合方法。中国农业生物学报,2015;20:491-511。

    文章谷歌学者

  29. 王涛,陈亚平,鲍曼,麦伟德,海耶斯。一种混合期望最大化和MCMC采样算法来实现基于贝叶斯混合模型的基因组预测和QTL定位。BMC Genomics. 2016;17:744。

    文章PubMed公共医学中心谷歌学者

  30. Gianola D.全基因组回归中的先验:贝叶斯字母表回归。遗传学。2013;194:573 - 96。

    文章中科院PubMed公共医学中心谷歌学者

  31. 王h, Misztal I, Aguilar I, Legarra A, Fernando RL, Vitezica Z,等。全基因组关联作图,包括单步(ssGWAS)对肉鸡6周体重的非基因型亲缘的表型。Front Genet. 2014;5:134。

    PubMed公共医学中心谷歌学者

  32. 郭文杰,李志强,李志强,等。混合模型比GBLUP更好地检测大效应QTL,并产生更准确和持久的预测。中国畜牧科学。2016;7:7。

    文章PubMed公共医学中心中科院谷歌学者

  33. Kang HM, Zaitlen NA, Wade CM, Kirby A, Heckerman D, Daly MJ,等。模式生物关联作图中种群结构的有效控制。遗传学。2008;178:1709-23。

    文章PubMed公共医学中心谷歌学者

  34. Kärkkäinen惠普,Sillanpää MJ。贝叶斯多位点关联模型对隐相关性的鲁棒性。安·胡姆·热内。2012;76:510-23。

    文章PubMed谷歌学者

  35. 图西A,费尔南多RL,德克斯JCM。利用混合线性模型和贝叶斯多元回归分析进行混合群体数量性状位点的全基因组定位。《世界末日》2018;50:32。

    文章PubMed公共医学中心谷歌学者

  36. 李娟,王忠,李建军,王志强,李建军,等。利用低通测序和SNP芯片数据对白来亨蛋品质性状进行全基因组关联研究。动物品种种鸡。2022。https://doi.org/10.1111/jbg.12679

    文章PubMed谷歌学者

  37. VanRaden PM, Van Tassell CP, Wiggans GR, Sonstegard TS, Schnabel RD, Taylor JF,等。特邀回顾:北美荷斯坦牛基因组预测的可靠性。中国乳制品科学,2009;92:16-24。

    文章中科院PubMed谷歌学者

  38. VanRaden PM, Wiggans GR.国家动物模型信息的推导、计算和使用。中国乳制品科学,1991;74:2737-46。

    文章中科院PubMed谷歌学者

  39. 加里克DJ,泰勒JF,费尔南多RL。解除基因组回归分析的估计育种值和加权信息。《中国日报》2009;41:55。

    文章PubMed公共医学中心谷歌学者

  40. 李文杰,李志强,李志强,等。蛋鸡蛋重与蛋均匀度的全基因组关联分析及遗传结构。Anim Genet, 2012;43:S87-96。

    文章谷歌学者

  41. Misztal I, Legarra A, Aguilar I.遗传评价的计算程序,包括表型、完整谱系和基因组信息。中国乳制品科学,2009;

    文章中科院PubMed谷歌学者

  42. Legarra A, Aguilar I, Misztal I.包含完整谱系和基因组信息的关系矩阵。中国乳制品科学,2009;

    文章中科院PubMed谷歌学者

  43. Christensen OF, Lund MS.当一些动物没有基因分型时的基因组预测。《人类进化史》2010;42:2。

    文章PubMed公共医学中心谷歌学者

  44. 张X, Lourenco D, Aguilar I, Legarra A, Misztal I.单步基因组BLUP的加权策略:精确计算GEBV和GWAS的迭代方法。前热内。2016;7:151。

    PubMed公共医学中心谷歌学者

  45. 费尔南多RL,德克斯JC,加里克DJ。一类结合大量基因分型和非基因分型动物进行全基因组分析的贝叶斯方法。《世界末日》,2014;46:50。

    文章PubMed公共医学中心谷歌学者

  46. Fernando RL, Cheng H, Golden BL, Garrick DJ。具有大量基因型和非基因型动物的可选单步贝叶斯回归模型的计算策略。《中国日报》2016;48:96。

    文章PubMed公共医学中心谷歌学者

  47. 徐伟林,加里克DJ,费尔南多RL。选择群体单步基因组预测的准确性和偏倚。G3(贝塞斯达)。2017; 7:2685 - 94。

    文章PubMed公共医学中心谷歌学者

  48. 李志强,李志强,李志强,李志强,等。在商业虹鳟鱼繁殖种群中对传染性造血坏死病毒抗性的全基因组关联分析和基因组育种价值预测的准确性。《世界末日》2019;51:47。

    文章PubMed公共医学中心中科院谷歌学者

  49. 詹诺拉D,费尔南多RL,加里克DJ。BLUE在全基因组回归背景下具有一定的不变性。中国畜牧杂志,2019;136:113-7。

    文章PubMed公共医学中心谷歌学者

  50. Gualdrón Duarte JL, Cantet RJ, Bates RO, Ernst CW, Raney NE, Steibel JP。通过基因组评价的线性转换快速筛选表型-基因型关联。BMC生物信息学。2014;15:246。

    文章PubMed公共医学中心谷歌学者

  51. 卢毅,范德哈尔,史波洛克,魏格尔,阿门塔诺,康奈,等。基于多性状建模饲料效率方法的全基因组关联分析。中国乳制品科学,2018;101:3140-54。

    文章中科院PubMed谷歌学者

  52. Aguilar I, Legarra A, Cardoso F, Masuda Y, Lourenco D, Misztal I.大规模单步全基因组关联的频率p值,及其在美国安格斯牛出生体重中的应用。《世界末日》2019;51:28。

    文章PubMed公共医学中心中科院谷歌学者

  53. Boddicker N, Waide EH, Rowland RR, Lunney JK, Garrick DJ, Reecy JM,等。与宿主对猪繁殖与呼吸综合征病毒挑战反应相关的一个主要QTL的证据。中国动物科学,2012;30(4):344 - 344。

    文章中科院PubMed谷歌学者

  54. Onteru SK, Fan B, Nikkilä MT, Garrick DJ, Stalder KJ, Rothschild MF。猪终生繁殖性状的全基因组关联分析。中国动物科学,2011;29(3):349 - 349。

    文章中科院PubMed谷歌学者

  55. Fan B, Onteru SK, Du ZQ, Garrick DJ, Stalder KJ, Rothschild MF。全基因组关联研究确定猪体成分和结构健全性状的位点。科学通报。2011;6:e14726。

    文章中科院PubMed公共医学中心谷歌学者

  56. 加里克DJ,费尔南多RL。利用基因组预测方法进行QTL检测研究。方法Mol biology, 2013; 1019:275-98。

    文章中科院PubMed谷歌学者

  57. de Los CG, Sorensen D, Gianola D.基因组遗传:它是什么?PLoS Genet, 2015;11: e1005048。

    文章中科院谷歌学者

  58. 费南多,杜西A,杜克A,加瑞克D,戴克克斯J.全基因组预测方法在全基因组关联研究中的应用:贝叶斯方法。中国农业生物与环境杂志,2017;22:172-93。

    文章谷歌学者

  59. 陈琳,斯托瑞JD。放宽关联分析的显著性标准。遗传学。2006;173:2371 - 81。

    文章中科院PubMed公共医学中心谷歌学者

  60. Lima LP, Azevedo CF, Resende MDVD, Nascimento M, Fonseca e Silva F.利用模拟数据评估染色体区域基因组关联的贝叶斯方法。农业科学,2022;79:e20200202。

    文章中科院谷歌学者

  61. 李娟,王铮,Fernando R,程华。基于基因组窗口的关联检测在使用具有异质SNP密度的基因型面板时可能导致伪关联。《快乐人生》2021;53:45。

    文章PubMed公共医学中心中科院谷歌学者

  62. Legarra A, Ricard A, Varona L. GBLUP的GWAS:单标记和多标记EMMAX和Bayes因子,并以检测马步态主要基因为例。G3(贝塞斯达)。2018; 8:2301-8。

    文章中科院PubMed公共医学中心谷歌学者

  63. Saatchi M, Schnabel RD, Taylor JF, Garrick DJ。大效应多效或紧密联系的QTL在10个美国牛品种中分离。BMC Genomics. 2014;15:442。

    文章PubMed公共医学中心谷歌学者

  64. D.单核苷酸多态性的预测及其在作图性状和确定生产动物种群结构中的应用。博士论文,爱荷华州立大学;2011.

  65. 博洛玛a S, Swan AA, Brown DJ, Hatcher S, Moghaddar N, van der Werf JH,等。绵羊羊毛性状多性状QTL定位及基因组预测《白日焰火》2017;49:62。

    文章PubMed公共医学中心谷歌学者

  66. 张勇,张志强,张志强,张志强,等。一项多性状的元分析,用于检测肉牛身高、肥胖和繁殖的多效多态性。PLoS Genet, 2014;10: e1004198。

    文章PubMed公共医学中心中科院谷歌学者

  67. 贾勇,Jannink JL。多性状基因组选择方法提高了遗传价值预测的准确性。遗传学。2012;192:1513-22。

    文章PubMed公共医学中心谷歌学者

  68. Calus MP, Veerkamp RF。不同方法多性状基因组选择的准确性。《世界末日》2011;43:26。

    文章PubMed公共医学中心谷歌学者

  69. 郑海燕,王志强,王志强,王志强。基于多性状贝叶斯回归的基因组预测方法。遗传学。2018;209:89 - 103。

    文章PubMed公共医学中心谷歌学者

  70. Kemper KE, Bowman PJ, Hayes BJ, Visscher PM, Goddard ME。多性状贝叶斯方法定位QTL和基因组预测。《世界末日》2018;50:10。

    文章PubMed公共医学中心谷歌学者

  71. Gianola D, de los Campos G, Toro MA, Naya H, Schon CC, Sorensen D.分子标记能提示多向性吗?遗传学。2015;201:23-9。

    文章中科院PubMed公共医学中心谷歌学者

  72. 路径系数法。安数学统计,1934;5:161-215。

    文章谷歌学者

  73. 描述表型间同时和递归关系的定量遗传模型。遗传学。2004;167:1407-24。

    文章PubMed公共医学中心谷歌学者

  74. 贝叶斯因果推理和结构方程模型在动物育种中的应用。中国动物科学,2020;29(2):366 - 366。

    PubMed公共医学中心谷歌学者

  75. 瓦伦蒂·BD,罗莎·GJ, Gianola D,吴晓丽,Weigel K.结构方程模型是否有利于多性状的遗传改良?遗传学。2013;194:561 - 72。

    文章PubMed公共医学中心谷歌学者

  76. 李锐,蔡文文,肖克利,林世莲,魏格达尔,裴根,等。多数量性状的结构模型分析。PLoS Genet, 2006;2: e114。

    文章PubMed公共医学中心中科院谷歌学者

  77. 莫门M,阿亚图拉希·梅尔加迪A,阿米里·罗德巴M,克拉尼斯A,摩科里·平托R,瓦伦特BD,等。在使用混合效应结构方程模型的全基因组关联研究中包括表型因果网络。前热内。2018;9:455。

    文章PubMed公共医学中心谷歌学者

  78. 王志强,王志强,王志强。基于多性状贝叶斯变量选择回归的全基因组关联研究。G3(贝塞斯达)。2020; 10:4439-48。

    文章PubMed公共医学中心谷歌学者

  79. Pegolo S, Yu H, Morota G, Bisutti V, Rosa GJM, Bittante G,等。结构方程建模,以揭示奶牛乳蛋白的多元基因组结构。乳制品科学,2021;104:5705-18。

    文章中科院PubMed谷歌学者

  80. 刘娟,刘志刚,刘志刚,刘志刚。基于贝叶斯的全基因组关联研究(GWAS)。应用科学,2016;10:786-811。

    文章PubMed公共医学中心谷歌学者

  81. 张玲,潘强,王勇,吴霞,史霞。基于GWAS统计的贝叶斯网络构建与基因型表型推断。计算机学报。2019;16:475-89。

    文章PubMed谷歌学者

  82. 沈林,李国强,李国强。基因组数据通路分析:概念、方法及未来发展展望。《趋势》,2012;28:323-32。

    文章中科院PubMed公共医学中心谷歌学者

  83. Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA,等。基因集富集分析:解释全基因组表达谱的一种基于知识的方法。美国国家科学研究院。2005; 102:15545-50。

    文章中科院PubMed公共医学中心谷歌学者

  84. Delpuech E, Aliakbari A, Labrune Y, Fève K, Billon Y, Gilbert H,等。鉴定影响饲料效率猪生产性状的基因组区域。《快乐人生》2021;53:49。

    文章中科院PubMed公共医学中心谷歌学者

  85. 郑杰,郑华,李志强,李志强,等。来自猪的自然多微生物疾病挑战模型的疾病恢复特性的全基因组关联研究确定了主要组织相容性复杂区域的重要性。G3(贝塞斯达)。2021; 12: jkab441。

    文章谷歌学者

  86. Edwards SM, Thomsen B, Madsen P, Sørensen P.基因组方差的划分揭示了与奶牛乳房健康和产奶性状相关的生物学途径。《中国日报》2015;47:60。

    文章PubMed公共医学中心中科院谷歌学者

  87. MacLeod IM, Bowman PJ, Vander Jagt CJ, Haile-Mariam M, Kemper KE, Chamberlain AJ,等。利用生物先验和序列变异增强了复杂性状的QTL发现和基因组预测。BMC基因组学。2016;17:144。

    文章中科院PubMed公共医学中心谷歌学者

  88. 向R, MacLeod IM, Daetwyler HD, de Jong G, O 'Connor E, Schrooten C,等。全基因组精细制图确定了预测全球牛种群许多性状的多效性和功能性变异。Nat Commun. 2021; 12:6 6。

    文章中科院PubMed公共医学中心谷歌学者

  89. 黄S, Chaudhary K, Garmire LX。越多越好:多组学数据集成方法的最新进展。前热内。2017;8:84。

    文章中科院PubMed公共医学中心谷歌学者

  90. 王w, Baladandayuthapani V, Morris JS, Broom BM, Manyam G, Do KA。iBAG:高维多平台基因组数据的综合贝叶斯分析。生物信息学。2013;29:149-59。

    文章PubMed中科院谷歌学者

  91. 方志,马涛,唐刚,朱林,闫强,王涛,等。多组数据缺失的贝叶斯综合模型。生物信息学。2018;34:3801-8。

    文章中科院PubMed公共医学中心谷歌学者

  92. 向荣,布林EJ,普劳斯-威尔金斯CP,张伯伦AJ,戈达德ME。使用具有功能和进化意义的变异对牛性状进行贝叶斯全基因组分析。动物科学,2021;61:1818-27。

    文章中科院谷歌学者

  93. 马晓明,李志强,李志强。贝叶斯结构方程在多组学数据建模中的应用。生物信息学。2020;36:3951-8。

    文章中科院PubMed公共医学中心谷歌学者

  94. 马志刚,张志刚,张志刚,等。大规模的全转录组关联研究确定了新的前列腺癌风险区域。Nat Commun. 2018;9:4079。

    文章PubMed公共医学中心中科院谷歌学者

  95. 吕宁汉,陈杰,唐s, De Jager PL, Bennett DA, Buchman AS,等。贝叶斯全基因组TWAS方法通过汇总统计利用顺式和反式eqtl信息。Am J Hum Genet. 2020; 107:714-26。

    文章中科院PubMed公共医学中心谷歌学者

  96. 周晓霞,张晓明,张晓明。基于贝叶斯稀疏线性混合模型的多基因建模方法。PLoS Genet, 2013;9: e1003264。

    文章中科院PubMed公共医学中心谷歌学者

  97. Wheeler HE, Shah KP, Brenner J, Garcia T, Aquino-Michaels K, GTEx Consortium,等。横跨人类组织的基因表达特征的遗传性和稀疏结构的调查。PLoS Genet, 2016;12:e1006423。

    文章PubMed公共医学中心中科院谷歌学者

  98. 希拉里RF,盖德DA,麦卡特尼DL, Shi L,坎贝尔A,沃克RM,等。阿尔茨海默病血浆蛋白生物标志物的基因组和表观基因组广泛研究表明TBCA和TREM2与疾病风险有关。medRxiv。2021; 2021:1260。

    谷歌学者

  99. 欧燕,杨玉霞,邓依冬,张超,胡华,吴斌,等。通过整合脑和血液的遗传和蛋白质组来鉴定阿尔茨海默病的新药物靶点。摩尔精神病学。2021;26:6065-73。

    文章中科院PubMed谷歌学者

  100. Brandes N, Linial N, Linial M. PWAS:蛋白质组全关联研究-通过蛋白质功能变异连接基因和表型。基因组生物学2020;21:173。

    文章中科院PubMed公共医学中心谷歌学者

  101. 刘志强,李志强,李志强,等。关节eQTL的研究进展。PLoS Genet, 2013;9: e1003486。

    文章中科院PubMed公共医学中心谷歌学者

  102. 鲁菲欧,李志强,李志强,等。血浆中人类蛋白质丰度的完全联合贝叶斯定量性状位点图谱。中国生物医学工程学报。2020;16:e1007882。

    文章中科院PubMed公共医学中心谷歌学者

  103. 宋敏,Greenbaum J, Luttrell J,周伟,吴超,沈华,等。多组学数据集综合归因研究综述。前热内。2020;11:570255。

    文章中科院PubMed公共医学中心谷歌学者

  104. 李志强,李志强,李志强,等。TIGAR:一种用于转录组数据输入的改进贝叶斯工具,增强了复杂性状的基因定位。Am J Hum Genet. 2019; 105:258-66。

    文章中科院PubMed公共医学中心谷歌学者

  105. 王强,陈锐,程峰,魏强,季勇,杨华,等。整合多组学数据和基因网络的贝叶斯框架从精神分裂症GWAS数据中预测风险基因。神经科学,2019;22:691-9。

    文章中科院PubMed公共医学中心谷歌学者

  106. Giambartolomei C,刘振丽,张伟,Hauberg M, Shi H, Boocock J,等。基于汇总关联统计的多特征共定位贝叶斯框架。生物信息学。2018;34:2538-45。

    文章中科院PubMed公共医学中心谷歌学者

  107. Soliai MM, Kato A, Helling BA, Stanhope CT, Norton JE, Naughton KA,等。多组学与全基因组关联研究共定位揭示了儿童发病哮喘风险位点的环境特异性遗传机制。基因组医学。2021;13:157。

    文章中科院PubMed公共医学中心谷歌学者

  108. Hajiramezanali E, Hasanzadeh A, Duffield N, Narayanan K,钱欣。BayReL:多组学数据集成的贝叶斯关系学习。第34届神经信息处理系统会议论文集:2020年12月6日至12日;温哥华。在线会议,2020年。

  109. 朱a, Matoba N, Wilson EP, Tapia AL, Li Y, Ibrahim JG,等。MRLocus:通过等位基因异质性的贝叶斯估计,识别中介性状的因果基因。PLoS Genet, 2021;17: e1009455。

    文章中科院PubMed公共医学中心谷歌学者

  110. 范登伯格I, Bowman PJ, MacLeod IM, Hayes BJ,王涛,Bolormaa S,等。基于序列数据的贝叶斯R多品种基因组预测,减少变异,效果小。《世界末日》2017;49:70。

    文章PubMed公共医学中心中科院谷歌学者

下载参考

确认

作者想要感谢Rohan Fernando博士对基因组预测和全基因组关联研究的灵活贝叶斯建模理论和软件的杰出贡献,正如本手稿所记录的那样,尽管不完整,并且感谢他在过去几十年里与作者就这一和相关主题进行的合作和始终富有成效的讨论。作者很欣赏他的耐心,他的洞察力和创造力,以及他对充分理解定量特征分析方法和模型的遗传和统计基础的不懈努力,并在公开可用的软件中开发这些方法的有效实现。作者也感谢Jesus Arango对这篇手稿的仔细审查和输入。

资金

不适用。

作者信息

作者及隶属关系

作者

贡献

两位作者都对论文的概念和设计做出了贡献。两位作者都阅读并批准了最终的手稿。

相应的作者

对应到杰克·c·m·德克斯

道德声明

伦理批准并同意参与

不适用。

发表同意书

不适用。

相互竞争的利益

作者宣称他们之间没有利益冲突。

额外的信息

出版商的注意

伟德体育在线施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/。创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

Wolc, A., Dekkers, J.C.M.贝叶斯基因组预测方法在全基因组关联分析中的应用。Genet Sel Evol54, 31(2022)。https://doi.org/10.1186/s12711-022-00724-8

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s12711-022-00724-8

Baidu
map