摘要
客观的
构成广泛形态性状基础的主要基因的因果突变通常位于影响蛋白质功能的基因外显子内。由于缺乏SNP基因分型阵列等全基因组分子工具,非模式生物遗传研究不容易进行。基因测序(GBS)方法提供了另一种选择。因此,我们使用这种专注于外显子组的方法来定位和识别兔子群体中的主要基因。
数据描述
我们在测序前使用了异源富集方法,使我们能够使用已上市的人类基因组捕获兔外显子组,因为哺乳动物蛋白编码基因在物种的系统发生树中很好地保存。该策略在来自5个不同法国品系(加利福尼亚、新西兰、蓖麻、栗鼠和拉格米尔)的52只法国兔身上进行。我们产生了34亿次测序读取,每个DNA样本大约有2900 - 1.4亿次读取。每个样本外显子组的预期覆盖率在118 - 566X之间。
目前的数据集可能对研究兔子物种的科学界有用,以便(我)改进了兔参考基因组Oryctolagus cuniculus (OryCun2.0)的注释,(2)丰富了在兔和兔中分离的多态特征(3)评价不同家兔品系的遗传多样性。
原始序列保存在欧洲分子生物学实验室-欧洲生物信息学研究所(EMBL-EBI)数据门户的欧洲核苷酸档案(ENA)中,生物项目注册号为PRJEB37917。
客观的
一些研究表明85%的主要基因的因果突变位于外显子内[1].然而,非模式生物往往缺乏进行遗传分析进行主基因鉴定所必需的分子工具,或者现有的分子工具信息量不足。虽然兔种存在中密度SNP阵列(Affymetrix AxiomOrcun单核苷酸多态性阵列,Thermo Fisher Scientific, USA),但为了开发和选择有信息的标记,只对主要的兔株进行了测序,而不是对世界各地的兔株进行了测序。在我们的研究中,使用了主要品种(法国加州和法国新西兰)和世界品种(法国蓖麻、法国栗鼠和法国拉格米尔)。因此,我们将GBS作为一种替代技术。我们使用了包含241,126个人类编码外显子的人类靶向外显子组面板(Nextera Rapid Capture exome, Illumina)来捕获和测序兔外显子组。这种异源杂交方法已经成功地应用于犬类[2而兔子被认为在系统发育上比狗更接近人类[3.].尽管目前兔参考基因组(OryCun2.0, 7X覆盖)和注释版本的组装质量较差,但在硅异体杂交中显示,43.7%的人类探针唯一匹配OryCun2.0参考基因组,覆盖114,225个注释兔外显子。尽管数据集仍然是机密的,但初步分析证实了已知的外显子因果突变为阳性对照[4]。
我们的原始数据集可能有助于科学界改进兔参考基因组的注释,因为目前由布罗德研究所完成的草案是使用7 ×深度覆盖构建的。该外显子组富集方法可能靶向和测序新的兔外显子。读取长度和对端测序方法允许与参考基因组更精确的读取对齐。此外,高质量和大覆盖深度阅读使识别各种兔子群体的新变异成为可能,特别是对世界各地的品种。此外,本数据集可用于家兔遗传生物多样性的研究。
此外,这种使用人类分子遗传学工具的异体方法可以用于研究哺乳动物物种中的非模式生物。全外显子组测序(WES)方法是一种快速、低成本的替代方法,可用于鉴定特定物种的大多数外显子变异。对于那些拥有少量生物材料进行基因实验的研究人员来说,这种策略可能也很有趣。
数据描述
动物
实验包括来自5个不同品系的52只法国兔子,均在INRAE实验农场饲养[5或INRAE GenPhySE实验设施,根据法国和欧洲动物福利立法。在我们的研究中,没有任何动物是专门为我们项目的需要而繁殖/杀死/捕获的,因此不需要明确的授权(根据欧洲指令2010/63/EU)。这些动物包括13只法国蓖麻、14只法国龙猫、20只法国拉格米勒、4只法国加利福尼亚和1只法国新西兰。除了法国加利福尼亚兔和法国新西兰兔,选择品系是因为它们皮毛的形态变化。法国蓖麻、法国栗鼠和法国拉格米尔菌株根据其被毛表型分为2个亚群(法国蓖麻和法国栗鼠)[6或安哥拉(法语Laghmere) [7].选择法国加利福尼亚兔的饲料效率[6]和法属新西兰兔属于繁殖性状选择的品种[8].所有兔子都是已知性别和家谱的成年动物。
样品采集和DNA提取
从耳、皮肤活检或血液样本中共收集52个生物样本。基因组DNA提取采用内部方案(蛋白K裂解,然后盐基DNA提取和乙醇沉淀),只有一个样本使用Dneasy组织试剂盒(Qiagen, Hilden, Germany)提取。对这7个血液DNA样本增加了额外的提取步骤,首先去除红细胞。使用Nanodrop 8000分光光度计(ND8000LAPTOP, Thermo Fisher Scientific, USA)和片段分析仪(Advanced Analytical, USA)仪器测定总基因组DNA质量。使用Qubit2.0仪器(Q32866, Life Technologies, USA)测定总基因组DNA浓度。
外显子组图书馆准备
共制备了53个外显子组库,分2批制备:第一批11个样本用于概念证明实验,第二批42个样本在相同的实验条件下进行。文库制备和外显子体富集使用人类Nextera Rapid Capture Exome试剂盒(版本1.2,Part#15037436 Rev. H, Illumina, USA)。对于其中一个生物样本,准备了两个独立的库,每批一个。除了第二次杂交温度被设置为58°C而不是55°C,以适应人类探针与兔基因组的异源杂交外,该协议是根据制造商的说明执行的。进行额外的净化(AMPure XP 0,8x, Beckman Coulter)步骤,以去除残留的单链探针。文库插入物的平均尺寸为378 bp,浓度大于5 nM。
DNA测序和原始数据
DNA测序和质量控制是与基因组和转录组学(GeT)核心设施平台(INRAE,图卢兹,法国,[9])。53个WES文库建立在HiSeq3000测序仪上,以2 × 150 bp对端读取(HiSeq3000 SBS kit 300 cycles, Illumina, USA)。整个数据集在6个车道上测序,5个车道上每车道2个池,1个车道上每车道1个池(Flowcell HiSeq3000 8车道,Illumina, USA)。双指数使用bcl2fastq (= CASAVA)软件(版本1.8或2.20取决于批次)对每个样品进行多路分解。来自中试批次的库测序了两次,而一个样本(ERS4541894)从两个不同的库测序了3次。因此,生成了64个原始序列(fastq.gz文件)。原始序列保存在EMBL-EBI ENA数据门户的ENA中,注册号为PRJEB37917 [10].我们总共产生了34亿次测序读取,每个DNA样本大约有2900 - 1.4亿次读取。考虑到外显子组约占基因组的1%,每个样本的理论外显子组覆盖率在118X到566X之间(表1).
限制
用100%异源杂交法评估预期覆盖率。绘图和最终覆盖的质量将完全依赖于杂交的质量。靶向外显子既取决于参考基因组的质量,也取决于所研究物种的注释。
数据和材料的可用性
在EMBL-EBI ENA网站上,生物项目注册号为PRJEB37917,可以自由开放地访问数据说明。https://identifiers.org/ena.embl:PRJEB37917(8].
缩写
- GBS:
-
Genotyping-by-sequencing
- OryCun:
-
Oryctolagus cuniculus
- ENA:
-
欧洲核苷酸存档
- EMBL-EBI:
-
欧洲分子生物学实验室-欧洲生物信息学研究所
- SNP:
-
单核苷酸多态性
- 韦斯:
-
全外显子组测序
- 得到:
-
基因组和转录组
参考文献
Ng SB, Turner EH, Robertson PD, flygar SD, Bigham AW, Lee C,等。对12个人类外显子进行靶向捕获和大规模并行测序。大自然2009年9月,461(7261):272 - 6。
英国动物健康信托基金。使用Nextera外显子组富集试剂盒捕获犬的外显子组[互联网]。申请报告;2013.能用的苏尔:https://www.illumina.com/content/dam/illumina-marketing/documents/products/appnotes/appnote_nextera_exome_enrichment_canine.pdf
林伯德-托K, Garber M, Zuk O, Lin MF, Parker BJ, Washietl S,等。用29种哺乳动物绘制的人类进化约束的高分辨率地图。自然。2011;478(7370):476 - 82。
Iannuccelli N, Cabau C, Sarry J, Bouchez O, Billon Y, Riquet J,等。利用人类外显子体这一分子工具来定位和识别主要基因的异体杂交。在:育种和遗传学。南特(法国);2021.
INRAE实验农场(GenESI)。2022.能用的苏尔:https://www6.nouvelle-aquitaine-poitiers.inrae.fr/genesi/
德鲁伊赫·L,吉尔伯特·H,巴尔米斯·E,鲁埃什·J,特卡塞斯·A,拉祖尔·C,等。家兔饲料效率两个选择标准的遗传参数。动物科学杂志。2013年,91(7):3121 - 8。
穆桑特P,罗尚博HD, Thébault RG。兔中安哥拉基因与fgf5基因的连锁关系。世界兔科学2004;12(1):01-6。
加罗·H, Ruesche J, Gilbert H, Balmisse E, Benitez F, Richard F,等。用析因设计估算直接遗传和母系效应对兔生长和饲料效率的影响。J Anim品种Genet mai。2019, 136(3): 168 - 73。
GeT核心设施。2022.能用的苏尔:http://get.genotoul.fr
欧洲核苷酸档案。2022.能用的苏尔:https://www.ebi.ac.uk/ena/browser/home
确认
作者要感谢GenESI和GenPhySE中照顾动物的人。
资金
作者感谢INRAE动物遗传学系提供的研究经费。
作者信息
作者和联系
贡献
NI进行DNA分离、实验设计并撰写稿件。JS进行了实验。YBPA和VH采集兔的生物样本。CC执行数据质量控制。CD在平台上管理测序服务。京东设计了这项研究并获得了资金。所有作者阅读并批准了最终稿件。
相应的作者
道德声明
伦理批准和同意参与
在我们的研究中,没有任何动物是专门为我们项目的需要而繁殖/杀死/捕获的,因此不需要明确的授权(根据欧洲指令2010/63/EU)。这些动物在生产农场以常规方式饲养。生物样本是在屠宰场死后提取的。
同意出版
不适用。
相互竞争的利益
作者声明他们没有竞争利益。
额外的信息
出版商的注意
伟德体育在线施普林格自然对出版的地图和机构附属的管辖权要求保持中立。
权利和权限
开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。
关于这篇文章
引用这篇文章
伊安努切利(Iannuccelli),新泽西州萨里(Sarry),纽约州比隆(Billon)。et al。利用人外显子组异源杂交兔靶向基因组序列。BMC Res笔记15282(2022)。https://doi.org/10.1186/s13104-022-06162-5
收到了:
接受:
发表:
DOI:https://doi.org/10.1186/s13104-022-06162-5
关键字
- 兔子
- 有针对性的DNA测序
- 捕获
- 外显子组
- 人类
- 不同的杂交