跳到主要内容

使用牛津纳米孔技术生成长读序列Diospyros celebica基因组DNA

摘要

目标

测序技术的发展为热带树木基因组研究提供了巨大的机遇。其中一项名为ONT(牛津纳米孔技术)的技术由于其经济实惠和可获得性吸引了研究人员进行测试和实验。据我们所知,目前还没有关于将ONT用于印度尼西亚树种基因组分析的发表报告。这一进展有望进一步改善,以获得更多的基因组数据用于研究目的。因此,本研究利用从黑檀木叶和木芯中分离的DNA来确定ONT在生成长读DNA序列中的有效性(Diospyros celebicaBakh)。

数据描述

利用MinION设备和MinKnow v3.6.5 (ONT)软件对加色乌木叶片和木芯进行长读序列数据的生成。得到的数据,作为第一个长读序列数据集为加沙乌木对保护植物遗传多样性、了解植物遗传分子机制、可持续利用植物遗传资源进行下游应用具有重要意义。

客观的

牛津纳米孔技术公司(ONT)的第三代测序技术能够生成长读序列,用于填补现有的技术空白,特别是在资本成本、使用原生DNA/RNA样本、简单性、便携性、易于文库制备等方面。特别是,这些技术提供的现场分析具有重大优势,考虑到当前法规(例如《名古屋议定书》和其他法规)中关于在国内和海外从现场向实验室转移样品许可的现有空白可能造成的限制[12].在现场使用ONT可以减少安排样本转移管理流程的工作量,因此这些功能可以加快各种即时需求的数据生成,其中包括物种鉴定和保护的紧急决策,甚至是现场法医调查。ONT也可用于与其他测序平台的混合系统,如短读测序,以分析缺失片段、结构变异等。[3.].在热带地区,由于新发现的稀缺性,特别是在树木基因组变异分析方面,使用ONT解剖生物多样性的研究仍然有限。相关的问题,如DNA/RNA的产量和质量,仍然一直被发现,这取决于物种和样品来源,主要是更复杂的化合物(如酚)和样品的可及性。此外,地点条件也可能影响DNA产量,迫使所有样本只能使用一种通用方案。本实验利用印度尼西亚苏拉威西岛(西里伯斯)特有的易感树种加沙乌木(Macassar ebony),旨在确定其利用效率,并利用在西里伯斯收集的叶片和小木芯样本进行长读测序[4].本研究结果见表1

表1数据文件/数据集概述

数据描述

15株加沙乌木(Diospyros celebica采用改良的CTAB法提取印度尼西亚中苏拉威西、西苏拉威西和南苏拉威西三个省的Pickering Punch采集的Bakh.)叶片(n = 11)和木芯(n = 4) [5],其中CTAB缓冲液含有CTAB 10%、Tris HCl、NaCl 5 M、EDTA 0.5 M、PVP 1%、β-巯基乙醇和dH2O. DNA质量用Gel Doc EZ系统(Bio-Rad,美国)进行电泳评估,DNA浓度用NanoPhotometer NP80 (IMPLEN,德国)进行测量。

基因组DNA文库的制备遵循纳米孔原生条形码基因组DNA方案(expn - nbd104和SQK-LSK109),版本NBE_9065_v109_revJ_23May2018。测序在两轮中使用两个流细胞(FLO-MIN106)完成。数据文件1中列出了每个流细胞的样本列表,以及本研究中使用的原生条形码(NBD01-NBD12)。

使用MinION设备和MinKnow v3.6.5对基因组DNA样本进行测序。在没有更多的孔主动测序DNA后,测序终止。采用高精度基调用模式对FAST5文件中的信号和输出的FASTQ文件进行基调用。样本根据每个条形码进行分离,然后将条形码设置为从读取数据自动修剪(数据集1)。所有样本使用在Linux Mint终端上使用NanoStat v1.2.1进行分析,评估读取质量和读取统计量。同时,利用NanoPlot v1.31.0 [6](数据文件2)。我们获得了302 567次读取,99.5%的读取质量> Q7(纳米孔默认通过质量)。统计检验后,所有读取质量均采用NanoFilt v2.7.1过滤[6].Q-score < 7,小于500bp的Reads被过滤掉-headcrop而且-tailcrop申请了10个。读取过滤产生了134 220个读取,然后使用Canu v2.0进行校正、修剪和从头组装[7可以选择基因组大小=800米。另一个De novo long-reads汇编程序使用SMARTdenovo比较植物DNA的contig组装体[8]最小读取长度(−J) 2 000SMARTdenovo从Canu修正阶段开始使用修正的reads步骤,因此预期结果比Canu汇编更好。Canu和SMARTdenovo的contig组合分别为358 (N50 6.5 kb, GC 39.91%)和39 (N50 12.7 kb, GC 41.14%)。然后使用medaka_consensus v1.0.3根据单个测序读取对汇编草案进行了优化(更正)[9]与纳米孔测序参数模型(−米r941_min_high_g330(数据文件3)。使用QUAST v5.0.2计算得到的抛光装配统计信息[10],并引用Diospyros celebica叶绿体(数据文件4)和Diospyros莲花基因组(数据文件5)。该统计计算告知了有多少参考基因组片段被contig组装所覆盖。然后选择经过抛光的contigs,使用LINKS v1.8.7 [11Canu和SMARTdenovo的支架分别为266个(N50 11.3 kb, GC 39.91%)和33个(N50 17.8 kb, GC 41.14%)。两种汇编程序(Canu 141.6 kb, SMARTdenovo 145 kb)中最长的支架组件使用QUAST v5.0.2 with进行验证d . celebica检查支架所覆盖的基因组片段(数据文件7)。然后使用GeSeq平台for Organellar Genomes对这些支架组装进行注释[12],生成了GenBank注释(数据文件8)及其可视化(数据文件9)。

限制

使用纳米孔测序技术对加沙乌木树进行长读测序是相当具有挑战性的。基因组DNA的提取应优化,以获得高质量的gDNA,而不会过度碎片化。在文库准备之前,需要将产生的DNA片段去除,因为它们可能占据流细胞内的纳米孔,并在测序输出中导致过多的短读。文库制剂也需要优化,例如用分光光度计测量DNA浓度,可能会导致上述浓度有偏数。DNA荧光计可准确计算DNA浓度。正确的DNA浓度加载到MinION流细胞将实现最佳的DNA测序过程和孔隙占用。如本研究所观察到的,要提高MinION的读取精度限制,必须获得更高的测序通量。

数据和材料的可用性

本数据说明中描述的数据可以在figshare上自由开放地访问[910) (https://doi.org/10.6084/m9.figshare.13027991.v1https://doi.org/10.6084/m9.figshare.13028069.v1https://doi.org/10.6084/m9.figshare.13031195.v1https://doi.org/10.6084/m9.figshare.13028177.v1https://doi.org/10.6084/m9.figshare.13028180.v1https://doi.org/10.6084/m9.figshare.13031702.v1https://doi.org/10.6084/m9.figshare.13031693.v1https://doi.org/10.6084/m9.figshare.13031708.v1https://doi.org/10.6084/m9.figshare.13031714.v1https://identifiers.org/insdc.sra:DRP006615).请回复表格1及参考资料一览表[11121314151617181920.]浏览详情及有关资料的连结。

缩写

游客:

牛津纳米孔技术

背景:

脱氧核糖核酸

RNA:

核糖核酸

CTAB:

十六烷基三甲基溴化铵

盐酸:

盐酸

生理盐水:

氯化钠

EDTA:

乙二胺四乙酸

PVP:

聚乙烯吡咯烷酮

gDNA:

基因组脱氧核糖核酸

参考文献

  1. Runtuwene LR, Tuda JSB, Mongan AE, Suzuki Y.现场MinION测序。Adv Exp医学生物学2019;1129:143-50。https://doi.org/10.1007/978-981-13-6037-4_10

    文章中科院PubMed谷歌学者

  2. 印度尼西亚获取和利益分享的执行情况:审查和案例研究。JMHT。2019; 25(1): 35-43。https://doi.org/10.7226/jtfm.25.1.35

    文章谷歌学者

  3. Amarasinghe SL, Su S, Dong X, Zappia L, Ritchie ME, Gouil Q.长读测序数据分析的机遇与挑战。中国生物医学工程学报。2020;1(1):1 - 16。https://doi.org/10.1186/s13059-020-1935-5

    文章谷歌学者

  4. Karlinasari L, Noviyanti N, Purwanto YA, Majiidu M, Dwiyanti FG, Rafi M, Damayanti R, Harnelly E, Siregar IZ。乌木提取物含量的鉴别与测定(Diospyros celebica Bakh)的近红外光谱分析。森林。2021;12(1):6。https://doi.org/10.3390/f12010006

    文章谷歌学者

  5. 道尔JJ,道尔JL。从新鲜组织中分离植物DNA。焦点。1990;12:13-5。

    谷歌学者

  6. De Coster W, D 'Hert S, Schultz DT, Cruts M, Van Broeckhoven C. NanoPack:可视化和处理长读测序数据。生物信息学。2018;34(15):2666 - 9。https://doi.org/10.1093/bioinformatics/bty149

    文章中科院PubMed公共医学中心谷歌学者

  7. Koren S, Walenz BP, Berlin K, Miller JR, Bergman NH, Phillippy AM。Canu:通过自适应κ-mer加权和重复分离可伸缩和精确的长读组装。中国生物工程学报,2017;27(5):722-36。https://doi.org/10.1101/gr.215087.116

    文章中科院PubMed公共医学中心谷歌学者

  8. 刘华,吴松,李安,阮娟。从头开始使用长噪声读取的汇编程序。预印本》2020。https://doi.org/10.20944/preprints202009.0207.v1

    文章谷歌学者

  9. 牛津纳米孔技术公司。Medaka:由ONT Research提供的序列校正。2018。https://github.com/nanoporetech/medaka.访问2020年9月23日。

  10. 郭晓明,王晓明,王晓明,王晓明,等。qast:一种用于基因组组装的质量评估工具。生物信息学。2013;29(8):1072 - 5。https://doi.org/10.1093/bioinformatics/btt086

    文章中科院PubMed公共医学中心谷歌学者

  11. Warren RL, Yang C, Vandervalk BP, Behsaz B, Lagman A, Jones SJM, Birol i。GigaScience。2015; 4(1): 35。https://doi.org/10.1186/s13742-015-0076-3

    文章中科院PubMed公共医学中心谷歌学者

  12. Tillich M, Lehwark P, Pellizzer T, Ulbricht-Jones ES, Fischer A, Bock R, Greiner s。中国生物医学工程学报,2017;45(W1): W6-11。https://doi.org/10.1093/nar/gkx391

    文章中科院PubMed公共医学中心谷歌学者

  13. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M.样品列表和条形码。Figshare》2021。https://doi.org/10.6084/m9.figshare.13027991.v1

    文章谷歌学者

  14. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M. Raw阅读统计数据和图表。Figshare》2021。https://doi.org/10.6084/m9.figshare.13028069.v1

    文章谷歌学者

  15. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M. Contig总成。Figshare》2021。https://doi.org/10.6084/m9.figshare.13031195.v1

    文章谷歌学者

  16. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M. Contig装配统计1。Figshare》2021。https://doi.org/10.6084/m9.figshare.13028177.v1

    文章谷歌学者

  17. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M. Contig装配统计Figshare》2021。https://doi.org/10.6084/m9.figshare.13028180.v1

    文章谷歌学者

  18. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M.脚手架组装。Figshare》2021。https://doi.org/10.6084/m9.figshare.13031702.v1

    文章谷歌学者

  19. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M.脚手架统计。Figshare》2021。https://doi.org/10.6084/m9.figshare.13031693.v1

    文章谷歌学者

  20. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M. Genbank注释。Figshare》2021。https://doi.org/10.6084/m9.figshare.13031708.v1

    文章谷歌学者

  21. Siregar IZ, Pratama R, Dwiyanti FG, Matra DD, Muhammad M.脚手架注释可视化。Figshare》2021。https://doi.org/10.6084/m9.figshare.13031714.v1

    文章谷歌学者

  22. 日本DNA数据库,2020年。https://identifiers.org/insdc.sra:DRP006615.2021年1月27日访问。

下载参考

确认

作者感谢(i)南苏拉威西自然资源保护机构(BKSDA)提供研究许可,并协助在Cani Sirenreng自然公园、Kalaena自然保护区和mapu - gandang Dewata国家公园收集样本,(ii)南苏拉威西投资和一站式综合服务(DPMPTSP)提供在Belabori二级森林Coppo村的研究许可,(iii)西苏拉威西投资和一站式综合服务(DPMPTSP),在巴图安帕保护区和Sondoang村提供研究许可,以及(iv)中苏拉威西投资和一站式综合服务(DPMPTSP),在Wawopada村和索苏村提供研究许可。印度尼西亚茂物IPB大学高级研究实验室分子科学实验室在提供实验室设施方面的贡献也得到高度赞赏。

资金

本研究由世界资源研究所(WRI)森林计划资助(项目代码:04682,时间为2019年3月1日至2020年9月30日)支持,题为“木材跟踪项目IPB-WRI:收集物理木材参考材料并建立商业木材DNA参考数据构建管道(Diospyros celebica.Bakh),由挪威国际气候与森林倡议(NICFI)授予。资金用于研究设计、样品收集、实验室费用、样品制备、测序、数据收集和结果分析。

作者信息

作者及隶属关系

作者

贡献

IZS构想并设计了本研究的实验。MMD进行基因组DNA提取。FGD、RHP、DDM和MMD进行实验处理并进行DNA测序分析。RHP对DNA测序数据进行分析和解释。RHP和IZS编写了初稿,FGD、DDM和MMD在稿件的撰写和编辑方面做出了主要贡献。所有作者都审阅、讨论并修改了手稿的内容。所有作者都阅读并批准了最终的手稿。

相应的作者

对应到Iskandar Zulkarnaen Siregar

道德声明

伦理批准并同意参与

在获得南苏拉威西自然资源保护署/BKSDA(编号:SK.151/K)的许可后,从(i)南苏拉威西收集干叶和木芯形式的生物材料样本。8/BIDTEK/KSA/5/2019用于Cani Sirenreng自然公园和Kalaena自然保护区,编号:SK.295/K。8/BIDTEK/KSA/10/2019 for Mappu-Gandang Dewata National Park), and South Sulawesi Investment and One-stop Integrated Services/DPMPTSP (No: 16163/S.01/PTSP/2019 for Coppo Village, Bellabori Secondary Forest, and Tana Toro Protection Forest), (ii) West Sulawesi following permit approvals from West Sulawesi Investment and One-stop Integrated Services/DPMPTSP No. 000451/76.RP.PTSP.B/X/2019 for Batu Ampa Protection Forest, and Sondoang Village, and (iii) Central Sulawesi following permit approvals from Central Sulawesi Investment and One-stop Integrated Services/DPMPTSP No. 070/433/REK-PL/DPMPTSP/2019 for Wawopada Village and Sausu Village. The herbaria vouchers were identified by Mr Denny and are stored in Forest Research and Development Center and Nature Conservation (BZF)-Forestry and Environmental Research Development and Innovation Agency (FOERDIA) of the Ministry of Environment and Forestry of Republic of Indonesia (KLHK).

发表同意书

不适用。

相互竞争的利益

作者宣称他们之间没有利益冲突。

额外的信息

出版商的注意

伟德体育在线施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

Siregar, I.Z, Dwiyanti, f.g., Pratama, R。et al。使用牛津纳米孔技术生成长读序列Diospyros celebica基因组DNA。BMC Res Notes14, 75(2021)。https://doi.org/10.1186/s13104-021-05484-0

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s13104-021-05484-0

关键字

  • Diospyros celebica
  • 基因组
  • 安大略省的
  • 支架
  • 读序列
Baidu
map