跳到主要内容

用于斑马雀基因表达分析的微阵列寡核苷酸和相应的ESTs/ cdna的策展

摘要

目标

斑胸草雀是研究发声学习机制的主要模式生物,发声学习是使人类能够说话的一种特征。带有表达序列标签(ESTs)和微阵列的cDNA集合的发展已经允许广泛的语音学习和产生电路的分子特征。然而,糟糕的数据库管理可能导致转录组和生物信息学分析中的错误,限制了这些资源的影响。在这里,我们使用基因组比对和同源性分析进行orthology验证,对组成安捷伦微阵列用于雀类基因表达分析的约35%的寡核苷酸和相应的ESTs/ cdna进行整理和重新注释。

数据描述

我们发现:(1)43084个寡核苷酸中有5475个(a)未能与斑胸草雀基因组对齐,(b)与多个位点对齐,或(c)仅与Chr_un对齐,因此需要标记,直到有更好的基因组组装可用,或(d)反映克隆产物;(2)在进一步检查的9635个有效寡核苷酸中,有3120个命名错误,其中1533个没有已知的同源物;(3) 2635个寡核苷酸需要更新名称。由此产生的策展数据集为纠正以前雀类微阵列研究中的基因识别错误提供了参考,并在未来的研究中避免此类错误。

客观的

斑胸草雀是研究发声学习的主要模式生物[123.456,这一特征为人类的口语习得提供了基础。对雀类的研究让我们深入了解了学习发声的分子机制[78910111213141516171819],包括声音控制电路的转录组[78111213141516181920.2122232425]以及识别鸟类和人类声音控制系统的趋同分子专门化[7].这些研究很大程度上是基于Songbird阵列v2 [16],用eArray 5.4 (Agilent Technologies)设计的约44,000个60-mer寡核苷酸阵列和来自三个cDNA集合的序列[111623].最初的cDNA注释是在斑胸草雀基因组通过注释的cDNA/EST数据库的BLAST搜索获得之前进行的。后来的努力将oligo和EST序列与斑胸草雀基因组(Taegut1;[26]),并将Ensembl模型注释分配给映射到这些模型5 kb以内(或3 kb以内的ESTs)的寡核苷酸[725].然而,这项工作没有考虑链信息,没有检测到ESTs/寡核苷酸内含子到基因模型中,也没有将ESTs/寡核苷酸分配到注释错误的模型中。其他寡核苷酸来源于cDNA克隆产物或错误的序列选择。通过删除和纠正这些错误,我们生成了我们认为最全面和准确的斑胸草雀歌曲控制系统的本构转录组[27].我们将在下面描述这种策展工作。

数据描述

我们从Agilent-021323 Zebra Finch Oligoarray (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL18442),删除冗余和控制。对于43,084个非冗余寡核苷酸,我们应用了类似于[92829].表格1提供了我们策展工作的摘要(表2)和相关数据集(表3-13)的链接。完整的数据集可以在https://doi.org/10.6084/m9.figshare.c.408183530.].我们首先使用BLAT将所有寡核苷酸与雀基因组(Taegut1)对齐[31]采用严格的参数(minScore = 30;minIdentity = 0)。2792个寡核苷酸(6%)未能对齐到Taegut1(对齐评分< 25;表3),503(1%)只与Chr_Un对齐(即染色体未知;表4),未组装区域和等位变异的串联,1952年(5%)与不同染色体上的多个位点对齐(表5)。以上所有病例都从进一步的分析中删除,因为不能确定特异性或建立基于同向性的基因orthology。我们保留了高评分(> 95%)与Chr_Un次级比对的寡核苷酸,因为这些对应于等位变异。另外228个寡核苷酸(< 1%)与从cDNA的5 '端测序的est方向相反,或与从3 '端测序的est方向相同(表6)。由于第二链oligo-dT启动和无方向性cDNA克隆,这些寡核苷酸代表了两端有t -延伸的短est的反义链,因此也被删除。

表1数据文件/数据集概述

对于37609个寡核苷酸中的27974个(74%)通过了初始过滤器,我们提供了与之前的工作相同的共识基因符号[732](表7),基于人类基因组命名法联盟(HGNC;2018)。余下的9635个寡核苷酸(26%)定义了雀鸣系统的组成转录组[27],我们检查了对Taegut1的比对,并根据与基因模型的关联(正确链上的Ensembl或finch-/xeno-RefSeqs)注释了序列。对于3 ' -UTRs对应的ESTs,我们将blat对齐序列用于鸡(Galgal5),试图通过“行走”广泛的鸡ESTs/ mrna集合,将它们与鸡基因模型联系起来。总共有3750个寡核苷酸注释通过直接检测得到确认(表8),另外130个寡核苷酸通过synteny进一步确认(表9),这需要与其他鸟类(如鸡、藏山雀、其他雀类、虎皮鹦鹉、椋鸟、猎鹰)和非鸟类(如鳄鱼、蜥蜴、老鼠、人类)基因组进行额外的比对和邻居基因比较。我们为1529个未注释或错误注释的寡核苷酸提供了正确的注释(表10),包括不恰当的Ensembl模型分配(例如错误的链)或模型的内含子位置,确定了另外58个寡核苷酸的orthology(表11)。在其他生物体中,1533个与无直系同源位点相关的寡核苷酸(表12)被命名为未知。最后,我们将2635个寡核苷酸更新为一个HGNC符号,或一个一致的NCBI:基因名称(表13)。

我们的发现强调了在基因鉴定和生物信息学中需要精确的策展以避免传播错误。这个部分策展数据集(该阵列上约35%的寡核苷酸)可作为纠正先前研究错误的参考,并为未来的寡核苷酸策展提供路线图。我们预计,在本文未检测的27975个寡核苷酸中,32%需要进一步筛选,27%需要更新基因符号(表7)。

限制

  • 根据我们的经验,精确的orthology赋值需要synteny验证,然而没有足够的计算方法用于大规模分析,并且人工评估大型基因集超出了合理的努力范围。我们建议,无论何时决定从微阵列筛查中重点检测一个或几个基因,都应谨慎,并应用直接同向性验证。这在疑似瘫痪或序列交叉对准的密切家庭成员的情况下尤其重要。

  • HGNC注释步骤是重要的,因为大多数生物信息学管道使用这些批准的符号。在这里,我们下载了整个HGNC基因符号集以及任何旧的基因符号或同义词,并交叉引用列表,以验证我们筛选的寡核苷酸集的基因符号是HGNC批准的术语。在大多数情况下,我们能够将旧的基因符号或同义词更新为当前的HGNC基因符号。然而,在某些情况下,特别是当斑胸草雀基因没有人类同源基因时,没有被批准的HGNC基因符号。在这些情况下,我们参考了NCBI:Gene,并分配了多种非人类脊椎动物(如小鼠、变异性蜥蜴、鸡、青蛙)中最常见的基因符号。这些NCBI:基因名称在表7-13中“HGNC符号状态”列下被列为“未批准”,并且对于基于已批准的人类基因术语的生物信息学应用无效。

缩写

咩咩的叫声:

类似爆炸的对准工具

爆炸:

基本本地对齐搜索工具

互补脱氧核糖核酸:

由单链mRNA合成的DNA

chr_Un:

染色体未知

美国东部时间:

表达序列标签

HGNC:

人类基因组命名法联盟

NCBI:

国家生物技术信息中心

韩国帝王——/ Refseqs:

注释和策划核苷酸序列(DNA, RNA)

参考文献

  1. Wilbrecht L, Nottebohm F.鸟类和人类的声乐学习。Ment Retard Dev disabled Res Rev. 2003;9(3): 135-48。

    文章PubMed谷歌学者

  2. 杜普AJ,库尔PK。鸟鸣和人类语言:共同主题和机制。神经科学1999;22:567-631。

    文章PubMed中科院谷歌学者

  3. 齐格勒HP,马勒P,编辑。鸟类鸣叫的行为神经生物学:纽约科学院年鉴。纽约:纽约科学院;2004.

    谷歌学者

  4. 齐格勒HP,马勒P,编辑。鸟鸣的神经科学。剑桥:剑桥大学出版社;2008.

    谷歌学者

  5. Bolhuis JJ, Everaert M. Birdsong, speech和language。入:Bolhuis JJ, Everaert M,编辑。探索思维和大脑的进化。剑桥:麻省理工学院出版社;2013.p。542。

    谷歌学者

  6. 梅洛简历。斑胸草雀,Taeniopygia guttata:一种鸟类模型,用于研究声音学习的神经生物学基础。《寒泉港议定书》2014;2014(12):1237-42。

    文章PubMed公共医学中心谷歌学者

  7. Pfenning AR, Hara E, Whitney O, Rivas MV, Wang R, Roulhac PL, Howard JT, Wirthlin M, Lovell PV, Ganapathy G,等。人类和鸣禽大脑中趋同的转录专门化。科学。2014;346(6215):1256846。

    文章PubMed公共医学中心中科院谷歌学者

  8. Lovell PV, Clayton DF, replolle KL, Mello CV。鸟鸣“转录组学”:鸟鸣系统的神经化学专门化。PLoS ONE。3 (10): e3440。2008;

    文章PubMed公共医学中心中科院谷歌学者

  9. 洛弗尔PV,卡尔顿JB,梅洛CV。对鸣禽钾通道基因的基因组学分析揭示了脑回路的分子特化,以维持和产生习得的发声。BMC基因组学杂志,2013;14(1):470。

    文章PubMed公共医学中心中科院谷歌学者

  10. 杨晓明,张晓明,张晓明。谷氨酸受体在鸟类学习发声神经通路中的差异表达。中华神经外科杂志,2004;29(1):344 - 344。

    文章PubMed公共医学中心中科院谷歌学者

  11. 李霞,王晓军,Tannenhauser J, Podell S, Mukherjee P, Hertel M, Biane J, Masuda S, Nottebohm F, Gaasterland T.鸣禽研究基因组资源及其在脑发育过程中基因表达特征的应用。美国国家科学研究院。2007; 104(16): 6834 - 9。

    文章PubMed公共医学中心中科院谷歌学者

  12. Thompson CK, Meitzen J, Replogle K, Drnevich J, Lent KL, Wissman AM, Farin FM, Bammler TK, Beyer RP, Clayton DF,等。鸟类鸣叫控制脑区基因表达模式的季节性变化。PLoS ONE。7 (4): 2012; e35119。

    文章PubMed公共医学中心中科院谷歌学者

  13. 史蒂文森TJ,雷波格勒K,德雷尼维奇J,克莱顿DF,鲍尔GF。高通量分析揭示了参与社会行为调节的两个独立神经系统中可分离的基因表达谱。BMC神经科学,2012;13:126。

    文章PubMed公共医学中心谷歌学者

  14. 希利亚德AT,米勒JE,霍瓦特S,怀特SA。基底节区不同的神经基因组状态与鸣禽的歌唱行为有不同的关系。科学通报。2012;8(11):e1002773。

    文章PubMed公共医学中心中科院谷歌学者

  15. Hilliard AT, Miller JE, Fraley ER, Horvath S, White SA。分子微电路是用于声乐学习的基底神经节电路功能规范的基础。神经元。2012;73(3):537 - 52。

    文章PubMed公共医学中心中科院谷歌学者

  16. Wada K, Howard JT, McConnell P, Whitney O, Lints T, Rivas MV, Horita H, Patterson MA, White SA, Scharff C,等。一种分子神经行为学方法,用于识别和表征行为调控基因的级联。美国国家科学研究院。2006; 103(41): 15212 - 7。

    文章PubMed公共医学中心中科院谷歌学者

  17. 李志刚,李志刚,李志刚。小白蛋白在声乐学习者大脑中的差异调节。PLoS ONE。2012; 7: e29457。

    文章PubMed公共医学中心中科院谷歌学者

  18. Kubikova L, Wada K, Jarvis ED.鸣禽大脑中的多巴胺受体。中华神经外科杂志,2010;26(6):741-69。

    文章PubMed公共医学中心中科院谷歌学者

  19. 王晓明,王晓明,王晓明,等。黄翅雀大脑鸣叫控制核HVC的分子特征。Brain res 2010; 1360:56-76。

    文章PubMed中科院谷歌学者

  20. 李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超,李晓超。激光捕获微解剖技术对混合远距投影神经元表达的影响。中华神经科学杂志,2006;37(2):339 - 339。

    文章PubMed中科院谷歌学者

  21. Dong S, Replogle KL, Hasadsri L, Imai BS, Yau PM, rodrigez - zas S, Southey BR, Sweedler JV, Clayton DF。大脑中离散的分子状态伴随着对声音信号的变化反应。美国国家科学研究院。2009; 106(27): 11364 - 9。

    文章PubMed公共医学中心谷歌学者

  22. London SE, Dong S, replolle K, Clayton DF。歌曲学习敏感期听觉前脑基因表达的发育转变。神经生物学杂志,2009;69(7):437-50。

    文章PubMed公共医学中心中科院谷歌学者

  23. Replogle KL, Arnold AP, Ball GF, Band M, Bensch S, Brenowitz EA, Dong S, Drnevich J, Ferris M, George JM,等。歌鸟神经基因组学(SoNG)计划:基于社区的工具和策略,用于研究大脑基因功能和进化。BMC基因组学。2008;9(1):131。

    文章PubMed公共医学中心中科院谷歌学者

  24. Drnevich J, Replogle KL, Lovell P, Hahn TP, Johnson F, Mast TG, Nordeen E, Nordeen K, Strand C, London SE,等。经验依赖因子与非经验依赖因子对鸣禽大脑基因表达的影响。美国国家科学研究院。2012, 109(2): 17245 - 52。

    文章PubMed公共医学中心谷歌学者

  25. 社会互动鸣禽中ZENK的运动诱导转录但感觉调节翻译。中华神经生物学杂志,2005;26(3):529 - 529。

    文章PubMed公共医学中心中科院谷歌学者

  26. Warren WC, Clayton DF, Ellegren H, Arnold AP, Hillier LW, Kunstner A, Searle S, White S, Vilella AJ, Fairley S,等。鸣禽的基因组。自然。2010;464(7289):757 - 62。

    文章PubMed公共医学中心中科院谷歌学者

  27. 罗伟林,李志刚,李志刚,李志刚。语音学习脑回路的构成差异转录组BMC基因组学。2018;19(1):231。

    文章PubMed公共医学中心谷歌学者

  28. 魏思林M,洛弗尔PV,贾维斯ED,梅洛CV。比较基因组学揭示了鸣禽谱系特有的分子特征。BMC Genomics, 1082;2014:15。

    谷歌学者

  29. Lovell PV, Wirthlin M, Wilhelm L, Minx P, Lazar NH, Carbone L, Warren WC, Mello CV。在鸟类中,蛋白质编码基因的保守共联簇缺失。中国生物医学工程学报。2014;15(12):565。

    文章PubMed公共医学中心中科院谷歌学者

  30. 罗伟林,李志刚,李志刚,李志刚。语音学习脑回路的构成差异转录组figshare。https://doi.org/10.6084/m9.figshare.c.4081835

  31. 肯特WJ。blat -类似blast的对齐工具。基因组学报,2002;12(4):656-64。

    文章PubMed公共医学中心中科院谷歌学者

  32. Whitney O, Pfenning AR, Howard JT, Blatti CA, Liu F, Ward JM, Wang R, Audet JN, Kellis M, Mukherjee S,等。行为调节基因和歌唱基因组的核心和区域富集网络。科学。2014;346:1256780。

    文章PubMed公共医学中心中科院谷歌学者

下载参考

作者的贡献

PVL、CVM、MW、SRF、NAH、BM:初步的概念设计和实验设计。NAH, AG, PVL, BM, SRF, CVM, MW:分析微阵列数据,分析基因组比对以确定探针特异性,寡核苷酸的策展和重注释。PVL, CVM, NAH, BM, MW, SRF和NH:数据解释,主要发现的关键讨论,表格,图形及其图例的准备。PVL和CVM:表格展示和稿件写作。所有作者都阅读并批准了最终的手稿。

确认

不适用。

相互竞争的利益

作者宣称他们之间没有利益冲突。

数据资料的可获得性

在当前研究期间生成和/或分析的数据集可在figshare存储库中获得:https://doi.org/10.6084/m9.figshare.c.4081835

发表同意书

不适用。

伦理批准并同意参与

不适用。

资金

这项研究得到了美国国立卫生研究院(R24_GM120464和R21_DC014432)和美国国家科学基金会(NSF-143602)的支持。这些资助机构在研究设计、数据收集、分析和解释或撰写手稿方面没有任何作用。

出版商的注意

伟德体育在线施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

作者信息

作者及隶属关系

作者

相应的作者

对应到Claudio V. Mello

权利和权限

开放获取本文根据创作共用属性4.0国际许可协议(http://creativecommons.org/licenses/by/4.0/),允许在任何媒介上不受限制地使用、分发和复制,前提是您对原作者和来源给予适当的赞扬,提供到创作共用许可证的链接,并注明是否进行了更改。创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)除另有说明外,适用于本条所提供的资料。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

洛弗尔,p.v.,惠津加,n.a.,格塔丘,A。et al。用于斑马雀基因表达分析的微阵列寡核苷酸和相应的ESTs/ cdna的策展。BMC Res Notes11, 309(2018)。https://doi.org/10.1186/s13104-018-3402-x

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s13104-018-3402-x

关键字

  • 分子
  • 演讲和语言
  • 鸟鸣声
  • 互补脱氧核糖核酸微阵列
  • 益生元数组
  • 基因表达
  • 大脑
  • 声乐学习
Baidu
map