研究团队大幅增强了甘薯基因组“太中6号”的注释,推出了更全面、更详细的版本v1.0.a2。此次更新利用了12个Nanopore全长RNA文库和190个IlluminaRNA-seq文库,鉴定了360个新基因,修改或添加了31,771个基因模型,并完善了基因命名法。
改进的注释包括详细的miRNA表达谱,有利于甘薯的基因功能研究,并推进整个旋花科的基因组分析,从而为未来的农业和遗传研究提供关键资源。
甘薯(Ipomoeabatatas)是发展中国家的重要作物,作为六倍体物种,可提供必需的营养物质并解决非洲的维生素A缺乏问题。第一个基因组序列,即品种太中6号,利用Illumina测序,后来通过第三代测序技术进行增强,从而产生了高质量的染色体规模的基因组组装。然而,由于短读长测序的局限性,实现精确的基因组注释仍然存在挑战。
最近,长读长测序的进步,如牛津纳米孔技术,促进了更准确的注释,并允许更深入地了解基因结构和选择性剪接。
2024年3月21日发表在TropicalPlants上的一项研究在此进展的基础上使用了精细的注释管道,该管道结合了Nanopore全长和广泛的RNA-seq数据集,增强了当前甘薯的基因组注释。
在这项研究中,研究人员利用综合方法将甘薯各个发育阶段和组织的Nanopore全长转录组和IlluminaRNA-seq数据整合在一起,将I.batata基因组的注释改进到版本1.0.a2。
他们的方法采用BRAKER进行初始基因预测,并通过各种基因组提示进行丰富,然后通过EVidenceModeler(EVM)生成共识模型。值得注意的是,更新的注释现在包含42,751个蛋白质编码基因,通过3'和5'UTR增强了模型,并增加了每个基因的平均外显子计数。
值得注意的是,这次修订添加或修改了31,771个基因模型,纳入了8,736个选择性剪接异构体,并引入了新的基因命名法以供更清晰的参考。这种更详细的注释有助于精确的基因组研究,并支持甘薯的高级功能基因组学。
此外,整合miRNA数据及其靶点为基因调控提供了新的见解,特别是在贮藏根的不同发育阶段,增强了我们对甘薯生物学的理解并有助于有针对性的育种工作。全面的基因功能预测是使用InterProScan和EggNOG映射器执行的,提供了更丰富的注释,这对于致力于改善全球农业甘薯品种的持续研究和育种计划至关重要。
该研究的首席研究员朱国鹏教授表示:“我们的研究有助于更新甘薯基因组的基因组注释,这将极大地促进甘薯的基因功能研究,并促进整个旋花科的基因组分析。”
总体而言,这种增强的基因组框架促进了甘薯更深入的功能基因组学,并通过整合详细的miRNA数据和基因功能预测来支持先进的育种计划,以改善品种性状。