新闻详情

T2T基因组组装的进展、 挑战与前景

20
发表时间:2024-06-10 15:28

近日,李恒教授在Nature Review Genetics(IF=42.69)发表了题为“Genome assembly in the telomere-to-telomere era”的综述论文,该综述详细总结了目前T2T组装的发展过程,重点讨论了如何获得接近端粒到端粒的组装,并展望了解决剩余组装间隙和组装非二倍体基因组所需的技术和算法进步。

640.jpg


其中,作者阐述了对于一个真正的T2T基因组组装的界定,它必须覆盖整个染色体且没有间隙,并且没有大规模的组装错误。因此,在确定组装结果是“T2T”时,必须经过严格的组装评估。除了常规的T2T基因组组装评估指标、如BUSCO评估、K-mer评估、比对评估等外,着丝粒等高度重复序列区的组装质量成果T2T的一大阻碍和检验标准(本公司提供着丝粒科学定义及组装评估分析,详见产品页)。


由于PacBio HiFi和ONT超长reads的广泛适用性,从头组装的基因组质量在过去两年中得到了显著改善。但现在能自动组装T2T基因组中的所有染色体吗?作者认为答案通常是否定的。作者认为,过去几年的大部分进步都是由于测序数据质量的提高而取得的。目前的组装软件可以正确地重建基因组序列的长片段,但剩余的组装缺口,特别是在各种非人类基因组中,仍然难以自动修补。算法改进本身可能无法可靠地解决当前可用数据的所有基因组。期待测序技术不断取得新进展,在没有人为干预的情况下真正完成基因组。此外,完整的组装只是下游生物学发现的第一步,基因组下游的分析工具,例如全基因组比对和基因注释仍然面临重大挑战,这需要未来持续不断的进行改善。

分享到: