QUAST: Công cụ đánh giá chất lượng cho các bộ gen

Bioinformatics (Oxford, England) - Tập 29 Số 8 - Trang 1072-1075 - 2013
Alexey Gurevich1, Vladislav Saveliev1, Nikolay Vyahhi1, Glenn Tesler1
11 Algorithmic Biology Laboratory, St. Petersburg Academic University, Russian Academy of Sciences, St. Petersburg 194021, Russia and 2Department of Mathematics, University of California, San Diego, La Jolla, CA 92093-0112, USA

Tóm tắt

Tóm tắt

Tóm tắt: Những hạn chế của các kỹ thuật giải trình tự gen đã dẫn đến hàng chục thuật toán lắp ráp, nhưng không có thuật toán nào là hoàn hảo. Một số phương pháp so sánh các bộ lắp ráp đã được phát triển, nhưng chưa có phương pháp nào được công nhận là tiêu chuẩn. Hơn nữa, hầu hết các phương pháp hiện có để so sánh các bộ lắp ráp chỉ có thể áp dụng cho các bộ lắp ráp mới của các gen đã hoàn chỉnh; vấn đề đánh giá các bộ lắp ráp của các loài chưa được giải trình tự chưa được xem xét đầy đủ. Ở đây, chúng tôi trình bày QUAST - một công cụ đánh giá chất lượng cho việc đánh giá và so sánh các bộ gen. Công cụ này cải thiện phần mềm so sánh lắp ráp hàng đầu với các ý tưởng và chỉ số chất lượng mới. QUAST có thể đánh giá các bộ lắp ráp cả với một bộ gen tham chiếu cũng như không có bộ gen tham chiếu. QUAST tạo ra nhiều báo cáo, bảng tóm tắt và đồ thị để giúp các nhà khoa học trong nghiên cứu và công bố của họ. Trong nghiên cứu này, chúng tôi đã sử dụng QUAST để so sánh một số bộ lắp ráp gen trên ba tập dữ liệu. Các bảng và đồ thị của QUAST cho tất cả chúng đều có sẵn trong Tài liệu bổ sung, và các phiên bản tương tác của các báo cáo này có trên trang web của QUAST.

Khả năng truy cập: http://bioinf.spbau.ru/quast

Liên hệ: [email protected]

Thông tin bổ sung: Dữ liệu bổ sung có sẵn trên Bioinformatics trực tuyến.

Từ khóa


Tài liệu tham khảo

Bankevich, 2012, SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing, J. Comput. Biol., 19, 455, 10.1089/cmb.2012.0021

Barthelson, 2011, Plantagora: modeling whole genome sequencing and assembly of plant genomes, PLoS One, 6, e28436, 10.1371/journal.pone.0028436

Blattner, 1997, The complete genome sequence of Escherichia coli K-12, Science, 277, 1453, 10.1126/science.277.5331.1453

Bohlin, 2010, Analysis of intra-genomic GC content homogeneity within prokaryotes, BMC Genomics, 11, 464, 10.1186/1471-2164-11-464

Chitsaz, 2011, Efficient de novo assembly of single-cell bacterial genomes from short-read data sets, Nat. Biotechnol., 29, 915, 10.1038/nbt.1966

Earl, 2011, Assemblathon 1: a competitive assessment of de novo short read assembly methods, Genome Res., 21, 2224, 10.1101/gr.126599.111

Kurtz, 2004, Versatile and open software for comparing large genomes, Genome Biol., 5, R12, 10.1186/gb-2004-5-2-r12

Li, 2010, De novo assembly of human genomes with massively parallel short read sequencing, Genome Res., 20, 265, 10.1101/gr.097261.109

Lukashin, 1998, GeneMark.hmm: new solutions for gene finding, Nucleic Acids Res., 26, 1107, 10.1093/nar/26.4.1107

Majoros, 2004, TigrScan and GlimmerHMM: two open source ab initio eukaryotic gene-finders, Bioinformatics, 20, 2878, 10.1093/bioinformatics/bth315

Makinen, 2012, Normalized N50 assembly metric using gap-restricted co-linear chaining, BMC Bioinformatics, 13, 255, 10.1186/1471-2105-13-255

Peng, 2012, IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth, Bioinformatics, 28, 1, 10.1093/bioinformatics/bts174

Pevzner, 2001, An Eulerian path approach to DNA fragment assembly, Proc. Natl. Acad. Sci. USA, 98, 9748, 10.1073/pnas.171285098

Salzberg, 2011, GAGE: a critical evaluation of genome assemblies and assembly algorithms, Genome Res., 22, 557, 10.1101/gr.131383.111

Zerbino, 2008, Velvet: algorithms for de novo short read assembly using de Bruijn graphs, Genome Res., 18, 821, 10.1101/gr.074492.107