QUAST: Công cụ đánh giá chất lượng cho các bộ gen
Tóm tắt
Tóm tắt: Những hạn chế của các kỹ thuật giải trình tự gen đã dẫn đến hàng chục thuật toán lắp ráp, nhưng không có thuật toán nào là hoàn hảo. Một số phương pháp so sánh các bộ lắp ráp đã được phát triển, nhưng chưa có phương pháp nào được công nhận là tiêu chuẩn. Hơn nữa, hầu hết các phương pháp hiện có để so sánh các bộ lắp ráp chỉ có thể áp dụng cho các bộ lắp ráp mới của các gen đã hoàn chỉnh; vấn đề đánh giá các bộ lắp ráp của các loài chưa được giải trình tự chưa được xem xét đầy đủ. Ở đây, chúng tôi trình bày QUAST - một công cụ đánh giá chất lượng cho việc đánh giá và so sánh các bộ gen. Công cụ này cải thiện phần mềm so sánh lắp ráp hàng đầu với các ý tưởng và chỉ số chất lượng mới. QUAST có thể đánh giá các bộ lắp ráp cả với một bộ gen tham chiếu cũng như không có bộ gen tham chiếu. QUAST tạo ra nhiều báo cáo, bảng tóm tắt và đồ thị để giúp các nhà khoa học trong nghiên cứu và công bố của họ. Trong nghiên cứu này, chúng tôi đã sử dụng QUAST để so sánh một số bộ lắp ráp gen trên ba tập dữ liệu. Các bảng và đồ thị của QUAST cho tất cả chúng đều có sẵn trong Tài liệu bổ sung, và các phiên bản tương tác của các báo cáo này có trên trang web của QUAST.
Khả năng truy cập: http://bioinf.spbau.ru/quast
Liên hệ: [email protected]
Thông tin bổ sung: Dữ liệu bổ sung có sẵn trên Bioinformatics trực tuyến.
Từ khóa
Tài liệu tham khảo
Bankevich, 2012, SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing, J. Comput. Biol., 19, 455, 10.1089/cmb.2012.0021
Barthelson, 2011, Plantagora: modeling whole genome sequencing and assembly of plant genomes, PLoS One, 6, e28436, 10.1371/journal.pone.0028436
Blattner, 1997, The complete genome sequence of Escherichia coli K-12, Science, 277, 1453, 10.1126/science.277.5331.1453
Bohlin, 2010, Analysis of intra-genomic GC content homogeneity within prokaryotes, BMC Genomics, 11, 464, 10.1186/1471-2164-11-464
Chitsaz, 2011, Efficient de novo assembly of single-cell bacterial genomes from short-read data sets, Nat. Biotechnol., 29, 915, 10.1038/nbt.1966
Earl, 2011, Assemblathon 1: a competitive assessment of de novo short read assembly methods, Genome Res., 21, 2224, 10.1101/gr.126599.111
Kurtz, 2004, Versatile and open software for comparing large genomes, Genome Biol., 5, R12, 10.1186/gb-2004-5-2-r12
Li, 2010, De novo assembly of human genomes with massively parallel short read sequencing, Genome Res., 20, 265, 10.1101/gr.097261.109
Lukashin, 1998, GeneMark.hmm: new solutions for gene finding, Nucleic Acids Res., 26, 1107, 10.1093/nar/26.4.1107
Majoros, 2004, TigrScan and GlimmerHMM: two open source ab initio eukaryotic gene-finders, Bioinformatics, 20, 2878, 10.1093/bioinformatics/bth315
Makinen, 2012, Normalized N50 assembly metric using gap-restricted co-linear chaining, BMC Bioinformatics, 13, 255, 10.1186/1471-2105-13-255
Peng, 2012, IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth, Bioinformatics, 28, 1, 10.1093/bioinformatics/bts174
Pevzner, 2001, An Eulerian path approach to DNA fragment assembly, Proc. Natl. Acad. Sci. USA, 98, 9748, 10.1073/pnas.171285098
Salzberg, 2011, GAGE: a critical evaluation of genome assemblies and assembly algorithms, Genome Res., 22, 557, 10.1101/gr.131383.111