Trimmomatic: một công cụ cắt linh hoạt cho dữ liệu chuỗi Illumina

Bioinformatics - Tập 30 Số 15 - Trang 2114-2120 - 2014
Anthony Bolger1, Marc Lohse1, Björn Usadel1
11 Department Metabolic Networks, Max Planck Institute of Molecular Plant Physiology, Am Mühlenberg 1, 14476 Golm, 2 Institut für Biologie I, RWTH Aachen, Worringer Weg 3, 52074 Aachen and 3 Institute of Bio- and Geosciences: Plant Sciences, Forschungszentrum Jülich, Leo-Brandt-Straße, 52425 Jülich, Germany

Tóm tắt

Tóm tắt

Động lực: Mặc dù đã có nhiều công cụ xử lý dữ liệu đọc từ giải trình tự thế hệ mới (NGS), chúng tôi vẫn không tìm thấy công cụ nào hoặc sự kết hợp của các công cụ đáp ứng yêu cầu của chúng tôi về tính linh hoạt, khả năng xử lý chính xác dữ liệu cặp đầu và hiệu suất cao. Chúng tôi đã phát triển Trimmomatic như một công cụ xử lý dữ liệu đầu vào linh hoạt và hiệu quả hơn, có khả năng xử lý chính xác dữ liệu cặp đầu.

Kết quả: Giá trị của việc xử lý dữ liệu đọc NGS đã được chứng minh cả trong các tác vụ dựa trên tham chiếu và không dựa trên tham chiếu. Trimmomatic cho thấy sản phẩm đầu ra ít nhất là ngang bằng, và trong nhiều trường hợp còn vượt trội hơn, so với các công cụ khác trong tất cả các kịch bản đã được kiểm nghiệm.

Tính khả dụng và triển khai: Trimmomatic được cấp phép theo GPL V3. Công cụ này có thể chạy trên nhiều nền tảng (cần Java 1.5+) và có sẵn tại http://www.usadellab.org/cms/index.php?page=trimmomatic

Liên hệ: [email protected]

Thông tin bổ sung: Dữ liệu bổ sung có sẵn trực tuyến tại Bioinformatics.

Từ khóa


Tài liệu tham khảo

Aronesty, 2013, Comparison of sequencing utility programs, Open Bioinform. J., 7, 1, 10.2174/1875036201307010001

Junier, 2010, The Newick utilities: high-throughput phylogenetic tree processing in the Unix shell, Bioinformatics, 26, 1669, 10.1093/bioinformatics/btq243

Langmead, 2012, Fast gapped-read alignment with Bowtie 2, Nat. Methods, 9, 357, 10.1038/nmeth.1923

Li, 2009, Fast and accurate short read alignment with Burrows–Wheeler transform, Bioinformatics, 25, 1754, 10.1093/bioinformatics/btp324

Li, 2010, A survey of sequence alignment algorithms for next-generation sequencing, Brief. Bioinform., 11, 473, 10.1093/bib/bbq015

Li, 2013, The NGS WikiBook: a dynamic collaborative online training effort with long-term sustainability, Brief. Bioinform., 14, 548, 10.1093/bib/bbt045

Lindgreen, 2012, AdapterRemoval: easy cleaning of next generation sequencing reads, BMC Res. Notes, 5, 337, 10.1186/1756-0500-5-337

Mardis, 2008, Next-generation DNA sequencing methods, Annu. Rev. Genomics Hum. Genet., 9, 387, 10.1146/annurev.genom.9.081307.164359

Martin, 2011, Cutadapt removes adapter sequences from high-throughput sequencing reads, EMBnet. J., 17, 10, 10.14806/ej.17.1.200

Zerbino, 2008, Velvet: algorithms for de novo short read assembly using de Bruijn graphs, Genome Res., 18, 821, 10.1101/gr.074492.107