Trimmomatic: một công cụ cắt linh hoạt cho dữ liệu chuỗi Illumina
Tóm tắt
Động lực: Mặc dù đã có nhiều công cụ xử lý dữ liệu đọc từ giải trình tự thế hệ mới (NGS), chúng tôi vẫn không tìm thấy công cụ nào hoặc sự kết hợp của các công cụ đáp ứng yêu cầu của chúng tôi về tính linh hoạt, khả năng xử lý chính xác dữ liệu cặp đầu và hiệu suất cao. Chúng tôi đã phát triển Trimmomatic như một công cụ xử lý dữ liệu đầu vào linh hoạt và hiệu quả hơn, có khả năng xử lý chính xác dữ liệu cặp đầu.
Kết quả: Giá trị của việc xử lý dữ liệu đọc NGS đã được chứng minh cả trong các tác vụ dựa trên tham chiếu và không dựa trên tham chiếu. Trimmomatic cho thấy sản phẩm đầu ra ít nhất là ngang bằng, và trong nhiều trường hợp còn vượt trội hơn, so với các công cụ khác trong tất cả các kịch bản đã được kiểm nghiệm.
Tính khả dụng và triển khai: Trimmomatic được cấp phép theo GPL V3. Công cụ này có thể chạy trên nhiều nền tảng (cần Java 1.5+) và có sẵn tại http://www.usadellab.org/cms/index.php?page=trimmomatic
Liên hệ: [email protected]
Thông tin bổ sung: Dữ liệu bổ sung có sẵn trực tuyến tại Bioinformatics.
Từ khóa
Tài liệu tham khảo
Aronesty, 2013, Comparison of sequencing utility programs, Open Bioinform. J., 7, 1, 10.2174/1875036201307010001
Junier, 2010, The Newick utilities: high-throughput phylogenetic tree processing in the Unix shell, Bioinformatics, 26, 1669, 10.1093/bioinformatics/btq243
Li, 2009, Fast and accurate short read alignment with Burrows–Wheeler transform, Bioinformatics, 25, 1754, 10.1093/bioinformatics/btp324
Li, 2010, A survey of sequence alignment algorithms for next-generation sequencing, Brief. Bioinform., 11, 473, 10.1093/bib/bbq015
Li, 2013, The NGS WikiBook: a dynamic collaborative online training effort with long-term sustainability, Brief. Bioinform., 14, 548, 10.1093/bib/bbt045
Lindgreen, 2012, AdapterRemoval: easy cleaning of next generation sequencing reads, BMC Res. Notes, 5, 337, 10.1186/1756-0500-5-337
Mardis, 2008, Next-generation DNA sequencing methods, Annu. Rev. Genomics Hum. Genet., 9, 387, 10.1146/annurev.genom.9.081307.164359
Martin, 2011, Cutadapt removes adapter sequences from high-throughput sequencing reads, EMBnet. J., 17, 10, 10.14806/ej.17.1.200