Các biến thể trình tự chính xác nên thay thế các đơn vị phân loại hoạt động trong phân tích dữ liệu gene đánh dấu
Tóm tắt
Những tiến bộ gần đây đã cho phép phân tích dữ liệu giải trình tự gene đánh dấu có độ thông lượng cao mà không cần phải xây dựng các đơn vị phân loại hoạt động phân tử (OTU) như thông thường: các cụm các đọc giải trình tự khác biệt dưới một ngưỡng khác biệt cố định. Các phương pháp mới kiểm soát lỗi đủ mức để các biến thể trình tự amplicon (ASV) có thể được phân giải chính xác, xuống đến cấp độ khác biệt một nucleotide trong vùng gene được giải trình tự. Những lợi ích của việc có độ phân giải tinh vi hơn trở nên rõ ràng ngay lập tức, và các lập luận cho các phương pháp ASV đã tập trung vào độ phân giải cải thiện của chúng. Ít rõ ràng hơn, nhưng chúng tôi tin rằng quan trọng hơn, là những lợi ích rộng lớn phát sinh từ tình trạng của ASV như là những nhãn nhất quán với ý nghĩa sinh học nội tại được xác định độc lập với cơ sở dữ liệu tài liệu tham khảo. Tại đây, chúng tôi thảo luận cách mà những đặc điểm này mang lại cho ASV những lợi thế kết hợp của OTU tham chiếu khép kín —bao gồm chi phí tính toán tỷ lệ với quy mô nghiên cứu, sự ghép đơn giản giữa các tập dữ liệu được xử lý độc lập, và dự đoán tiến về phía trước—và của OTU de novo —bao gồm đo lường độ đa dạng chính xác và khả năng áp dụng cho các cộng đồng thiếu phủ sóng sâu trong các cơ sở dữ liệu tài liệu tham khảo. Chúng tôi lập luận rằng những cải tiến về độ tái sử dụng, độ tái lập và tính toàn diện là đủ lớn để ASV nên thay thế OTU như là đơn vị tiêu chuẩn trong phân tích và báo cáo dữ liệu gene đánh dấu.
Từ khóa
Tài liệu tham khảo
Amir, 2017, Deblur rapidly resolves single-nucleotide community sequence patterns, mSystems, 2, e00191, 10.1128/mSystems.00191-16
Baxter, 2016, Microbiota-based model improves the sensitivity of fecal immunochemical test for detecting colonic lesions, Genome Med, 8, 37, 10.1186/s13073-016-0290-3
Berry, 2017, Are oligotypes meaningful ecological and phylogenetic units? A case study of Microcystis in freshwater lakes, Front Microbiol, 8, 365, 10.3389/fmicb.2017.00365
Bokulich, 2013, Quality-filtering vastly improves diversity estimates from Illumina amplicon sequencing, Nat Methods, 10, 57, 10.1038/nmeth.2276
Callahan, 2016, DADA2: high-resolution sample inference from Illumina amplicon data, Nat Methods, 13, 581, 10.1038/nmeth.3869
Callahan, 2016, Bioconductor workflow for microbiome data analysis: from raw reads to community analyses, F1000Res, 5, 1492, 10.12688/f1000research.8986.1
De Vargas, 2015, Eukaryotic plankton diversity in the sunlit ocean, Science, 348, 1261605, 10.1126/science.1261605
DiGiulio, 2015, Temporal and spatial variation of the human microbiota during pregnancy, Proc Natl Acad Sci USA, 112, 11060, 10.1073/pnas.1502875112
Edgar, 2015, Error filtering, pair assembly and error correction for next-generation sequencing reads, Bioinformatics, 31, 3476, 10.1093/bioinformatics/btv401
Edgar, 2016, UNOISE2: improved error-correction for Illumina 16 S and ITS amplicon sequencing, bioRxiv, 081257
Eren, 2013, Oligotyping: differentiating between closely related microbial taxa using 16 S rRNA gene data, Methods Ecol Evol, 4, 1111, 10.1111/2041-210X.12114
Eren, 2015, Minimum entropy decomposition: unsupervised oligotyping for sensitive partitioning of high-throughput marker gene sequences, ISME J, 9, 968, 10.1038/ismej.2014.195
Eren, 2016, Editorial: New insights into microbial ecology through subtle nucleotide variation, Front Microbiol, 7, 1318, 10.3389/fmicb.2016.01318
Kopylova, 2016, Open-source sequence clustering methods improve the state of the art, mSystems, 1, e00003, 10.1128/mSystems.00003-15
Kozich, 2013, Development of a dual-index sequencing strategy and curation pipeline for analyzing amplicon sequence data on the MiSeq Illumina sequencing platform, Appl Environ Microbiol, 79, 5112, 10.1128/AEM.01043-13
Mahé, 2015, Swarm v2: highly-scalable and high-resolution amplicon clustering, PeerJ, 3, e1420, 10.7717/peerj.1420
Needham, 2017, Ecological dynamics and co-occurrence among marine phytoplankton, bacteria and myoviruses shows microdiversity matters, ISME J, 11, 1614, 10.1038/ismej.2017.29
Rideout, 2014, Subsampled open-reference clustering creates consistent, comprehensive OTU definitions and scales to billions of sequences, PeerJ, 2, e545, 10.7717/peerj.545
Stackebrandt, 2006, Taxonomic parameters revisited: tarnished gold standards, Microbiology Today, 33, 152
Tikhonov, 2015, Interpreting 16 S metagenomic data without clustering to achieve sub-OTU resolution, ISME J, 9, 68, 10.1038/ismej.2014.117
Quince, 2011, Removing noise from pyrosequenced amplicons, BMC Bioinformatics, 12, 38, 10.1186/1471-2105-12-38