Phân Loại Bayesian Điện Biên Để Gán Nhanh Trình Tự rRNA Vào Hệ Thống Phân Loại Vi Khuẩn Mới

Applied and Environmental Microbiology - Tập 73 Số 16 - Trang 5261-5267 - 2007
Qiong Wang1,2, George M Garrity3,4, James M. Tiedje3,4, James R. Cole1,2
1Center for Microbial Ecology 1 and Department of Microbiology and Molecular Genetics,
2Center for Microbial Ecology, Michigan State University, East Lansing, MI 48824.
3Center for Microbial Ecology
4Department of Microbiology and Molecular Genetics, Michigan State University, East Lansing, Michigan 48824

Tóm tắt

TÓM TẮT

Dự án Cơ Sở Dữ Liệu Ribosome (RDP) với bộ phân loại Bayesian đơn giản có thể nhanh chóng và chính xác phân loại các trình tự 16S rRNA của vi khuẩn vào hệ thống phân loại cấp cao hơn mới được đề xuất trong Bản phác thảo phân loại vi khuẩn của Bergey (Ấn bản thứ 2, phát hành 5.0, Springer-Verlag, New York, NY, 2004). Nó cung cấp các phân công phân loại từ miền xuống chi, với ước tính độ tin cậy cho mỗi gán. Phần lớn các phân loại (98%) có độ tin cậy ước tính cao (≥95%) và độ chính xác cao (98%). Ngoài việc được kiểm tra với tập hợp gồm 5,014 chuỗi chủng kiểu từ bản phác thảo của Bergey, bộ phân loại RDP đã được kiểm tra với tập hợp 23,095 trình tự rRNA được phân chia bởi NCBI vào hệ thống phân loại cấp cao hơn thay thế. Kết quả từ các thử nghiệm bỏ đi một lần trên cả hai tập hợp cho thấy rằng độ chính xác tổng thể ở mọi cấp độ tin cậy cho các đoạn gần hoàn chỉnh và đoạn dài 400 base là từ 89% trở lên xuống đến cấp chi, và phần lớn lỗi phân loại dường như do sự bất thường trong các hệ thống phân loại hiện tại. Đối với các đoạn rRNA ngắn hơn, chẳng hạn như những đoạn có thể được tạo ra bằng phương pháp pyrosequencing, tỷ lệ lỗi thay đổi lớn trên chiều dài của gene 16S rRNA, với các đoạn quanh các vùng biến V2 và V4 cho tỷ lệ lỗi thấp nhất. Bộ phân loại RDP phù hợp cho cả phân tích trình tự rRNA đơn lẫn phân tích các thư viện chứa hàng nghìn trình tự. Một công cụ liên quan khác, RDP Library Compare, đã được phát triển để tạo điều kiện so sánh cộng đồng vi sinh vật dựa trên các thư viện chuỗi gene 16S rRNA. Nó kết hợp bộ phân loại RDP với một bài kiểm tra thống kê để đánh dấu các taxon được biểu hiện khác nhau giữa các mẫu. Bộ phân loại RDP và RDP Library Compare đều có sẵn trực tuyến tại http://rdp.cme.msu.edu/ .

Từ khóa

#Bộ phân loại RDP #rRNA 16S #phân loại vi khuẩn #biến V2 và V4 #pyrosequencing #so sánh cộng đồng vi sinh vật #biểu hiện khác biệt giữa các mẫu.

Tài liệu tham khảo

10.1111/j.1472-765X.1991.tb00608.x

10.1101/gr.7.10.986

10.1093/nar/28.1.15

RNA modeling using stochastic context-free grammars. 1999

10.1093/oxfordjournals.molbev.a026231

10.1186/1471-2105-3-2

Christensen, H. B. 1992. Introduction to statistics: a calculus-based approach, 1st ed., p. 510-512. Harcourt Brace Jovanovich, Inc., Orlando, FL.

10.1093/nar/gki038

10.1016/j.ijfoodmicro.2004.08.016

10.1093/bioinformatics/btg200

Domingos, P., and M. Pazzani. 1997. On the optimality of the simple Bayesian classifier under zero-one loss. Machine Learning29:103-130.

Bergey's manual of systematic bacteriology 2001

Bergey's manual of systematic bacteriology 2004

10.1099/ijs.0.63300-0

Karavaĭko, G. I., T. P. Turova, I. A. Tsaplina, and T. I. Bogdanova. 2000. The phylogenetic position of aerobic, moderately thermophilic bacteria of the Sulfobacillus species, oxidizing Fe2+, S0 and sulfide minerals. Mikrobiologiia69:857-860.

Li, Y. H., and A. K. Jain. 1998. Classification of text documents. Comput. J.41:537-546.

10.1128/AEM.71.12.8228-8235.2005

10.1093/nar/22.17.3485

10.1128/AEM.68.8.3673-3682.2002

10.1093/nar/21.13.3025

10.1101/gr.186401

10.1128/AEM.67.9.4374-4376.2001

10.1073/pnas.0605127103

Stackebrandt, E., W. Frederiksen, G. M. Garrity, P. A. D. Grimont, P. Kämpfer, M. C. J. Maiden, X. Nesme, R. Rosselló-Mora, J. Swings, H. G. Trüper, L. Vauterin, A. C. Ward, and W. B. Whitman. 2002. Report of the ad hoc committee for the re-evaluation of the species definition in bacteriology. Int. J. Syst. Evol. Microbiol.52:1043-1047.

Turova, T. P., A. B. Poltoraus, I. A. Lebedeva, E. S. Bulygina, I. A. Tsaplina, T. I. Bogdanova, and G. I. Karavaiko. 1995. Determination of the phylogenetic position of Sulfobacillus thermosulfidooxidans on the basis of analysis of the 5S and 16S ribosomal RNA. Mikrobiologiia64:366-374.

10.1093/nar/28.1.10

10.1099/00207713-42-2-263

10.1073/pnas.87.12.4576