Máy Chủ RAST: Phân Tích Nhanh Sử Dụng Công Nghệ Subsystems

Springer Science and Business Media LLC - Tập 9 - Trang 1-15 - 2008
Ramy K Aziz1,2, Daniela Bartels3, Aaron A Best4, Matthew DeJongh4, Terrence Disz5,3, Robert A Edwards6,5, Kevin Formsma4, Svetlana Gerdes6, Elizabeth M Glass5, Michael Kubal3, Folker Meyer5,3, Gary J Olsen7,5, Robert Olson5,3, Andrei L Osterman6,8, Ross A Overbeek6, Leslie K McNeil9, Daniel Paarmann3, Tobias Paczian3, Bruce Parrello6, Gordon D Pusch6,3, Claudia Reich9, Rick Stevens5,3, Olga Vassieva6, Veronika Vonstein6, Andreas Wilke3, Olga Zagnitko6
1University of Tennessee Health Science Center, Memphis, USA
2Department of Microbiology and Immunology, Cairo University, Cairo, Egypt
3Computation Institute, University of Chicago, Chicago, USA
4Hope College, Holland, USA
5Mathematics and Computer Science Division, Argonne National Laboratory, Argonne, USA
6Fellowship for Interpretation of Genomes, Burr Ridge, USA
7Department of Microbiology, University of Illinois at Urbana-Champaign, Urbana, USA
8The Burnham Institute, San Diego, USA
9National Center for Supercomputing Applications, University of Illinois at Urbana-Champaign, Urbana, USA

Tóm tắt

Số lượng chuỗi gen prokaryote có sẵn đang tăng lên một cách đều đặn và nhanh hơn khả năng của chúng tôi để chú thích chính xác chúng. Chúng tôi mô tả một dịch vụ hoàn toàn tự động để chú thích gen của vi khuẩn và sinh vật cổ. Dịch vụ xác định các gen mã hóa protein, gen rRNA và tRNA, phân công chức năng cho các gen, dự đoán các hệ con nào được đại diện trong bộ gen, sử dụng thông tin này để tái tạo mạng lưới chuyển hóa và làm cho đầu ra dễ dàng tải về cho người dùng. Ngoài ra, bộ gen đã được chú thích có thể được duyệt trong một môi trường hỗ trợ phân tích so sánh với các bộ gen đã được chú thích được duy trì trong môi trường SEED. Dịch vụ này thường sẽ cung cấp bộ gen đã được chú thích trong vòng 12–24 giờ sau khi nộp, nhưng cuối cùng chất lượng của dịch vụ như vậy sẽ được đánh giá dựa trên độ chính xác, tính nhất quán và tính đầy đủ của các chú thích được sản xuất. Chúng tôi tóm tắt những nỗ lực của mình để giải quyết những vấn đề này và thảo luận về kế hoạch nâng cấp dịch vụ theo từng giai đoạn. Bằng cách cung cấp chú thích chính xác, nhanh chóng miễn phí cho cộng đồng, chúng tôi đã tạo ra một tài nguyên cộng đồng quan trọng. Dịch vụ này hiện đã được hơn 120 người dùng bên ngoài sử dụng để chú thích hơn 350 bộ gen khác nhau.

Từ khóa

#gen prokaryote #chuỗi gen #chú thích tự động #vi khuẩn #sinh vật cổ #protein #rRNA #tRNA #mạng lưới chuyển hóa.

Tài liệu tham khảo

Meyer F, Goesmann A, McHardy AC, Bartels D, Bekel T, Clausen J, Kalinowski J, Linke B, Rupp O, Giegerich R, et al: GenDB – an open source genome annotation system for prokaryote genomes. Nucleic Acids Res. 2003, 31 (8): 2187-2195. 10.1093/nar/gkg312.

Van Domselaar GH, Stothard P, Shrivastava S, Cruz JA, Guo A, Dong X, Lu P, Szafron D, Greiner R, Wishart DS: BASys: a web server for automated bacterial genome annotation. Nucleic Acids Res. 2005, W455-459. 10.1093/nar/gki593. 33 Web Server

Bryson K, Loux V, Bossy R, Nicolas P, Chaillou S, van de Guchte M, Penaud S, Maguin E, Hoebeke M, Bessieres P, et al: AGMIAL: implementing an annotation strategy for prokaryote genomes as a distributed system. Nucleic Acids Res. 2006, 34 (12): 3533-3545. 10.1093/nar/gkl471.

Vallenet D, Labarre L, Rouy Z, Barbe V, Bocs S, Cruveiller S, Lajus A, Pascal G, Scarpelli C, Medigue C: MaGe: a microbial genome annotation system supported by synteny results. Nucleic Acids Res. 2006, 34 (1): 53-65. 10.1093/nar/gkj406.

Moriya Y, Itoh M, Okuda S, Yoshizawa AC, Kanehisa M: KAAS: an automatic genome annotation and pathway reconstruction server. Nucleic Acids Res. 2007, W182-185. 10.1093/nar/gkm321. 35 Web Server

Manatee. [http://manatee.sourceforge.net]

Overbeek R, Begley T, Butler RM, Choudhuri JV, Chuang HY, Cohoon M, de Crecy-Lagard V, Diaz N, Disz T, Edwards R, et al: The subsystems approach to genome annotation and its use in the project to annotate 1000 genomes. Nucleic Acids Res. 2005, 33 (17): 5691-5702. 10.1093/nar/gki866.

The SEED framework for comparative genomics. [http://www.theseed.org]

The Project to Annotate 1000 Genomes. [http://www.theSEED.org/wiki/Annotating_1000_genomes]

Tatusov RL, Natale DA, Garkavtsev IV, Tatusova TA, Shankavaram UT, Rao BS, Kiryutin B, Galperin MY, Fedorova ND, Koonin EV: The COG database: new developments in phylogenetic classification of proteins from complete genomes. Nucleic Acids Res. 2001, 29 (1): 22-28. 10.1093/nar/29.1.22.

Wu CH, Nikolskaya A, Huang H, Yeh LS, Natale DA, Vinayaka CR, Hu ZZ, Mazumder R, Kumar S, Kourtesis P: PIRSF: family classification system at the Protein Information Resource. Nucleic Acids Res. 2004, D112-114. 10.1093/nar/gkh097. 32 Database

Kanehisa M, Goto S: KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 2000, 28 (1): 27-30. 10.1093/nar/28.1.27.

Haft DH, Loftus BJ, Richardson DL, Yang F, Eisen JA, Paulsen IT, White O: TIGRFAMs: a protein family resource for the functional identification of proteins. Nucleic Acids Res. 2001, 29 (1): 41-43. 10.1093/nar/29.1.41.

Overbeek R, Bartels D, Vonstein V, Meyer F: Annotation of bacterial and archaeal genomes: improving accuracy and consistency. Chem Rev. 2007, 107 (8): 3431-3447. 10.1021/cr068308h.

Lowe TM, Eddy SR: tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Res. 1997, 25 (5): 955-964. 10.1093/nar/25.5.955.

Delcher AL, Harmon D, Kasif S, White O, Salzberg SL: Improved microbial gene identification with GLIMMER. Nucleic Acids Res. 1999, 27 (23): 4636-4641. 10.1093/nar/27.23.4636.

KAAS – KEGG Automatic Annotation Server. [http://www.genome.jp/kegg/kaas/]

The Annotation Clearinghouse. [http://clearinghouse.nmpdr.org]

TIGR's Comprehensive Microbial Resource. [http://cmr.tigr.org]

Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Wheeler DL: GenBank. Nucleic Acids Res. 2007, D21-25. 10.1093/nar/gkl986. 35 Database

The metagenomics RAST server. [http://metagenomics.nmpdr.org]