REGANOR

Springer Science and Business Media LLC - Tập 5 - Trang 193-198 - 2012
Burkhard Linke1, Alice C. McHardy2, Heiko Neuweger1, Lutz Krause1, Folker Meyer1
1CeBiTec/BRF, Universität Bielefeld, Bielefeld, Germany
2IBM Thomas J. Watson Research Center, Yorktown Heights, USA

Tóm tắt

Với hơn 1000 dự án giải mã gen của sinh vật prokaryotic đang diễn ra hoặc đã hoàn thành, phân tích so sánh toàn diện về nội dung gen của những bộ gen này đã trở nên khả thi. Để cho phép một phân tích so sánh có ý nghĩa, dự đoán gen của các bộ gen khác nhau cần phải chính xác nhất có thể. Rõ ràng rằng việc cải thiện tình trạng chú thích gen cần các phương pháp xác định gen tự động để đối phó với ảnh hưởng của các artefact, chẳng hạn như nội dung GC của bộ gen. Hiện tại vẫn còn chỗ cho việc cải thiện tình trạng chú thích. Chúng tôi trình bày một máy chủ web và một cơ sở dữ liệu các dự đoán gen chất lượng cao. Máy chủ web này là nguồn tài nguyên cho việc xác định gen trong các chuỗi gen prokaryote. Nó triển khai phương pháp tìm gen chính xác REGANOR mà chúng tôi đã mô tả trước đó. Chúng tôi cũng cung cấp các dự đoán gen mới cho 241 bộ gen prokaryotic hoàn chỉnh hoặc gần hoàn chỉnh. Chúng tôi chứng minh cách mà nguồn tài nguyên này có thể dễ dàng được sử dụng để xác định những ứng viên đầy hứa hẹn cho các gen hiện đang thiếu từ các chú thích bộ gen với một số ví dụ. Tất cả các bộ dữ liệu đều có sẵn trực tuyến.

Từ khóa

#gen prokaryote #dự đoán gen #chú thích gen #phương pháp xác định gen #REGANOR

Tài liệu tham khảo

GOLD™ genomes online database v 2.0 [online]. Available from URL: http://www.genomesonline.org [Accessed 2006 Jun 21] Kyrpides NC, Ouzounis CA, Iliopoulos I, et al. Analysis of the Thermotoga maritima genome combining a variety of sequence similarity and genome context tools. Nucleic Acids Res 2000 Nov 15; 28(22): 4573–6 Dandekar T, Huynen M, Regula JT, et al. Re-annotating the Mycoplasma pneumoniae genome sequence: adding value, function and reading frames. Nucleic Acids Res 2000 Sep 1; 28(17): 3278–88 Daraselia N, Dernovoy D, Tian Y, et al. Reannotation of Shewanella oneidensis genome. OMICS 2003; 7(2): 171–5 Kolker E, Picone AF, Galperin MY, et al. Global profiling of Shewanella oneidensis MR-1: expression of hypothetical genes and improved functional annotations. Proc Natl Acad Sci U S A 2005 Feb 8; 102(6): 2099–104 Overbeek R, Begley T, Butler R, et al. The subsystems approach to genome annotation and its use in the project to annotate 1000 genomes. Nucleic Acids Res 2005 Oct 7; 33(17): 5691–702 McHardy AC, Goesmann A, Pühler A, et al. Development of joint application strategies for two microbial gene finders. Bioinformatics 2004 Jul 10; 20(10): 1622–31 Delcher AL, Harmon D, Kasif S, et al. Improved microbial gene identification with GLIMMER. Nucleic Acids Res 1999 Dec 1; 27(23): 4636–41 Badger JH, Olsen GJ. CRITICA: coding region identification tool invoking comparative analysis. Mol Biol Evol 1999 Apr; 16(4): 512–24 Osterman A, Overbeek R. Missing genes in metabolic pathways: a comparative genomics approach. Curr Opin Chem Biol 2003 Apr; 7(2): 238–51 Meyer F, Goesmann A, McHardy AC, et al. GenDB: an open source genome annotation system for prokaryote genomes. Nucleic Acids Res 2003 Apr 15; 31(8): 2187–95 Besemer J, Lomsadze A, Borodovsky M. GeneMarkS: a self-training method for prediction of gene starts in microbial genomes: implications for finding sequence motifs in regulatory regions. Nucleic Acids Res 2001 Jun 15; 29(12): 2607–1 Larsen TS, Krogh A. Easygene: a prokaryotic gene finder that ranks ORFs by statistical significance. BMC Bioinformatics 2003 Jun 3; 4: 21 Bocs S, Cruveiller S, Vallenet D, et al. AMIGene: annotation of Microbial Genes. Nucleic Acids Res 2003 Jul 1; 31(13): 3723–6 Guo FB, Ou HY, Zhang CT. ZCURVE: a new system for recognizing protein-coding genes in bacterial and archaeal genomes. Nucleic Acids Res 2003 Mar 15; 31(6): 1780–9 Mahony S, Mclnerney JO, Smith TJ, et al. Gene prediction using the self-organizing map: automatic generation of multiple gene models. BMC Bioinformatics 2004 Mar 5; 5: 23 Frishman D, Mironov A, Mewes HW, et al. Combining diverse evidence for gene recognition in completely sequenced bacterial genomes. Nucleic Acids Res 1998; 26: 2941–7 Shibuya T, Rigoutsos I. Dictionary-driven prokaryotic gene finding. Nucleic Acids Res 2002 Jun 15; 30(12): 2710–25 Lowe TM, Eddy SR. tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Res 1997 Mar 1; 25(5): 955–64 Altschul SF, Madden TL, Schaffer AA, et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res 1997 Sep 1; 25(17): 3389–402 GFF format [online]. Available from URL: http://www.sanger.ac.uk/Software/formats/GFF/ [Accessed 2006 Jun 21] Overbeek RA, Disz T, Stevens RL. The SEED: a peer-to-peer environment for genome annotation. Communications of the ACM 2004; 47: 46–51 Xie G, Keyhani NO, Bonner CA, et al. Ancient origin of the tryptophan operon and the dynamics of evolutionary change. Microbiol Mol Biol Rev 2003 Sep; 67(3): 303–42 Ivanova N, Sorokin A, Anderson I, et al. Related articles: genome sequence of Bacillus cereus and comparative analysis with Bacillus anthracis. Nature 2003 May 1; 423(6935): 87–91 Read TD, Peterson SN, Tourasse N, et al. The genome sequence of Bacillus anthracis Ames and comparison to closely related bacteria. Nature 2003 May 1; 423(6935): 81–6