Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Biểu diễn trò chơi hỗn loạn để so sánh toàn bộ bộ gen
Tóm tắt
Biểu diễn trò chơi hỗn loạn của các chuỗi gen đã được sử dụng để thể hiện hình ảnh các mẫu chuỗi gen cũng như so sánh không dựa trên căn chỉnh các chuỗi gen dựa trên tần suất oligonucleotid. Tuy nhiên, tiềm năng của biểu diễn này trong việc thực hiện các so sánh dựa trên căn chỉnh giữa các chuỗi gen toàn phần vẫn chưa được tận dụng. Chúng tôi trình bày một thuật toán nhanh để xác định tất cả các căn chỉnh cục bộ giữa hai chuỗi DNA dài bằng cách sử dụng thông tin chuỗi chứa trong các điểm CGR. Các căn chỉnh cục bộ có thể được thể hiện dưới dạng đồ họa trong biểu đồ ma trận chấm hoặc dưới dạng văn bản, và các điểm tương đồng và khác biệt đáng kể giữa hai chuỗi có thể được xác định. Chúng tôi thể hiện phương pháp này thông qua việc so sánh các bộ gen toàn bộ của một số loài vi sinh vật. Với hai bộ gen có liên quan chặt chẽ, chúng tôi tạo ra thông tin về các điểm không khớp, chèn, xóa và xáo trộn phân biệt hai bộ gen này. Việc bổ sung khả năng căn chỉnh chuỗi quy mô lớn vào bộ ứng dụng phân tích chuỗi không dựa trên căn chỉnh của biểu diễn trò chơi hỗn loạn đã đưa CGR trở thành một công cụ phân tích chuỗi mạnh mẽ.
Từ khóa
#biểu diễn trò chơi hỗn loạn #so sánh bộ gen #căn chỉnh cục bộ #phân tích chuỗi #vi sinh vậtTài liệu tham khảo
Jeffrey HJ: Chaos game representation of gene structure. Nucleic Acids Res 1990, 18(8):2163–2170.
Basu S, Pan A, Dutta C, Das J: Mathematical characterization of chaos game representation. New algorithms for nucleotide sequence analysis. J Mol Biol 1992, 228: 715–719. 10.1016/0022-2836(92)90857-G
Hill KA, Schisler NJ, Singh SM: Chaos game representation of coding regions of human globin genes and alcohol dehydrogenase genes of phylogenetically divergent species. J Mol Evol 1992, 35: 261–269. 10.1007/BF00178602
Oliver JL, Bernaola-Galvan P, Guerrero G, Roman-Roldan R: Entropic profiles of DNA sequences through chaos-game-derived images. J Theor Biol 1993, 160(4):457–470. 10.1006/jtbi.1993.1030
Deschavanne PJ, Giron A, Vilain J, Fagot G, Fertil B: Genomic signature: characterization and classification of species assessed by chaos game representation of sequences. Mol Biol Evol 1999, 16(10):1391–1399.
Goldman N: Nucleotide, dinucleotide and trinucleotide frequencies explain patterns observed in chaos game representations of DNA sequences. Nucleic Acids Res 1993, 21: 2487–2491.
Almeida JS, Carrico JA, Maretzek A, Noble PA, Fletcher M: Analysis of genomic sequences by chaos game representation. Bioinformatics 2001, 17(5):429–437. 10.1093/bioinformatics/17.5.429
Wang Y, Hill K, Singh S, Kari L: The spectrum of genomic signatures: from di-nucleotides to chaos game representation. Gene 2005, 346: 173–185. 10.1016/j.gene.2004.10.021
Kurtz S, Phillippy A, Delcher AL, Smoot M, Shumway M, Antonescu C, Salzberg SL: Versatile and open software for comparing large genomes. Genome Biology 2004, 5: R12. 10.1186/gb-2004-5-2-r12
Ning Z, Cox AJ, Mullikin JC: SSAHA: a fast search method for large DNA databases. Genome Res 2001, 11: 1725–1729. 10.1101/gr.194201
Bray N, Dubchak I, Pachter L: AVID: A global alignment program. Genome Res 2003, 13(1):7–102. 10.1101/gr.789803
Schwartz S, Kent JW, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W: Human-Mouse Alignments with BLASTZ. Genome Res 2003, 13: 103–107. 10.1101/gr.809403
