Fasta2Structure: công cụ thân thiện với người dùng để chuyển đổi nhiều tệp FASTA đã căn chỉnh sang định dạng STRUCTURE

BMC Bioinformatics - Tập 25 - Trang 1-8 - 2024
Adam Bessa-Silva1
1Laboratório de Evolução, Universidade Federal do Pará, Bragança, Brazil

Tóm tắt

Phần mềm STRUCTURE đã trở nên phổ biến như một công cụ cho phân tích cấu trúc quần thể và gen. Tuy nhiên, việc định dạng dữ liệu để đáp ứng các yêu cầu cụ thể của STRUCTURE có thể là một thách thức và dễ mắc lỗi, đặc biệt là khi xử lý dữ liệu từ nhiều locut. Bài báo này nhấn mạnh việc tạo ra một ứng dụng giao diện người dùng đồ họa (GUI) được thiết kế để đơn giản hóa quy trình chuyển đổi nhiều căn chỉnh chuỗi thành một tệp duy nhất và đồng nhất, phù hợp với phần mềm STRUCTURE. Ứng dụng này được phát triển bằng cách sử dụng Tkinter cho GUI và Biopython cho việc xử lý các tệp FASTA. Chương trình này xử lý các tệp, xác định các vị trí biến đổi và chuyển đổi chuỗi sang định dạng nhị phân. Sau đó, các chuỗi được nối lại và hiển thị trong khu vực văn bản của giao diện đồ họa, cho phép người dùng xem xét và xác nhận các kết quả. Hơn nữa, chương trình lưu trữ các kết quả đã nối lại trong một tệp, cung cấp đầu vào sẵn sàng để sử dụng cho phần mềm STRUCTURE. Ứng dụng này cung cấp một giải pháp hiệu quả và đáng tin cậy cho việc chuyển đổi nhiều tệp FASTA đã căn chỉnh sang một tệp định dạng nhị phân đã nối lại, tương thích với phần mềm STRUCTURE. Với giao diện đồ họa thân thiện với người dùng và cách tiếp cận giảm thiểu lỗi, công cụ này cho thấy giá trị thiết thực đối với các nhà nghiên cứu tham gia vào phân tích cấu trúc quần thể và gen.

Từ khóa

#phân tích cấu trúc quần thể #phần mềm STRUCTURE #FASTA #chuyển đổi định dạng #ứng dụng giao diện người dùng đồ họa #Biopython.

Tài liệu tham khảo

Frankham R, Ballou JD, Briscoe DA. Introduction to conservation genetics. Cambridge: Cambridge University Press; 2010. Allendorf FW, Hohenlohe PA, Luikart G. Genomics and the future of conservation genetics. Nat Rev Genet. 2013;11(10):697–709. Avise JC. Phylogeography: retrospect and prospect. J Biogeogr. 2009;36(1):3–15. Ellegren H. Genome sequencing and population genomics in non-model organisms. Trends Ecol Evol. 2014;29(1):51–63. Pritchard JK, Stephens M, Donnelly P. Inference of population structure using multilocus genotype data. Genetics. 2000;155(2):945–59. Evanno G, Regnaut S, Goudet J. Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study. Mol Ecol. 2005;14(8):2611–20. Lawson DJ, Hellenthal G, Myers S, Falush D. Inference of population structure using dense haplotype data. PLoS Genet. 2018;8(1):e1002453. Lischer HEL, Excoffier L. PGDSpider: an automated data conversion tool for connecting population genetics and genomics programs. Bioinformatics. 2012;28(2):298–9. Glaubitz JC, Casstevens TM, Lu F, Harriman J, Elshire RJ, Sun Q, Buckler ES. TASSEL-GBS: a high capacity genotyping by sequencing analysis pipeline. PLoS ONE. 2014;9(2):e90346. Mori GM, Zucchi MI, Sampaio I, Souza AP. Species distribution and introgressive hybridization of two Avicennia species from the Western Hemisphere unveiled by phylogeographic patterns. BMC Evol Biol. 2015;15(1):1–15. Mardis ER. The impact of next-generation sequencing technology on genetics. Trends Genet. 2008;24(3):133–41. Metzker ML. Sequencing technologies—the next generation. Nat Rev Genet. 2010;11(1):31–46. Lundh F. Python standard library. Sebastopol: O’Reilly Media, Inc.; 1999. Python Software Foundation. Tkinter—GUI Programming in Python. Documentation. Python 3.5. https://docs.python.org/3/library/tkinter.html Cock PJ, Antao T, Chang JT, Chapman BA, Cox CJ, Dalke A, Friedberg I, Hamelryck T, Kauff F, Wilczynski B, de Hoon MJ. Biopython: freely available Python tools for computational molecular biology and bioinformatics. Bioinformatics. 2009;25(11):1422–3. https://doi.org/10.1093/bioinformatics/btp163. Luikart G, England PR, Tallmon D, Jordan S, Taberlet P. The power and promise of population genomics: from genotyping to genome typing. Nat Rev Genet. 2003;4(12):981–94.