PhyloHerb: Một quy trình phylogenomic hiệu suất cao để xử lý dữ liệu genome skimming
Tóm tắt
Việc áp dụng giải trình tự cao thông lượng, đặc biệt là đối với các mẫu herbaria, đang nhanh chóng thúc đẩy nghiên cứu đa dạng sinh học. Giải trình tự gen tổng thể với độ phủ thấp (genome skimming) là một phương pháp hứa hẹn và có thể đồng thời thu hồi các vùng ribosome plastid, ty thể và nhân ở hàng trăm loài. Ở đây, chúng tôi giới thiệu PhyloHerb, một quy trình sinh tin học nhằm lắp ráp hiệu quả các bộ dữ liệu phylogenomic được tạo ra từ việc genome skimming.
PhyloHerb sử dụng một cơ sở dữ liệu tích hợp sẵn hoặc tham chiếu do người dùng chỉ định để trích xuất các trình tự orthologous từ cả ba hệ gen bằng cách tìm kiếm BLAST. Nó xuất ra các tệp FASTA và cung cấp một loạt các chức năng hữu ích để hỗ trợ căn chỉnh, phân vùng, nối ghép và suy diễn phylogeny. Chương trình có sẵn miễn phí tại
Chúng tôi chứng minh rằng PhyloHerb có thể xác định chính xác các gen bằng cách sử dụng một bộ dữ liệu đã được công bố từ họ Clusiaceae. Chúng tôi cũng cho thấy thông qua các mô phỏng rằng phương pháp của chúng tôi hiệu quả đối với các lắp ghép rất phân mảnh từ các mẫu herbaria và có thể mở rộng cho hàng nghìn loài.
Từ khóa
Tài liệu tham khảo
Cai L. H.Zhang andC. C.Davis.2021. Herbariomics‐based biodiversity research: from specimen to phylogeny. Botany 2021: Annual Meeting of the Botanical Society of America held online [online abstract]. Website:https://2021.botanyconference.org/engine/search/index.php?func=detail%26aid=20[accessed 19 April 2022].
Dierckxsens N., 2017, NOVOPlasty: De novo assembly of organelle genomes from whole genome data, Nucleic Acids Research, 45, e18
Gielly L., 1994, The use of chloroplast DNA to resolve plant phylogenies: Noncoding versus rbcL sequences, Molecular Biology and Evolution, 11, 769
Lanfear R., 2017, PartitionFinder 2: New methods for selecting partitioned models of evolution for molecular and morphological phylogenetic analyses, Molecular Biology and Evolution, 34, 772
McKain M. andM.Wilson.2017. Fast‐Plast: Rapid de novo assembly and finishing for whole chloroplast genomes. Available on GitHub:https://github.com/mrmckain/Fast-Plast[accessed 19 April 2022].