PhyloHerb: Một quy trình phylogenomic hiệu suất cao để xử lý dữ liệu genome skimming

Applications in Plant Sciences - Tập 10 Số 3 - 2022
Liming Cai1,2,3, Hongrui Zhang3, Charles C. Davis3
1Department of Botany and Plant Sciences, University of California, Riverside, California, 92507 USA
2Department of Integrative Biology, University of Texas at Austin, Austin, Texas 78712, USA
3Harvard University Herbaria, 22 Divinity Avenue, Cambridge, Massachusetts, 02138 USA

Tóm tắt

Tóm tắtGiới thiệu

Việc áp dụng giải trình tự cao thông lượng, đặc biệt là đối với các mẫu herbaria, đang nhanh chóng thúc đẩy nghiên cứu đa dạng sinh học. Giải trình tự gen tổng thể với độ phủ thấp (genome skimming) là một phương pháp hứa hẹn và có thể đồng thời thu hồi các vùng ribosome plastid, ty thể và nhân ở hàng trăm loài. Ở đây, chúng tôi giới thiệu PhyloHerb, một quy trình sinh tin học nhằm lắp ráp hiệu quả các bộ dữ liệu phylogenomic được tạo ra từ việc genome skimming.

Phương pháp và Kết quả

PhyloHerb sử dụng một cơ sở dữ liệu tích hợp sẵn hoặc tham chiếu do người dùng chỉ định để trích xuất các trình tự orthologous từ cả ba hệ gen bằng cách tìm kiếm BLAST. Nó xuất ra các tệp FASTA và cung cấp một loạt các chức năng hữu ích để hỗ trợ căn chỉnh, phân vùng, nối ghép và suy diễn phylogeny. Chương trình có sẵn miễn phí tại https://github.com/lmcai/PhyloHerb/.

Kết luận

Chúng tôi chứng minh rằng PhyloHerb có thể xác định chính xác các gen bằng cách sử dụng một bộ dữ liệu đã được công bố từ họ Clusiaceae. Chúng tôi cũng cho thấy thông qua các mô phỏng rằng phương pháp của chúng tôi hiệu quả đối với các lắp ghép rất phân mảnh từ các mẫu herbaria và có thể mở rộng cho hàng nghìn loài.

Từ khóa


Tài liệu tham khảo

10.1111/bij.12642

Cai L. H.Zhang andC. C.Davis.2021. Herbariomics‐based biodiversity research: from specimen to phylogeny. Botany 2021: Annual Meeting of the Botanical Society of America held online [online abstract]. Website:https://2021.botanyconference.org/engine/search/index.php?func=detail%26aid=20[accessed 19 April 2022].

Dierckxsens N., 2017, NOVOPlasty: De novo assembly of organelle genomes from whole genome data, Nucleic Acids Research, 45, e18

10.1093/sysbio/syab053

10.1002/aps3.11410

10.3389/fevo.2019.00439

10.1186/s13059-020-02153-6

10.1086/297513

Gielly L., 1994, The use of chloroplast DNA to resolve plant phylogenies: Noncoding versus rbcL sequences, Molecular Biology and Evolution, 11, 769

10.1093/molbev/msp259

10.3389/fpls.2019.01761

10.3732/apps.1500026

10.1186/s13059-020-02154-5

10.1093/nar/gkn201

10.1093/sysbio/syy086

10.1093/molbev/mst010

10.1093/bioinformatics/btv184

Lanfear R., 2017, PartitionFinder 2: New methods for selecting partitioned models of evolution for molecular and morphological phylogenetic analyses, Molecular Biology and Evolution, 34, 772

10.1186/s12915-021-01166-2

10.1016/j.ympev.2021.107294

10.1016/j.ympev.2019.02.005

McKain M. andM.Wilson.2017. Fast‐Plast: Rapid de novo assembly and finishing for whole chloroplast genomes. Available on GitHub:https://github.com/mrmckain/Fast-Plast[accessed 19 April 2022].

10.1093/bioinformatics/btw583

10.1002/aps3.1038

10.1002/ecm.1307

10.1093/molbev/msaa015

10.1089/cmb.2014.0156

10.1186/s13007-019-0534-5

10.1002/ecm.1246

10.1073/pnas.79.16.5006

10.1186/s13007-019-0435-7

10.1186/1471-2148-14-23

10.1093/bioinformatics/btu033

10.3732/ajb.1100335

10.1093/molbev/msm092

10.1093/nar/gkx391

10.1073/pnas.1205818109

10.1038/nature12872