Hiểu rõ độ chính xác của suy diễn haplotype thống kê với dữ liệu chuỗi có phase đã biết
Tóm tắt
Các phương pháp thống kê để suy diễn haplotype từ kiểu gen đa điểm của những cá thể không có quan hệ có ứng dụng quan trọng trong nghiên cứu liên kết và di truyền học quần thể. Việc hiểu rõ các yếu tố ảnh hưởng đến độ chính xác của suy diễn này là rất quan trọng, nhưng việc đánh giá đã bị hạn chế bởi sự sẵn có hạn chế của dữ liệu sinh học với phase đã biết. Chúng tôi đã tạo ra các dòng tế bào lai đơn bội cho nhiễm sắc thể người 19 và sản xuất các chuỗi hoàn chỉnh đơn nhiễm sắc thể của một vùng gen 48 kb trên 39 cá thể có nguồn gốc Phi Mỹ (AA) và Mỹ gốc châu Âu (EA). Chúng tôi sử dụng những kiểu gen đã biết phase này và các mô phỏng đồng biến để đánh giá độ chính xác của sự tái tạo haplotype thống kê bằng một số thuật toán. Độ chính xác của suy diễn phase là rất thấp trong dữ liệu sinh học của chúng tôi ngay cả đối với các vùng ngắn như 25–50 kb, cho thấy sự thận trọng là cần thiết khi phân tích các haplotype đã tái tạo. Hơn nữa, độ tin cậy của ước lượng sự tự tin trong suy diễn phase không đủ cao để cho phép việc kết hợp đáng tin cậy thông tin về sự không chắc chắn theo vị trí trong các phân tích tiếp theo. Chúng tôi cho thấy rằng, trong các mẫu có nguồn gốc hỗn hợp nhất định (các quần thể AA và EA), có lẽ haplotype chính xác nhất được thu được khi tăng kích thước mẫu bằng cách xem xét mẫu ghép lớn nhất, mặc dù có những vấn đề lý thuyết liên quan đến việc ghép các mẫu không đồng nhất đó. Các chiến lược để cải thiện sự tự tin trong các haplotype đã tái tạo và các phương án thực tế thay thế cho phân tích các haplotype suy diễn được thảo luận.
Từ khóa
Tài liệu tham khảo
Clark AG, 1990, Inference of haplotypes from PCR‐amplified samples of diploid populations, Mol Biol Evol, 7, 111
Excoffier L, 1995, Maximum‐likelihood estimation of molecular haplotype frequencies in a diploid population, Mol Biol Evol, 12, 921
Long JC, 1995, An E‐M algorithm and testing strategy for multiple‐locus haplotypes, Am J Hum Genet, 56, 799
Stephens JC, 1990, Theoretical underpinning of the single‐molecule‐dilution. SMD. method of direct haplotype resolution, Am J Hum Genet, 46, 1149