Xác định các nguồn sai số trong ước lượng tần số alen từ DNA gộp chỉ ra thiết kế thí nghiệm tối ưu

Annals of Human Genetics - Tập 66 Số 5-6 - Trang 393-405 - 2002
Bryan J. Barratt1, Felicity Payne1, Helen Rance1, Sarah Nutland1, John A. Todd1, David Clayton1
1JDRF/WT Diabetes and Inflammation Laboratory, Cambridge Institute for Medical Research, University of Cambridge, Wellcome Trust/MRC Building, Hills Road, Cambridge, CB2 2XY, UK

Tóm tắt

Chi phí định gen vẫn cản trở việc phân tích một bản đồ SNP toàn diện trên hàng nghìn cá thể trong việc tìm kiếm các vị trí dễ bị bệnh. Ước lượng tần số alen trong các mẫu DNA từ các trường hợp và nhóm đối chứng cung cấp một giải pháp một phần, nhưng độ biến thiên trong những ước lượng này sẽ dẫn đến một số mất mát về sức mạnh thống kê. Tuy nhiên, chưa có nỗ lực hệ thống nào để định lượng các nguồn sai số trong các nghiên cứu trước đây. Chúng tôi báo cáo một phân tích về độ lớn của các thành phần biến thiên của từng giai đoạn thí nghiệm trong các nghiên cứu gộp DNA, và phát hiện rằng một thiết kế dựa trên việc hình thành nhiều nhóm nhỏ khoảng 50 cá thể là tốt hơn so với việc hình thành ít nhóm lớn hơn và tái hiện bất kỳ giai đoạn thí nghiệm nào. Chúng tôi kết luận rằng phương pháp này có thể giữ một kích thước mẫu hiệu quả lớn hơn 68% so với kích thước mẫu thực tế, trong khi cung cấp một sự giảm thiểu 60 lần trong việc sử dụng DNA và tiết kiệm hơn 30 lần về chi phí, so với định gen cá thể. Khả năng kết hợp việc gộp với việc lựa chọn có thông tin các SNP đánh dấu haplotype cũng được xem xét. Bằng cách này, có thể tiết kiệm hơn nữa về hiệu suất bằng cách sử dụng các ước lượng tần số alen gộp để suy diễn tần số haplotype và do đó, tần số alen tại các dấu hiệu chưa được phân loại.

Từ khóa


Tài liệu tham khảo