Ước lượng sự pha trộn cá nhân: Các cân nhắc về phân tích và thiết kế nghiên cứu
Tóm tắt
Genome của một cá thể có sự pha trộn đại diện cho sự kết hợp của các alen từ các nguồn gốc khác nhau. Tại Hoa Kỳ, hai nhóm dân tộc thiểu số lớn nhất, người Mỹ gốc Phi và người La tinh, đều có đặc điểm pha trộn. Việc hiểu tỷ lệ pha trộn ở cấp độ cá nhân (sự pha trộn cá nhân, hay IA) là rất có giá trị cho cả các nhà di truyền học quần thể và các nhà dịch tễ học, những người tiến hành nghiên cứu liên kết kiểm soát trường hợp trong các nhóm này. Tại đây, chúng tôi trình bày một phần mở rộng của phương pháp tần suất trước đây được mô tả (cực đại khả năng hoặc ML) để ước lượng sự pha trộn cá nhân cho phép có sự không chắc chắn trong các tần số alen tổ tiên. Chúng tôi so sánh phương pháp này với các phương pháp dựa trên khả năng một phần trước đó cũng như các phương pháp MCMC Bayes gần đây được mô tả. Phương pháp ML đầy đủ của chúng tôi cho thấy sự ổn định cao hơn khi so với một phương pháp ML một phần hiện có. Các mô phỏng cũng cho thấy rằng ước lượng tần suất này đạt hiệu suất tương tự, được đo bằng tiêu chí sai số bình phương trung bình, như các phương pháp Bayes nhưng chỉ cần một phần nhỏ thời gian tính toán để tạo ra các ước lượng điểm, cho phép phân tích sâu rộng (ví dụ, các mô phỏng) không thể thực hiện bằng các phương pháp Bayes. Kết quả mô phỏng của chúng tôi cho thấy rằng việc bao gồm các quần thể tổ tiên hoặc đại diện của chúng trong phân tích là cần thiết đối với bất kỳ phương pháp ước lượng IA nào để có được các kết quả hợp lý. Genet. Epidemiol. © 2005 Wiley‐Liss, Inc.
Từ khóa
Tài liệu tham khảo
Dempster AP, 1977, Maximum likelihood from incomplete data via the EM algorithm, JRSS B, 39, 1
Shriver MD, 1997, Ethnic‐affiliation estimation by use of population‐specific DNA markers, Am J Hum Genet, 60, 957
Wang J, 2003, Maximum‐likelihood estimation of admixture proportions from genetic data, Genetics, 164, 747, 10.1093/genetics/164.2.747