Ước lượng sự pha trộn cá nhân: Các cân nhắc về phân tích và thiết kế nghiên cứu

Genetic Epidemiology - Tập 28 Số 4 - Trang 289-301 - 2005
Hua Tang1, Jie Peng2, Pei Wang2, Neil Risch3,4
1Division of Public Health Sciences, Fred Hutchinson Cancer Research Center, Seattle, Washington
2Department of Statistics, Stanford University, Stanford, California
3Department of Genetics, Stanford University, Stanford, California
4Division of Research, Kaiser Permanente, Oakland, California

Tóm tắt

Tóm tắt

Genome của một cá thể có sự pha trộn đại diện cho sự kết hợp của các alen từ các nguồn gốc khác nhau. Tại Hoa Kỳ, hai nhóm dân tộc thiểu số lớn nhất, người Mỹ gốc Phi và người La tinh, đều có đặc điểm pha trộn. Việc hiểu tỷ lệ pha trộn ở cấp độ cá nhân (sự pha trộn cá nhân, hay IA) là rất có giá trị cho cả các nhà di truyền học quần thể và các nhà dịch tễ học, những người tiến hành nghiên cứu liên kết kiểm soát trường hợp trong các nhóm này. Tại đây, chúng tôi trình bày một phần mở rộng của phương pháp tần suất trước đây được mô tả (cực đại khả năng hoặc ML) để ước lượng sự pha trộn cá nhân cho phép có sự không chắc chắn trong các tần số alen tổ tiên. Chúng tôi so sánh phương pháp này với các phương pháp dựa trên khả năng một phần trước đó cũng như các phương pháp MCMC Bayes gần đây được mô tả. Phương pháp ML đầy đủ của chúng tôi cho thấy sự ổn định cao hơn khi so với một phương pháp ML một phần hiện có. Các mô phỏng cũng cho thấy rằng ước lượng tần suất này đạt hiệu suất tương tự, được đo bằng tiêu chí sai số bình phương trung bình, như các phương pháp Bayes nhưng chỉ cần một phần nhỏ thời gian tính toán để tạo ra các ước lượng điểm, cho phép phân tích sâu rộng (ví dụ, các mô phỏng) không thể thực hiện bằng các phương pháp Bayes. Kết quả mô phỏng của chúng tôi cho thấy rằng việc bao gồm các quần thể tổ tiên hoặc đại diện của chúng trong phân tích là cần thiết đối với bất kỳ phương pháp ước lượng IA nào để có được các kết quả hợp lý. Genet. Epidemiol. © 2005 Wiley‐Liss, Inc.

Từ khóa


Tài liệu tham khảo

10.1007/s00439-004-1125-7

10.1126/science.296.5566.261b

10.1093/genetics/158.3.1347

10.1086/377138

Dempster AP, 1977, Maximum likelihood from incomplete data via the EM algorithm, JRSS B, 39, 1

10.1007/978-1-4899-4541-9

10.1111/j.1365-294X.2005.02553.x

10.1002/ajpa.1330700404

10.2337/diacare.14.7.618

10.1007/978-0-387-21606-5

10.1086/375613

10.1093/bioinformatics/18.2.337

10.1038/nbt869

10.1016/0304-4149(82)90011-4

10.1093/genetics/127.2.417

10.1086/377137

10.1111/j.1365-294X.2006.02908.x

10.1002/gepi.10319

10.1086/420871

10.1111/j.1365-294X.2004.02396.x

10.1093/bioinformatics/13.3.235

10.1126/science.1078311

10.1086/380416

Shriver MD, 1997, Ethnic‐affiliation estimation by use of population‐specific DNA markers, Am J Hum Genet, 60, 957

10.1086/420856

Wang J, 2003, Maximum‐likelihood estimation of admixture proportions from genetic data, Genetics, 164, 747, 10.1093/genetics/164.2.747

10.1016/S0065-2660(01)42016-5

10.1086/421329

10.1517/phgs.4.4.431.22758