Ước lượng nhất quán trong ngẫu nhiên hóa Mendelian với một số công cụ không hợp lệ bằng cách sử dụng ước lượng trung vị có trọng số

Genetic Epidemiology - Tập 40 Số 4 - Trang 304-314 - 2016
Jack Bowden1, George Davey Smith1, Philip Haycock1, Stephen Burgess2
1Integrative Epidemiology Unit University of Bristol Bristol United Kingdom
2Department of Public Health and Primary Care, University of Cambridge, Cambridge, United Kingdom

Tóm tắt

TÓM TẮT

Các phát triển trong các nghiên cứu liên kết toàn genome và sự gia tăng khả năng truy cập dữ liệu tổng hợp liên kết di truyền đã làm cho việc áp dụng ngẫu nhiên hóa Mendelian trở nên tương đối đơn giản. Tuy nhiên, việc thu được các kết quả đáng tin cậy từ một cuộc điều tra ngẫu nhiên hóa Mendelian vẫn là một vấn đề, vì phương pháp trọng số nghịch biến cổ điển chỉ cho ra các ước lượng nhất quán nếu tất cả các biến thể di truyền trong phân tích đều là các biến số công cụ hợp lệ. Chúng tôi trình bày một ước lượng trung vị có trọng số mới để kết hợp dữ liệu về nhiều biến thể di truyền thành một ước lượng nguyên nhân duy nhất. Ước lượng này là nhất quán ngay cả khi tới 50% thông tin đến từ các biến số công cụ không hợp lệ. Trong một phân tích mô phỏng, nó cho thấy có tỷ lệ lỗi loại 1 mẫu hữu hạn tốt hơn so với phương pháp trọng số nghịch biến, và bổ sung cho phương pháp hồi quy MR‐Egger (ngẫu nhiên hóa Mendelian‐Egger) được đề xuất gần đây. Trong các phân tích về các tác động nguyên nhân của cholesterol lipoprotein mật độ thấp và cholesterol lipoprotein mật độ cao đối với nguy cơ bệnh động mạch vành, phương pháp trọng số nghịch biến cho thấy một tác động nguyên nhân của cả hai phân đoạn lipid, trong khi các phương pháp hồi quy trung vị có trọng số và MR‐Egger cho thấy một tác động null của cholesterol lipoprotein mật độ cao tương ứng với bằng chứng thực nghiệm. Cả phương pháp dựa trên trung vị và hồi quy MR‐Egger nên được xem xét như các phân tích nhạy cảm cho các cuộc điều tra ngẫu nhiên hóa Mendelian với nhiều biến thể di truyền.

Từ khóa


Tài liệu tham khảo

10.1093/ije/dym186

10.1002/sim.2487

10.1093/ije/dyv080

10.1201/b18084

10.1093/ije/dyr036

10.1002/gepi.21758

10.1093/aje/kwv017

10.1007/s10654-015-0011-z

CARDIoGRAMplusC4D Consortium, 2013, Large‐scale association analysis identifies new risk loci for coronary artery disease, Nat Genet, 45, 25, 10.1038/ng.2480

10.1111/j.1365-2125.2003.02060.x

10.1093/ije/dyg070

10.1093/ije/dyh132

10.1136/bmj.330.7499.1076

10.1093/hmg/ddu328

10.1001/jama.2009.1619

10.1177/0962280206077743

10.1038/ng.2795

10.1111/j.0006-341X.2000.00455.x

10.1136/bmj.315.7109.629

10.1093/ije/dyt110

10.1038/ng.2797

10.1093/aje/kwr323

10.1002/sim.6522

10.1093/ije/29.4.722

10.1016/j.econlet.2008.09.004

10.1097/01.ede.0000135174.63482.43

10.1093/eurheartj/eht571

JohnsonT.2013.Efficient calculation for multi‐SNP genetic risk scores. Technical report The Comprehensive R Archive Network. Available athttp://cran.r‐project.org/web/packages/gtx/vignettes/ashg2012.pdf[last accessed 2014/11/19].

10.1080/01621459.2014.994705

Kolesár M, 2014, Identification and inference with many invalid instruments, J Bus Econ Stat

10.1002/sim.3034

10.1371/journal.pone.0002986

10.1097/01.ede.0000215160.88317.cb

10.1093/aje/kwj062

Pedersen TR, 1994, Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the Scandinavian Simvastatin Survival Study (4S), Lancet, 344, 1383

PickrellJ.2015.Detection and interpretation of shared genetic influences on 40 human traits. Technical report bioRxiv. Available athttp://biorxiv.org/content/early/2015/04/16/018150.

10.1093/aje/kwt084

10.1056/NEJMoa1206797

10.1016/j.annepidem.2006.12.005

10.1016/S0140-6736(12)60312-2

WindmeijerF FarbmacherH DaviesN Davey SmithG WhiteI.2015.Selecting (in)valid instruments for instrumental variables estimation. Available athttp://www.hec.unil.ch/documents/seminars/iems/1849.pdf.