lme4qtl: các mô hình hỗn hợp tuyến tính với cấu trúc hiệp phương sai linh hoạt cho các nghiên cứu di truyền về những cá nhân có liên quan

BMC Bioinformatics - Tập 19 - Trang 1-5 - 2018
Andrey Ziyatdinov1, Miquel Vázquez-Santiago2,3, Helena Brunel2, Angel Martinez-Perez2, Hugues Aschard1,4, Jose Manuel Soria2
1Department of Epidemiology, Harvard T.H. Chan School of Public Health, Boston, United States of America
2Unitat de Genòmica de Malalties Complexes, Institut d’Investigació Biomèdica Sant Pau (IIB-Sant Pau), Barcelona, Spain
3Unitat d’Hemostàsia i Trombosi, Hospital de la Santa Creu i Sant Pau, Barcelona, Spain
4Centre de Bioinformatique, Biostatistique et Biologie Intégrative (C3BI), Institut Pasteur, Paris, France

Tóm tắt

Bản đồ tính trạng định lượng (QTL) trong dữ liệu di truyền thường liên quan đến việc phân tích các quan sát có tương quan, điều này cần được tính đến để tránh tín hiệu liên kết giả. Thông thường, việc này được thực hiện bằng cách mô hình hóa các tương quan này như là các hiệu ứng ngẫu nhiên trong các mô hình hỗn hợp tuyến tính (LMMs). Gói R lme4 là một công cụ được công nhận rộng rãi thực hiện các tính năng chính của LMM bằng cách sử dụng các phương pháp ma trận thưa; tuy nhiên, nó chưa hoàn toàn được điều chỉnh cho các nghiên cứu liên kết và liên kết QTL. Cụ thể, hai tính năng LMM còn thiếu trong phiên bản cơ bản của lme4: định nghĩa các hiệu ứng ngẫu nhiên bằng các ma trận hiệp phương sai tùy chỉnh; và các ràng buộc tham số, rất cần thiết trong các mô hình QTL nâng cao. Ngoài các ứng dụng trong các nghiên cứu liên kết của những cá nhân có mối liên hệ, các tính năng như vậy rất được quan tâm trong các nghiên cứu liên kết trong các tình huống mà nhiều ma trận hiệp phương sai cần được mô hình hóa, một tình huống không được nhiều phần mềm nghiên cứu liên kết toàn bộ gen (GWAS) bao phủ. Để giải quyết những hạn chế đã đề cập, chúng tôi đã phát triển một gói R mới lme4qtl như một phần mở rộng của lme4. Đầu tiên, lme4qtl đóng góp các mô hình mới cho các nghiên cứu di truyền trong một công cụ duy nhất tích hợp với lme4 và các gói hỗ trợ của nó. Thứ hai, lme4qtl cung cấp một khung linh hoạt cho các tình huống với nhiều cấp độ liên quan và đạt hiệu quả khi các ma trận hiệp phương sai thưa. Chúng tôi đã chứng minh giá trị của gói của mình bằng cách sử dụng dữ liệu thực tế từ dự án Phân tích Di truyền về Thrombophilia Nguồn Gốc Vô Căn 2 (GAIT2). Phần mềm của chúng tôi lme4qtl cho phép các mô hình bản đồ QTL với cấu trúc hiệu ứng ngẫu nhiên đa dạng và tính toán hiệu quả cho các hiệp phương sai thưa. lme4qtl có sẵn tại https://github.com/variani/lme4qtl .

Từ khóa


Tài liệu tham khảo

Lynch M, Walsh B, et al. Genetics and analysis of quantitative traits, vol 1. MA: Sinauer Sunderland; 1998. Almasy L, Blangero J. Multipoint quantitative-trait linkage analysis in general pedigrees. Am J Human Genet. 1998; 62(5):1198–211. Kang HM, Zaitlen NA, Wade CM, Kirby A, Heckerman D, Daly MJ, Eskin E. Efficient control of population structure in model organism association mapping. Genetics. 2008; 178(3):1709–23. Yang J, Zaitlen NA, Goddard ME, Visscher PM, Price AL. Advantages and pitfalls in the application of mixed-model association methods. Nat Genet. 2014; 46(2):100–6. Lippert C, Listgarten J, Liu Y, Kadie CM, Davidson RI, Heckerman D. FaST linear mixed models for genome-wide association studies. Nat Methods. 2011; 8(10):833–7. Zhou X, Stephens M. Genome-wide efficient mixed-model analysis for association studies. Nat Genet. 2012; 44(7):821–4. Blangero J, Diego VP, Dyer TD, Almeida M, Peralta J, Kent Jr JW, Williams JT, Almasy L, Göring HHH. A kernel of truth: statistical advances in polygenic variance component models for complex human pedigrees. Adv Genet. 2013; 81:1. Gilmour AR, Gogel BJ, Cullis BR, Thompson R, Butler D, et al. ASReml user guide release 3.0. UK: VSN International Ltd, Hemel Hempstead; 2009. Loh P-R, Bhatia G, Gusev A, Finucane HK, Bulik-Sullivan BK, Pollack SJ, de Candia TR, Lee SH, Wray NR, Kendler KS, et al. Contrasting genetic architectures of schizophrenia and other complex diseases using fast variance-components analysis. Nat Genet. 2015; 47(12):1385. Martin-Fernandez L, Ziyatdinov A, Carrasco M, Millon JA, Martinez-Perez A, Vilalta N, Brunel H, Font M, Hamsten A, Souto JC, et al. Genetic determinants of thrombin generation and their relation to venous thrombosis: results from the GAIT-2 project”. PloS ONE. 2016; 11(1):e0146922. Blangero J. Statistical genetic approaches to human adaptability. Hum Biol. 2009; 81(5):523–46. Perdry H, Dandine-Roulland C. Gaston: Genetic Data Handling (QC, GRM, LD, PCA) & Linear Mixed Models. 2017. https://CRAN.R-project.org/package=gaston. R package version 1.5. Vazquez AI, Bates DM, Rosa GJM, Gianola D, Weigel KA. Technical note: an r package for fitting generalized linear mixed models in animal breeding. J Anim Sci. 2010; 88(2):497–504. Bates D, Mächler M, Bolker B, Walker S. Fitting linear mixed-effects models using lme4. J Stat Softw. 2015; 67(1):1–48. Scheipl F, Greven S, Kuechenhoff H. Size and power of tests for a zero random effect variance or polynomial regression in additive and linear mixed models. Comput Stat Data Anal. 2008; 52(7):3283–99. Kuznetsova A, Bruun Brockhoff P, Haubo Bojesen Christensen R. lmerTest: Tests in Linear Mixed Effects Models. 2016. https://CRAN.R-project.org/package=lmerTest. R package version 2.0-33. Harville DA, Callanan TP. Computational aspects of likelihood-based inference for variance components. In: Advances in statistical methods for genetic improvement of livestock. Springer: 1990. p. 136–76. Weihong Tang, Schwienbacher C, Lopez LM, Ben-Shlomo Y, Oudot-Mellakh T, Johnson AD, Samani NJ, Basu S, Gögele M, Davies G, et al. Genetic associations for activated partial thromboplastin time and prothrombin time, their gene expression profiles, and risk of coronary artery disease. Am J Hum Genet. 2012; 91(1):152–62. Andrey Ziyatdinov HelenaBrunel Angel Martinez-Perez. Alexandre Perera, and Jose Manuel Soria. solarius: an R interface to SOLAR for variance component analysis in pedigrees. Bioinformatics. 2016; 32(12):1901–2. Therneau TM. coxme: Mixed Effects Cox Models. 2015. https://CRAN.R-project.org/package=coxme. R package version 2.2-5. Github. https://github.com/lme4/lme4. Last accessed 27 Jan 2017.