Mô hình thành phần cấu trúc phân cấp cho phân tích đường dẫn của các biến thể chung
Tóm tắt
Các nghiên cứu liên kết toàn bộ genome (GWAS) đã được sử dụng rộng rãi để xác định các biến thể di truyền liên quan đến kiểu hình bằng nhiều phương pháp thống kê, như hồi quy logistic và hồi quy tuyến tính. Tuy nhiên, các SNP được xác định bởi GWAS, với mức độ ý nghĩa thống kê chặt chẽ, chỉ giải thích một phần nhỏ tổng thể di truyền ước tính. Để giải quyết vấn đề "di truyền bị thiếu" này, phân tích dựa trên gene và con đường, cùng với các cơ chế sinh học, đã được sử dụng cho nhiều nghiên cứu GWAS. Tuy nhiên, nhiều phương pháp này thường bỏ qua sự tương quan giữa các gene và giữa các con đường.
Chúng tôi đã xây dựng một mô hình thành phần phân cấp xem xét các mối tương quan giữa các gene và giữa các con đường. Dựa trên mô hình này, chúng tôi đề xuất một phương pháp phân tích đường dẫn mới cho các tập dữ liệu GWAS, Mô hình Thành phần Cấu trúc Phân cấp để Phân tích Đường dẫn của Các Biến thể Chung (HisCoM-PCA). HisCoM-PCA đầu tiên tổng hợp các biến thể chung của từng gene, trước ở mức gene, và sau đó phân tích tất cả các con đường đồng thời bằng cách sử dụng phương pháp phạt kiểu ridge cả hiệu ứng gene và con đường đối với kiểu hình. Độ ý nghĩa thống kê của các hệ số gene và con đường có thể được kiểm tra bằng các bài kiểm tra hoán đổi.
Từ khóa
Tài liệu tham khảo
Xue A, Wu Y, Zhu Z, Zhang F, Kemper KE, Zheng Z, Yengo L, Lloyd-Jones LR, Sidorenko J, Wu Y. Genome-wide association analyses identify 143 risk variants and putative regulatory mechanisms for type 2 diabetes. Nat Commun. 2018;9(1):2941.
Costanzo M, Baryshnikova A, Bellay J, Kim Y, Spear ED, Sevier CS, Ding H, Koh JL, Toufighi K, Mostafavi S. The genetic landscape of a cell. Science. 2010;327(5964):425–31.
Yoon S, Nguyen HCT, Yoo YJ, Kim J, Baik B, Kim S, Kim J, Kim S, Nam D. Efficient pathway enrichment and network analysis of GWAS summary data using GSA-SNP2. Nucleic Acids Res. 2018;46(10):e60.
Zhang K, Cui S, Chang S, Zhang L, Wang J. i-GSEA4GWAS: a web server for identification of pathways/gene sets associated with traits by applying an improved gene set enrichment analysis to genome-wide association study. Nucleic Acids Res. 2010;38(suppl_2):W90–5.
Segrè AV, Groop L, Mootha VK, Daly MJ, Altshuler D, Consortium D, Investigators M. Common inherited variation in mitochondrial genes is not enriched for associations with type 2 diabetes or related glycemic traits. PLoS Genet. 2010;6(8):e1001058.
Alexa A, Rahnenführer J, Lengauer T. Improved scoring of functional groups from gene expression data by decorrelating GO graph structure. Bioinformatics. 2006;22(13):1600–7.
Lee S, Choi S, Kim YJ, Kim B-J, Consortium Td-G, Hwang H, Park T. Pathway-based approach using hierarchical components of collapsed rare variants. Bioinformatics. 2016;32(17):i586–94.
Cho YS, Go MJ, Kim YJ, Heo JY, Oh JH, Ban H-J, Yoon D, Lee MH, Kim D-J, Park M. A large-scale genome-wide association study of Asian populations uncovers genetic factors influencing eight quantitative traits. Nat Genet. 2009;41(5):527.
Kanehisa M, Goto S, Kawashima S, Okuno Y, Hattori M. The KEGG resource for deciphering the genome. Nucleic Acids Res. 2004;32(suppl_1):D277–80.
Zhang H, Wheeler W, Hyland PL, Yang Y, Shi J, Chatterjee N, Yu K. A powerful procedure for pathway-based meta-analysis using summary statistics identifies 43 pathways associated with type II diabetes in European populations. PLoS Genet. 2016;12(6):e1006122.
de Leeuw CA, Mooij JM, Heskes T, Posthuma D. MAGMA: generalized gene-set analysis of GWAS data. PLoS Comput Biol. 2015;11(4):e1004219.
Almasy L, Dyer TD, Peralta JM, Kent JW, Charlesworth JC, Curran JE, Blangero J. Genetic Analysis Workshop 17 mini-exome simulation. BMC Proceedings. 2011;5:S2.
Lim J, Koh I, Cho YS. Identification of genetic loci stratified by diabetic status and microRNA related SNPs influencing kidney function in Korean populations. Genes Genomics. 2016;38(7):601–9.
Jin H-S, Hong K-W, Lim J-E, Oh B. Replication of an African-American GWAS on blood pressure and hypertension in the Korean population. Genes Genomics. 2011;33(2):127.
De Leeuw J, Young FW, Takane Y. Additive structure in qualitative data: an alternating least squares method with optimal scaling features. Psychometrika. 1976;41(4):471–503.
Lee S, Choi S, Qiao D, Cho M, Silverman EK, Park T, Won S. WISARD: workbench for integrated superfast association studies for related datasets. BMC Med Genet. 2018;11(2):39.
Consortium GP. A map of human genome variation from population-scale sequencing. Nature. 2010;467(7319):1061.
Ingenuity Pathways Analysis software. http://www.ingenuity.com. Accessed 2 Apr 2019.
Chang CC, Chow CC, Tellier LC, Vattikuti S, Purcell SM, Lee JJ. Second-generation PLINK: rising to the challenge of larger and richer datasets. Gigascience. 2015;4(1):7.
Browning BL, Zhou Y, Browning SR. A one-penny imputed genome from next-generation reference panels. Am J Hum Genet. 2018;103(3):338–48.
Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM. A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3. Fly. 2012;6(2):80–92.
Hodgkin M, Hills C, Squires P. The calcium-sensing receptor and insulin secretion: a role outside systemic control 15 years on. J Endocrinol. 2008;199(1):1–4.
Scheen AJ. Prevention of type 2 diabetes mellitus through inhibition of the renin-angiotensin system. Drugs. 2004;64(22):2537–65.
Manna P, Jain SK. Phosphatidylinositol-3, 4, 5-triphosphate and cellular signaling: implications for obesity and diabetes. Cell Physiol Biochem. 2015;35(4):1253–75.
Han W, Li C. Linking type 2 diabetes and Alzheimer’s disease. Proc Natl Acad Sci. 2010;107(15):6557–8.
Luchsinger JA, Gustafson DR. Adiposity, type 2 diabetes, and Alzheimer’s disease. J Alzheimers Dis. 2009;16(4):693–704.
Chan KHK, Huang Y-T, Meng Q, Wu C, Reiner A, Sobel EM, Tinker L, Lusis AJ, Yang X, Liu S. Shared molecular pathways and gene networks for cardiovascular disease and type 2 diabetes mellitus in women across diverse ethnicities. Circ Cardiovasc Genet. 2014;7(6):911–9.
Al-Maskari MY, Waly MI, Ali A, Al-Shuaibi YS, Ouhtit A. Folate and vitamin B12 deficiency and hyperhomocysteinemia promote oxidative stress in adult type 2 diabetes. Nutrition. 2012;28(7–8):e23–6.
Thomas MK, Rastalsky N, Lee JH, Habener JF. Hedgehog signaling regulation of insulin production by pancreatic beta-cells. Diabetes. 2000;49(12):2039–47.
Adragna NC, Lauf PK. K–cl cotransport function and its potential contribution to cardiovascular disease. Pathophysiology. 2007;14(3–4):135–46.
Kraja AT, Hunt SC, Rao D, Dávila-Román VG, Arnett DK, Province MA. Genetics of hypertension and cardiovascular disease and their interconnected pathways: lessons from large studies. Curr Hypertens Rep. 2011;13(1):46–54.
Schober E, Rami B, Grabert M, Thon A, Kapellen T, Reinehr T, Holl R. Phenotypical aspects of maturity-onset diabetes of the young (MODY diabetes) in comparison with type 2 diabetes mellitus (T2DM) in children and adolescents: experience from a large multicentre database. Diabet Med. 2009;26(5):466–73.
Misawa K, Nitta Y, Matsubara T, Oe K, Kiyama M, Shimizu M, Mabuchi H. Difference in coronary blood flow dynamics between patients with hypertension and those with hypertrophic cardiomyopathy. Hypertens Res. 2002;25(5):711–6.