Một phương pháp tổng quát và đơn giản để tính toán R2 từ các mô hình hỗn hợp tuyến tính tổng quát

Methods in Ecology and Evolution - Tập 4 Số 2 - Trang 133-142 - 2013
Shinichi Nakagawa1,2, Holger Schielzeth3
1Department of Behavioral Ecology and Evolutionary Genetics Max Planck Institute for Ornithology Eberhard‐Gwinner‐Straße, 82319 Seewiesen Germany
2National Centre for Growth and Development, Department of Zoology, University of Otago, 340 Great King Street, Dunedin 9054, New Zealand
3Department of Evolutionary Biology Bielefeld University Morgenbreede 45, 33615, Bielefeld Germany

Tóm tắt

Tóm tắt

Việc sử dụng cả mô hình hỗn hợp tuyến tính và mô hình hỗn hợp tuyến tính tổng quát (LMMs và GLMMs) đã trở nên phổ biến không chỉ trong khoa học xã hội và y khoa mà còn trong khoa học sinh học, đặc biệt trong lĩnh vực sinh thái học và tiến hóa. Các tiêu chí thông tin, chẳng hạn như Tiêu chí Thông tin Akaike (AIC), thường được trình bày như các công cụ so sánh mô hình cho các mô hình hỗn hợp.

Tuy nhiên, việc trình bày ‘phương sai giải thích’ (R2) như một thống kê tóm tắt có liên quan của các mô hình hỗn hợp là điều hiếm gặp, mặc dù R2 thường được báo cáo cho các mô hình tuyến tính (LMs) và cả các mô hình tuyến tính tổng quát (GLMs). R2 có đặc tính cực kỳ hữu ích là cung cấp giá trị tuyệt đối cho độ khớp của một mô hình, điều mà các tiêu chí thông tin không thể cung cấp. Như một thống kê tóm tắt mô tả lượng phương sai được giải thích, R2 cũng có thể là một đại lượng có ý nghĩa sinh học.

Một lý do cho việc thiếu appreciation đối với R2 trong các mô hình hỗn hợp nằm ở thực tế rằng R2 có thể được định nghĩa theo nhiều cách khác nhau. Hơn nữa, hầu hết các định nghĩa của R2 cho các mô hình hỗn hợp có các vấn đề lý thuyết (ví dụ: giá trị R2 giảm hoặc âm trong các mô hình lớn hơn) và/hoặc việc sử dụng chúng gặp khó khăn với các vấn đề thực tiễn (ví dụ: việc thực hiện).

Tại đây, chúng tôi đề xuất tầm quan trọng của việc báo cáo R2 cho các mô hình hỗn hợp. Chúng tôi đầu tiên cung cấp các định nghĩa phổ biến của R2 cho LMs và GLMs và thảo luận về các vấn đề chính liên quan đến việc tính toán R2 cho các mô hình hỗn hợp. Sau đó, chúng tôi khuyến nghị một phương pháp tổng quát và đơn giản để tính toán hai loại R2 (marginal và conditional R2) cho cả LMMs và GLMMs, ít bị ảnh hưởng bởi các vấn đề thường gặp.

Phương pháp này được minh họa qua các ví dụ và có thể được sử dụng rộng rãi bởi các nhà nghiên cứu trong mọi lĩnh vực nghiên cứu, bất kể gói phần mềm nào được sử dụng để phù hợp với các mô hình hỗn hợp. Phương pháp được đề xuất có khả năng tạo điều kiện cho việc trình bày R2 cho nhiều hoàn cảnh khác nhau.

Từ khóa

#mô hình hỗn hợp #R2 #phân tích thống kê #sinh học #sinh thái học

Tài liệu tham khảo

Akaike H., 1973, 2nd International Symposium on Information Theory, 267

Bates D. Maechler M.&Bolker B.(2011)lme4: linear mixed‐effects models. R package version 0.999375‐42.http://CRAN.R-project.org/package=lme4.

10.1016/j.tree.2008.10.008

Bryk A.S., 1992, Hierarchical Linear Models

Burnham K.P., 2002, Model Selection and Multimodel Inference: A Practical Information‐Theoretic Approach

Cameron A.C., 1996, R‐squared measures for count data regression models with applications to health‐care utilization, Journal of Business & Economic Statistics, 14, 209

10.1016/S0304-4076(96)01818-0

Claeskens G., 2009, Model Selection and Model Averaging

10.1201/9781584887218

10.1086/661244

10.1002/9781118625590

10.1002/sim.3429

Gelman A., 2007, Data Analysis Using Regression and Multilevel/Hierarchical Models

10.1198/004017005000000517

10.1207/S15328031US0104_02

10.1111/j.1420-9101.2010.02210.x

10.18637/jss.v033.i02

Hamaker E.L., 2011, Handbook of Advanced Multilevel Analysis, 231

10.1016/j.jspi.2007.11.010

10.2307/2683704

10.1080/02664760802124422

10.1017/CBO9780511810176

10.2307/2685605

10.1136/jech.2004.028035

10.1136/jech.2004.023929

10.1093/biomet/78.3.691

10.1111/j.1469-185X.2007.00027.x

10.1111/j.1469-185X.2010.00141.x

10.1016/j.csda.2007.06.006

10.1007/978-1-4419-0318-1

R Development Core Team, 2012, R: A Language and Environment for Statistical Computing

10.2307/2112482

Roberts J.K., 2011, Handbook of Advanced Multilevel Analysis, 219

10.1111/j.2041-210X.2010.00012.x

10.1093/beheco/arn145

Schielzeth H., 2012, Nested by design: model fitting and interpretation in a mixed model era, Methods in Ecology and Evolution

10.1214/aos/1176344136

10.1177/0049124194022003004

Snijders T., 1999, Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling

10.1007/978-3-642-04898-2_387

10.1111/1467-9868.00353

10.1198/tast.2009.08210

10.2307/2532896

10.1002/sim.1572