Các phương pháp đơn giản để cải thiện khả năng giải thích của các hệ số hồi quy

Methods in Ecology and Evolution - Tập 1 Số 2 - Trang 103-113 - 2010
Holger Schielzeth1
1University of Uppsala -Sweden > > > >

Tóm tắt

Tóm tắt

1. Các mô hình hồi quy tuyến tính là một công cụ thống kê quan trọng trong các nghiên cứu tiến hóa và sinh thái. Thật không may, những mô hình này thường cho ra những ước lượng và kiểm nghiệm giả thuyết không thể giải thích được, đặc biệt là khi các mô hình bao gồm sự tương tác hoặc các hạng tử đa thức. Hơn nữa, các sai số chuẩn cho các nhóm điều trị, mặc dù thường được quan tâm trong việc đưa vào một ấn phẩm, lại không có sẵn trực tiếp trong mô hình hồi quy tuyến tính chuẩn.

2. Việc trung tâm hóa và chuẩn hóa các biến đầu vào là những phương pháp đơn giản để cải thiện khả năng giải thích của các hệ số hồi quy. Hơn nữa, việc sửa lại mô hình với cấu trúc mô hình hơi thay đổi cho phép rút ra các sai số chuẩn thích hợp cho các nhóm điều trị trực tiếp từ mô hình.

3. Việc trung tâm hóa sẽ làm cho các hiệu ứng chính có thể giải thích về mặt sinh học ngay cả khi có liên quan đến các sự tương tác, do đó tránh được sự diễn giải sai có thể xảy ra của các hiệu ứng chính. Điều này cũng áp dụng cho việc ước lượng các hiệu ứng tuyến tính trong sự hiện diện của các đa thức. Các biến đầu vào phân loại cũng có thể được trung tâm hóa và điều này đôi khi hỗ trợ cho việc giải thích.

4. Việc chuẩn hóa (z‐biến đổi) các biến đầu vào sẽ dẫn đến việc ước lượng độ dốc chuẩn hóa hoặc các hệ số hồi quy phần chuẩn hóa. Các độ dốc chuẩn hóa có thể so sánh được về độ lớn trong các mô hình cũng như giữa các nghiên cứu. Chúng có một số lợi thế hơn các hệ số tương quan phần và thường là kích thước tác động chuẩn hóa thú vị hơn.

5. Việc loại bỏ một cách suy nghĩ các giao điểm hoặc hiệu ứng chính cho phép rút ra các trung bình điều trị hoặc độ dốc điều trị và các sai số chuẩn thích hợp của chúng trực tiếp từ một mô hình hồi quy tuyến tính. Điều này cung cấp một lựa chọn đơn giản thay thế cho việc tính sai số chuẩn phức tạp hơn từ các tương phản và các hiệu ứng chính.

6. Các phương pháp đơn giản được trình bày ở đây tập trung vào ước lượng tham số (ước lượng điểm cũng như khoảng tin cậy) hơn là vào ngưỡng ý nghĩa. Chúng cho phép điều chỉnh các mô hình phức tạp nhưng có nghĩa có thể được trình bày và giải thích một cách ngắn gọn. Các phương pháp được trình bày cũng có thể áp dụng cho các mô hình hồi quy tuyến tính tổng quát (GLM) và các mô hình hồi quy hỗn hợp tuyến tính.

Từ khóa


Tài liệu tham khảo

Aiken L.S., 1991, Multiple Regression: Testing and Interpreting Interactions

10.1111/j.1558-5646.1984.tb00344.x

10.1037/1082-989X.8.2.129

10.3102/10769986031002157

10.1016/j.tree.2008.10.008

Bowerman B.L., 1990, Linear Statistical Models: An Appllied Approach

10.2307/2684719

10.2307/2685045

10.1016/S0169-5347(00)89117-X

10.1037/0033-2909.114.3.542

Burnham K.P., 2002, Model Selection and Multimodel Inference: A Practical Information‐Theoretic Approach

10.1080/15459620802225481

10.1016/j.anbehav.2005.01.016

Faraway J.J., 2005, Linear Models in R

10.1093/beheco/arp137

10.1214/009053604000001048

10.1002/sim.3107

Gelman A., 2007, Data Analysis Using Regression and Multilevel/Hierarchical Models

10.1002/sim.4780090609

10.1207/S15327906MBR3501_1

Johnson C.R., 1936, Tests of certain linear hypothesis and their appplication in some educational problems, Statistical Research Memoirs, 1, 57

10.2307/2111095

10.2307/2285760

10.1111/j.1469-185X.2007.00027.x

10.1111/j.1469-185X.2009.00083.x

Neter J., 1996, Applied Linear Statistical Models

10.1111/j.1420-9101.2007.01300.x

10.1086/503331

10.1016/j.anbehav.2008.11.006

10.1017/CBO9780511806384

R Development Core Team, 2009, R: A Language and Environment for Statistical Computing

10.1093/beheco/arn145

Shipley B., 2000, Cause and Correlation in Biology: A User’s Guide to Path Analysis, Strutural Equations and Causal Inference, 10.1017/CBO9780511605949

10.1073/pnas.94.2.549

10.1016/j.tree.2006.12.003

Tabachnick B.G., 2006, Unsing Multivariate Statistics

10.1093/genetics/3.4.367

Zar J.H., 1999, Biostatistical Analysis