Tại sao chúng ta vẫn sử dụng mô hình bước trong sinh thái và hành vi?

Journal of Animal Ecology - Tập 75 Số 5 - Trang 1182-1189 - 2006
Mark J. Whittingham1,2, Philip A. Stephens1,2, Richard B. Bradbury3, Robert P. Freckleton4
1Department of Mathematics, University of Bristol, University Walk, Bristol BS8 1TW, UK
2Division of Biology, School of Biology and Psychology, Ridley Building, University of Newcastle, Newcastle Upon Tyne, NE1 7RU, UK
3Royal Society for the Protection of Birds, The Lodge, Sandy, Bedfordshire SG19 2DL, UK
4Department of Animal and Plant Sciences, University of Sheffield, Sheffield S10 2TN, UK

Tóm tắt

Tóm tắt

Các thiên lệch và thiếu sót của hồi quy bội từng bước đã được thiết lập rõ trong tài liệu thống kê. Tuy nhiên, việc xem xét các bài báo được xuất bản vào năm 2004 bởi ba tạp chí sinh thái và hành vi hàng đầu cho thấy việc sử dụng kỹ thuật này vẫn rất phổ biến: trong số 65 bài báo sử dụng phương pháp hồi quy bội, 57% nghiên cứu đã sử dụng phương pháp từng bước.

Những nhược điểm chính của hồi quy bội từng bước bao gồm thiên lệch trong ước lượng tham số, sự không nhất quán giữa các thuật toán lựa chọn mô hình, một vấn đề cố hữu (nhưng thường bị bỏ qua) liên quan đến việc kiểm định giả thuyết nhiều lần, và sự chú trọng hoặc phụ thuộc không thích hợp vào một mô hình tốt nhất duy nhất. Chúng tôi thảo luận về từng vấn đề này kèm theo ví dụ.

Chúng tôi sử dụng một ví dụ cụ thể về dữ liệu phân bố chim vàng tây thu thập trong 4 năm để làm nổi bật những cạm bẫy của hồi quy từng bước. Chúng tôi chỉ ra rằng hồi quy từng bước cho phép các mô hình chứa các biến dự đoán có ý nghĩa được thu thập từ dữ liệu của từng năm. Mặc dù các mô hình được chọn có ý nghĩa, chúng thay đổi đáng kể giữa các năm và cho thấy những mẫu hình trái ngược với những gì được xác định khi phân tích tập dữ liệu đầy đủ trong 4 năm.

Một phân tích lý thuyết thông tin (IT) của tập dữ liệu về chim vàng tây minh họa lý do tại sao các kết quả khác nhau của các phân tích từng bước lại phát sinh. Cụ thể, phương pháp IT xác định số lượng lớn các mô hình cạnh tranh có thể mô tả dữ liệu một cách tương đương, cho thấy rằng không có một mô hình nào nên được tin cậy để đưa ra kết luận.

Từ khóa


Tài liệu tham khảo

10.1109/TAC.1974.1100705

10.2307/3803199

10.1046/j.1365-2664.2000.00552.x

10.1007/978-1-4757-2917-7

Burnham K.P., 2002, Model Selection and Multimodel Inference: a Practice Information‐Theoretic Approach

10.17763/haer.48.3.t490261645281841

10.1201/b15238

Cohen J., 1994, The earth is round (P < 0·05), American Psychologist, 49, 997, 10.1037/0003-066X.49.12.997

Cohen J., 1983, Applied Multiple Regression/Correlation Analysis for the Behavioural Sciences

10.1111/j.2044-8317.1992.tb00992.x

Draper N., 1981, Applied Regression Analysis

10.1016/j.tree.2003.11.004

Grafen A., 2002, Modern Statistics for the Life Sciences

10.2193/0022-541X(2005)069[0457:ITIWSC]2.0.CO;2

10.2307/2685338

10.1111/j.0021-8901.2004.00899.x

10.2307/3802789

10.1016/j.tree.2003.10.013

10.1007/978-1-4899-3242-6

10.2307/1267425

10.1890/04-0823

10.1111/j.0021-8901.2004.00903.x

10.1111/j.1365-2664.2005.01002.x

10.1016/S0895-4356(99)00103-1

10.1111/j.1365-2664.2005.01007.x

10.1037/0033-2909.86.1.168

10.1111/j.1523-1739.2003.00614.x