Tính toán hiệu quả hằng số chuẩn của mô hình tự logistic và các mô hình liên quan trên trụ và lưới
Tóm tắt
Với động lực từ mô hình tự logistic cho việc phân tích dữ liệu nhị phân không gian trên lưới hai chiều, chúng tôi phát triển các phương pháp tính toán hiệu quả để tính toán hằng số chuẩn cho các mô hình dữ liệu rời rạc định nghĩa trên trụ và lưới. Bởi vì hằng số chuẩn thường không xác định được một cách phân tích, các nhà thống kê đã phát triển nhiều phương pháp ad hoc để vượt qua khó khăn này. Mục tiêu của chúng tôi là cung cấp các phương pháp tính toán và thống kê hiệu quả để tính toán hằng số chuẩn, để từ đó các phương pháp thống kê dựa trên khả năng cũng có thể được sử dụng cho suy diễn. Chúng tôi mở rộng phương pháp gọi là phương pháp chuyển tiếp để tìm kiếm một phương pháp tính toán khả thi nhằm thu được hằng số chuẩn cho điều kiện biên trụ. Để mở rộng kết quả đến điều kiện biên tự do trên lưới, chúng tôi sử dụng một mô hình chuỗi Markov Monte Carlo mẫu đường đi hiệu quả. Các phương pháp này thường có thể được áp dụng cho các mô hình liên kết khác ngoài không gian, chẳng hạn như dữ liệu nhị phân cụm, và cho các biến nhận ba giá trị trở lên được mô tả bởi, ví dụ, các mô hình Potts.
Từ khóa
Tài liệu tham khảo
Augustin, 1996, An autologistic model for spatial distribution of wildlife, J. Appl. Ecol., 33, 339, 10.2307/2404755
Baxter, 1982, Exactly Solved Models in Statistical Mechanics
Besag, 1972, Nearest-neighbour systems and the auto-logistic model for binary data, J. R. Statist. Soc., 34, 75
Besag, 1974, Spatial interaction and the statistical analysis of lattice systems (with discussion), J. R. Statist. Soc. B, 36, 192
Besag, 1986, On the statistical analysis of dirty pictures (with discussion), J. R. Statist. Soc., 48, 259
Cox, 1965, The Theory of Stochastic Processes
Evans, 2000, Approximating Integrals via Monte Carlo and Deterministic Methods, 10.1093/oso/9780198502784.001.0001
Friel, 2002, Likelihood estimation and inference for the Autologistic model, J. Comput. Graph. Statist.
Gelman, 1998, Simulating normalizing constants: from importance sampling to bridge sampling to path sampling, Statist. Sci., 13, 163, 10.1214/ss/1028905934
Geyer, 1992, Constrained Monte Carlo maximum likelihood for dependent data (with discussion), J. R. Statist. Soc. B, 54, 657
Green, 1992, Discussion on ‘Constrained Monte Carlo maximum likelihood for dependent data’, J. R. Statist. Soc. B, 54, 683
Gu, 2001, Maximum likelihood estimation for spatial models by Markov chain Monte Carlo stochastic approximation, J. R. Statist. Soc. B, 63, 339, 10.1111/1467-9868.00289
Jensen, 1997, The Potts model on Kagome and honeycomb lattices, J. Phys. A, 30, 8067, 10.1088/0305-4470/30/23/008
Low Choy, 2001, PhD Thesis
Molenberghs, 1999, An exponential family model for clustered multivariate binary data, Environmetrics, 10, 279, 10.1002/(SICI)1099-095X(199905/06)10:3<279::AID-ENV352>3.0.CO;2-X
Ogata, 1989, A Monte Carlo method for high-dimensional integration, Numer. Math., 55, 137, 10.1007/BF01406511
Pettitt, 2002, Efficient calculation of the normalising constant of the autologistic and related models on the cylinder and lattice
Pettitt, 1999, Bivariate binary data with missing values: analysis of a field experiment to investigate chemical attractants of wild dogs, J. Agric. Biol. Environ. Statist., 4, 57, 10.2307/1400421
Preisler, 1993, Modelling spatial patterns of trees attacked by bark-beetles, Appl. Statist., 42, 501, 10.2307/2986328
Press, 1992, Numerical Recipes in Fortran 77
Smith, 1992, Discussion on ‘Constrained Monte Carlo maximum likelihood for dependent data’, J. R. Statist. Soc. B, 54, 684
Wu, 1997, Modelling the distribution of plant species using the autologistic regression model, Environ. Ecol. Statist., 4, 49, 10.1023/A:1018553807765