Dự đoán và độ bao phủ thực nghiệm của các phương pháp khác nhau để tạo ra khoảng tin cậy không trung tâm t cho sự khác biệt trung bình chuẩn hóa

Springer Science and Business Media LLC - Tập 53 - Trang 2412-2429 - 2021
Douglas A. Fitts1
1University of Washington (Retired), Snohomish, USA

Tóm tắt

Nhiều phương pháp đã được đề xuất để tính toán khoảng tin cậy "chính xác" cho sự khác biệt trung bình chuẩn hóa bằng cách sử dụng phân phối t không trung tâm. Hai phương pháp được cung cấp trong Hedges và Olkin (1985, “H”) và Steiger và Fouladi (1997, “S”). Bất kỳ phương pháp nào cũng có thể được sử dụng với ước lượng bị sai, d, hoặc ước lượng không bị sai, g, của sự khác biệt trung bình chuẩn hóa của quần thể (các phương pháp được viết tắt là Hd, Hg, Sd và Sg). Độ bao phủ của mỗi phương pháp đã được tính toán từ lý thuyết và ước lượng từ các mô phỏng. Độ bao phủ trung bình của các khoảng tin cậy 95% trên một loạt các kích thước hiệu ứng và trên kích thước mẫu từ 5 đến 89 mỗi nhóm luôn nằm giữa 85% và 98% cho tất cả các phương pháp, và tất cả đều nằm trong khoảng từ 94% đến 96% với kích thước mẫu lớn hơn 40 mỗi nhóm. Phương pháp ước lượng khoảng tốt nhất là phương pháp Sd, phương pháp này luôn tạo ra các khoảng tin cậy gần 95% ở tất cả các kích thước hiệu ứng và kích thước mẫu. Phương pháp tiếp theo tốt nhất là phương pháp Hg, phương pháp này sản xuất các độ bao phủ nhất quán qua tất cả các kích thước hiệu ứng, mặc dù độ bao phủ giảm xuống còn 93-94% ở kích thước mẫu trong khoảng từ 5-15. Phương pháp Hd tệ hơn với kích thước mẫu nhỏ, mang lại độ bao phủ thấp tới 86% khi n = 5. Phương pháp Sg sản xuất độ bao phủ rất khác nhau tùy thuộc vào kích thước hiệu ứng khi kích thước mẫu nhỏ (93-97%). Các nhà nghiên cứu sử dụng kích thước mẫu nhỏ được khuyên nên sử dụng phương pháp Steiger & Fouladi với d hoặc phương pháp Hedges & Olkin với g như một phương pháp ước lượng khoảng.

Từ khóa

#khoảng tin cậy #sự khác biệt trung bình chuẩn hóa #phân phối t không trung tâm #ước lượng #kích thước mẫu

Tài liệu tham khảo

Algina, J., Keselman, H.J., & Penfield, R.D. (2006). Confidence interval coverage for Cohen’s effect size statistic. Educational and Psychological Measurement, 66, 945–960. https://doi.org/10.1177/0013164406288161. Bird, K.D. (2002) Confidence intervals for effect sizes in analysis of variance. Educational and Psychological Measurement, 62, 197–226 Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R. (2009). Introduction to meta-analysis. John Wiley & Sons Chen, L.-T. & Peng, C.-Y. J. (2013) Constructing Confidence Intervals for Effect Sizes in ANOVA Designs. Journal of Modern Applied Statistical Methods, 12(2), Article 5. https://doi.org/10.22237/jmasm/1383278640. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. (2nd ed.). Erlbaum Cumming, G. (2014) The new statistics: Why and how. Psychological Science, 25, 7–29. https://doi.org/10.1177/0956797613504966. Cumming, G., & Finch, S. (2001). A primer on the understanding, use and calculation of confidence intervals that are based on central and noncentral distributions. Educational and Psychological Measurement, 61, 532–574. https://doi.org/10.1177/0013164401614002. Ferguson, C.J., & Brannick, M.T. (2012). Publication bias in psychological science: Prevalence, methods for identifying and controlling, and implications for the use of meta-analyses. Psychological Methods, 17, 120–128. https://doi.org/10.1037/a0024445. Fidler, F., & Thompson, B. (2001). Computing correct confidence intervals for ANOVA fixed- and random-effects effect sizes. Educational and Psychological Measurement, 61, 575–604 Fitts, D.A. (2010). The variable-criteria sequential stopping rule: Generality to unequal sample sizes, unequal variances, or to large ANOVAs. Behavior Research Methods, 42, 918–929 Fitts, D.A. (2011). Ethics and animal numbers: informal analyses, uncertain sample sizes, inefficient replications, and type I errors. Journal of the American Association of Laboratory Animal Science, 50, 445–453 Fitts, D.A. (2020). Commentary on “A review of effect sizes and their confidence intervals, part I: The Cohen’s d family”: The degrees of freedom for a paired samples design. The Quantitative Methods for Psychology, 16, 281–294. https://doi.org/10.20982/tqmp.16.4.p281. Glass, G. V. (1976). Primary, secondary, and meta-analysis of research. Educational Researcher, 5, 3–8 Goulet-Pelletier, J.-C., & Cousineau, D. (2018). A review of effect sizes and their confidence intervals, part I: The Cohen’s d family. The Quantitative Methods for Psychology, 14, 242–265. https://doi.org/10.20982/tqmp.14.4.p242. Goulet-Pelletier, J.-C., & Cousineau, D. (2020). Erratum to Appendix C of “A review of effect sizes and their confidence intervals, Part I: The Cohen’s d family”. The Quantitative Methods for Psychology, 16(4), 422–423. https://doi.org/10.20982/tqmp.16.4.p422. Harlow, L.L., Mulaik, S.A, & Steiger, J. H. (Eds.), (1997). What if There Were no Significance Tests? Lawrence Erlbaum Associates Hedges, L.V. (1981). Distribution theory for Glass’s estimator of effect size and related estimators. Journal of Educational Statistics, 6, 107–128 Hedges, L.V. (1982). Estimation of effect size from a series of independent experiments. Psychological Bulletin, 92, 490–499 Hedges, L.V., & Olkin, I. (1985). Statistical methods for meta-analysis. Academic Press Kelley, K. (2005). The effects of nonnormal distributions on confidence intervals around the standardized mean difference: bootstrap and parametric confidence intervals. Educational and Psychological Measurement, 65, 51–69. https://doi.org/10.1177/0013164404264850. Kelley, K. (2007). Confidence intervals for standardized effect sizes: Theory, application, and implementation. Journal of Statistical Software, 20, 1–24 Kelley, K., & Rausch, J. R. (2006). Sample size planning for the standardized mean difference: Accuracy in parameter estimation via narrow confidence intervals. Psychological Methods, 11, 363–385. https://doi.org/10.1037/1082-989X.11.4.363. Lecoutre, B. (2007) Another look at the confidence intervals for the noncentral t distribution. Journal of Applied Statistical Methods, 6(1), Article 11. https://doi.org/10.22237/jmasm/1177992600. Lenth, R. (1989). Algorithm AS 243: Cumulative Distribution Function of the Non-Central T Distribution. Applied Statistics, 38, 185–189 Morris, S.B. (2000). Distribution of the standardized mean change effect size for meta-analysis on repeated measures. British Journal of Mathematical and Statistical Psychology, 53, 17–29 Singham, D. I. (2014). Selecting stopping rules for confidence interval procedures. ACM Transactions on Modeling and Computer Simulation, 24(3) Article 18, 18 pages. https://doi.org/10.1145/2627734. Smithson, M. (2001) Correct confidence intervals for various regression effect sizes and parameters: The importance of noncentral distributions in computing intervals. Educational and Psychological Measurement, 61, 605–632 Steiger, J.H. (2004). Beyond the F test: Effect size confidence intervals and tests of close Fit in the analysis of variance and contrast analysis. Psychological Methods 9,164–182. https://doi.org/10.1037/1082-989X.9.2.164. Steiger, J.H, & Fouladi, R.T. (1997). Noncentrality interval estimation and the evaluation of statistical methods. In L.L. Harlow, S.A, Mulaik, & J.H. Steiger (Eds.), What if There Were no Significance Tests? (pp. 221–257). Mahwah: Lawrence Erlbaum Associates. Viechtbauer, W. (2007). Approximate confidence intervals for standardized effect sizes in the two-independent and two-dependent samples design. Journal of Educational and Behavioral Statistics, 32, 39–60. https://doi.org/10.3102/1076998606298034.