Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Đánh giá nhiều phương pháp ước lượng bằng nhiều imputation cho các thang đo đa mục khi mô hình ước lượng đầy đủ không khả thi
Tóm tắt
Dữ liệu thiếu hụt trong một cuộc khảo sát quy mô lớn là một thách thức lớn. Chúng tôi tập trung vào việc thực hiện ước lượng nhiều bằng phương pháp chuỗi khi dữ liệu chứa nhiều thang đo đa mục không đầy đủ. Những tác giả gần đây đã đề xuất ước lượng dữ liệu này ở cấp độ mục cá nhân, nhưng điều này có thể dẫn đến các mô hình ước lượng quá lớn và không thể thực hiện. Chúng tôi sử dụng dữ liệu thu thập từ một cuộc khảo sát đa quốc gia lớn, trong đó phân tích sử dụng các mô hình hồi quy logistic tách biệt cho mỗi trong chín bộ dữ liệu theo quốc gia. Trong dữ liệu này, việc áp dụng ước lượng nhiều thông qua chuỗi đối với các mục thang đo cá nhân là không khả thi về mặt tính toán. Chúng tôi đề xuất một phương pháp điều chỉnh ước lượng nhiều thông qua chuỗi mà vẫn ước lượng được các mục thang đo cá nhân nhưng giảm số lượng biến trong các mô hình ước lượng bằng cách thay thế hầu hết các mục thang đo bằng các điểm số tóm tắt của thang đo. Chúng tôi đánh giá tính khả thi của phương pháp đề xuất và so sánh với phân tích trường hợp hoàn chỉnh. Chúng tôi thực hiện một nghiên cứu mô phỏng để so sánh phương pháp đề xuất với các phương pháp thay thế: chúng tôi thực hiện điều này trong một môi trường đơn giản hóa để cho phép so sánh với mô hình ước lượng đầy đủ. Đối với nghiên cứu trường hợp, phương pháp đề xuất giảm kích thước của các mô hình dự đoán từ 134 biến dự đoán xuống tối đa 72 và làm cho ước lượng nhiều thông qua chuỗi có thể thực hiện được về mặt tính toán. Phân phối dữ liệu được ước lượng được cho là nhất quán với dữ liệu quan sát. Kết quả từ phân tích hồi quy với ước lượng nhiều tương tự nhưng chính xác hơn so với kết quả cho phân tích trường hợp hoàn chỉnh; với cùng một mô hình hồi quy, giảm 39% sai số chuẩn được quan sát. Mô phỏng cho thấy phương pháp của chúng tôi có thể thực hiện tương đương với các phương pháp thay thế. Bằng cách giảm đáng kể kích thước các mô hình ước lượng, phương pháp điều chỉnh của chúng tôi làm cho ước lượng nhiều trở nên khả thi cho dữ liệu khảo sát quy mô lớn với nhiều thang đo đa mục. Đối với dữ liệu đã xem xét, phân tích dữ liệu đã được ước lượng nhiều cho thấy sức mạnh và hiệu quả lớn hơn so với phân tích trường hợp hoàn chỉnh. Phương pháp điều chỉnh ước lượng nhiều giúp khai thác tốt hơn dữ liệu có sẵn và có thể mang lại kết quả khác biệt đáng kể so với các kỹ thuật đơn giản hơn.
Từ khóa
#dữ liệu thiếu hụt #ước lượng nhiều #thang đo đa mục #hồi quy logistic #mô phỏng #phân tích dữ liệuTài liệu tham khảo
White IR, Royston P, Wood AM. Multiple imputation using chained equations: issues and guidance for practice. Stat Med. 2011;30(4):377–99.
Wayman JC. Multiple imputation for missing data: What is it and how can I use it? In Proceedings of the Annual meeting of the American Educational Research Association Chicago, Il. 2003.
Baraldi AN, Enders CK. An introduction to modern missing data analyses. J Sch Psychol. 2010;48:5–37.
Roth PL. Missing Data: a conceptual review for applied psychologists. Personnel Psychology. 1994;41(3):537–60.
Wood A, White IR, Thompson SG. Are missing outcome data adequately handled? a review of published randomized controlled trials in major medical journals. Clin Trials. 2004;1:368–76.
Peugh JL, Enders CK. Missing data in educational research: a review of reporting practices and suggestions for improvement. Rev Educ Res. 2004;74(4):525–56.
Little RJA. Missing-data adjustments in large surveys. J Bus Econ Stat. 1988;6(3):287–96.
Sinharay S, Stern HS, Russell D. The use of multiple imputation for the analysis of missing data. Psychol Methods. 2001;6(4):317–29.
Sterne JAC, White IR, Carlin JB, et al. Multiple imputation for missing data in epidemiological and clinical research: potential and pitfalls. BMJ. 2009;338:b2393.
Noble SM, Hollingworth W, Tilling K. Missing data in trial-based cost-effectiveness. analysis: the current state of play. Health Econ. 2012;21(2):187–200.
Rousseau M, Simon M, Bertrand R, et al. Reporting missing data: a study of selected articles published from 2003-2007. Qual Quant. 2012;46(5):1393–406.
Karahalios A, Baglietto L, Carlin JB, et al. A review of the reporting and handling of missing data in cohort studies with repeated assessment of exposure measures. BMC Med Res Methodol. 2012;12:96.
Eekhout I, de Boer MR, Twisk JWR, et al. Missing Data: a systematic review of how they are reported and handled. Epidemiology. 2012;23(5):729–32.
Bell ML, Fiero M, Horton NJ, et al. Handling missing data in RCTs; a review of the top medical journals. BMC Med Res Methodol. 2014;14:118.
Simons CL, Rivero-Arias O, Yu LM, et al. Multiple imputation to deal with missing EQ-5D-3L data: should we impute individual domains or the actual index? Qual Life Res. 2015;24:805–15.
Eekhout I, de Vet HCW, Twisk JWR, et al. Missing data in a multi-item instrument were best handled by multiple imputation at the item score level. J Clin Epidemiol. 2014;67:335–42.
van Buuren S, Oudshoorn CGM. Multiple imputation by chained equations: MICE V1.0 user’s manual. TNO Report PG/VGZ/00.038. TNO Preventie enGezondheid: Leiden (2000). http://www.multiple-imputation.com/ Accessed 26 Nov 2012.
White IR, Daniel R, Royston P. Avoiding bias due to perfect prediction in multiple imputation of incomplete categorical variables. Comput Stat Data Anal. 2010;54:2267–75.
Royston P. Multiple imputation of missing values: update. Stata J. 2005;5(2):188–201.
Rubin DB. Multiple imputation for nonresponse in surveys. New York: Wiley; 1987.
Morrison VL, Holmes EAF, Parveen S, et al. Predictors of self-reported adherence to antihypertensive medicines: a multi-national, cross-sectional survey. Value Health. 2015. doi:10.1016/j.val.2014.12.013.
Morisky DE, Ang A, Krousel-Wood M, et al. Predictive validity of a medication adherence measure for hypertension control. J Clin Hypertens. 2008;10(5):348–54.
van der Pola M, Cairns J. Comparison of two methods of eliciting time preference for future health states. Soc Sci Med. 2008;67(5):883–9.
Royston P. Multiple imputation of missing values: update of ice. Stata J. 2005;5(4):527–36.
Royston P. Multiple imputation of missing values: further update of ice, with an emphasis on categorical variables. Stata J. 2009;9(3):466–77.
Wood AM, White IR, Royston P. How should variable selection be performed with multiply imputed data? Stat Med. 2008;27:3227–46.
Rubin DB, Stern HS, Vehovar V. Handling, “don’t know” survey responses: the case of the slovenian plebiscite. J Am Stat Assoc. 1995;90:822–8.
Fernandes-Taylor S, Hyun JK, Reeder RN, et al. Common statistical and research design problems in manuscripts submitted to high-impact medical journals. BMC Res Notes. 2011;4:304.
Harris A, Reeder R, Hyun J. Survey of editors and reviewers of high-impact psychology journals: statistical and research design problems in submitted manuscripts. J Psychol. 2011;145(3):195–209.