Độ tin cậy của khoảng tin cậy 95% được tiết lộ thông qua điểm số chất lượng cuộc sống dự kiến: một ví dụ trên bệnh nhân ung thư vòm họng sau xạ trị sử dụng EORTC QLQ-C 30
Tóm tắt
Nhiều nhà nghiên cứu sử dụng điểm số quan sát nhận được từ bảng hỏi để đánh giá độ tin cậy của điểm số và đưa ra kết luận cũng như luận cứ liên quan đến kết quả chất lượng cuộc sống. Số lần cảnh báo sai từ các chẩn đoán y khoa sẽ giảm đi bao nhiêu nếu điểm số quan sát được thay thế bằng điểm số dự kiến là điều thú vị, và hiểu rõ sự khác biệt này rất quan trọng trong việc chăm sóc bệnh nhân ung thư. Việc sử dụng điểm số dự kiến để ước lượng độ tin cậy của khoảng tin cậy 95% (CIs) hiếm khi được báo cáo trong các bài báo đã công bố. Chúng tôi đã nghiên cứu độ tin cậy của các phản hồi bệnh nhân đối với bảng hỏi về chất lượng cuộc sống và đưa ra những khuyến nghị cho các nghiên cứu trong tương lai về chất lượng cuộc sống của bệnh nhân.
Cổng số 115 bệnh nhân hoàn thành bảng hỏi lõi EORTC QLQ-C30 (phiên bản 3) sau xạ trị. Điểm số phản hồi quan sát được, giả định là một chiều, được tổng hợp và chuyển đổi thành điểm số dự kiến sử dụng mô hình thang đánh giá Rasch với phần mềm WINSTEPS. Một loạt các mô phỏng được thực hiện bằng thủ tục bootstrap thống nhất sau khi điều chỉnh các kịch bản với độ dài bảng hỏi và số lượng bệnh nhân khác nhau để ước lượng độ tin cậy tại khoảng tin cậy 95%. Phân tích độ lệch của khoảng tin cậy 95% được so sánh để phát hiện các tác động khác nhau giữa các nhóm theo hai bộ dữ liệu của điểm số phản hồi quan sát và dự kiến.
Chúng tôi nhận thấy rằng (1) cần thiết phải báo cáo các CI cho độ tin cậy và hệ số độ lệch trong các bài báo; (2) dữ liệu dẫn xuất từ điểm số phản hồi dự kiến là ưu điểm hơn để đưa ra các luận cứ; và (3) các biểu diễn hình ảnh hiển thị CI 95% của giá trị độ lệch được áp dụng cho các phân tích từng mục có thể cung cấp sự diễn giải hữu ích cho kết quả chất lượng cuộc sống.
Các hệ số độ tin cậy có thể được báo cáo với CI 95% bằng phần mềm thống kê để đánh giá tính nhất quán nội tại của điểm số phản hồi trên các mục bảng hỏi. Các thủ tục cú pháp SPSS để ước tính độ tin cậy của CI 95%, tạo điểm số dự kiến và phân tích độ lệch hình ảnh được minh họa trong nghiên cứu này. Chúng tôi khuyến nghị rằng các kích thước hiệu ứng chẳng hạn như CI 95% được báo cáo cùng với giá trị\<italic\>p\</italic\> báo cáo các khác biệt có ý nghĩa trong nghiên cứu chất lượng cuộc sống.
Từ khóa
#độ tin cậy #khoảng tin cậy 95% #chất lượng cuộc sống #ung thư vòm họng #điểm số quan sát #điểm số dự kiến #phân tích độ lệch #nghiên cứu hiệu quả #bảng hỏi EORTC QLQ-C30Tài liệu tham khảo
Cronbach LJ: Coefficient alpha and the internal structure of tests. Psychometrika 1951, 16: 297–334. 10.1007/BF02310555
Cronbach LJ, Shavelson RJ: My current thoughts on coefficient alpha and successor procedures. Educational and Psychological Measurement 2004, 64: 391–418. 10.1177/0013164404266386
Zumbo BD, Rupp AA: Responsible modelling of measurement data for appropriate inferences: Important advances in reliability and validity theory. In The Sage handbook of quantitative methodology for the social sciences. Edited by: Kaplan D. Thousand Oaks CA: Sage; 73–92.
Wilkinson L, APA: Task Force on Statistical Inference: Statistical methods in psychology journals: Guidelines and explanations. American Psychologist 1999, 54: 594–604. 10.1037/0003-066X.54.8.594
Cook C, Heath F, Thompson RL, Thompson B: Score reliability in web or Internet-based surveys: unnumbered graphic rating scales versus Likert-Type scales. Educational and Psychological Measurement 2001, 61: 697. 10.1177/00131640121971356
Burdick RK, Graybill FA: Confidence intervals for variance components. New York: Marcel Dekker; 1992.
Fan X, Thompson B: Confidence intervals about score reliability coefficients please: EPM guidelines editorial. Educational and Psychological Measurement 2001,61(4):517–531.
Alexander JA, Hearld LR: Review: what can we learn from quality improvement research? a critical review of research methods. Med Care Res Rev 2009, 66: 235–271. 10.1177/1077558708330424
Liu Y, Wu AD, Zumbo BD: The impact of outliers on Cronbach's Coefficient Alpha estimate of reliability: ordinal/rating scale otem Responses. Educational and Psychological Measurement 2007,67(4):620–634. 10.1177/0013164406296976
Chien TW, Wang WC, Lin SB, Lin CY, Guo HR, Su SB: KIDMAP a Web based system for gathering patients' feedback on their doctors. BMC Med Res Methodol 2009,9(1):38. 10.1186/1471-2288-9-38
Bjordal K, de Graeff A, Fayers PM, et al.: A 12 country field study of the EORTC QLQ-C30(version 3.0) and the head and neck cancer specific module(EORTC QLQ-H&HN35) in Head and Neck patients. Eur J Cancer 2000, 36: 1796–1807. 10.1016/S0959-8049(00)00186-6
Rasch G: Probabilistic models for some Intelligence and attainment tests. Chicago: University of Chicago Press; 1960.
Wang WC, Yao G, Tsai YJ, Wang JD, Hsieh CL: Validating, Improving Reliability and Estimating Correlation of the Four Subscales in the WHOQOL-BREF using Multidimensional Rasch Analysis. Quality of Life Research 2006,15(4):607–620. (14) 10.1007/s11136-005-4365-7
Wright BD, Masters GN: Rating scale analysis Rasch measurement. Chicago: MESA Press; 1982.
Andrich D: A rating scale formulation for ordered response categories. Psychometrika 1978, 43: 561–73. 10.1007/BF02293814
Linacre JM: WINSTEPS [computer program]. Chicago IL 2009. [http://www.winsteps.com]
Kieffer KM, Reese RJ: A reliabilty generalization study of the ceriatric scale. Educational and Psychological Measurement 2002,62(6):969–994. 10.1177/0013164402238085
Harwell M, Stone CA, Hsu TC, Kirisci L: Monte Carlo studies in item response theory. Applied Psychological Measurement 1996, 20: 101–125. 10.1177/014662169602000201
Macdonald P, Paunonen SV: A monte carlo comparison of item and person statistics based on item response theory versus classical test theory. Educational and Psychological Measurement 2002, 62: 921–943. 10.1177/0013164402238082
Chien TW, Wang WC, Wang HY, Lin HJ: Online assessment of patients' views on hospital performances using Rasch model's KIDMAP diagram. BMC Health Serv Res 2009, 9: 135. 10.1186/1472-6963-9-135
Chien TW, Wu HM, Wang WC, Castillo RV, Chou W: Reduction in patient burdens with graphical computerized adaptive testing on the ADL scale: tool development and simulation. Health Qual Life Outcomes 2009, 7: 39. 10.1186/1477-7525-7-39
Chernick MR: Bootstrap Methods A practitioner's guide. Wiley Series in Probability and Statistics 1999.
Efron B: Bootstrap Methods: Another Look at the Jackknife. The Annals of Statistics 1979,7(1):1–26. 10.1214/aos/1176344552
Lord FM, Novick R: Statistical theories of mental tests scores. Reading MA: Addison-Wesley; 1968:57.
Lord FM: Applications of item response theory to practical testing problems. Hillsdale NJ: Lawrence Erlbaum; 1980.
Wright BD, Mok M: Understanding Rasch Measurement Rasch Models Overview . J Appl Meas 2000, 1: 83–106.
Schumacker RE, Smith EV Jr: Reliability: a Rasch perspective. Educational and Psychological Measurement 2007,67(3):394–409. 10.1177/0013164406294776
Dimitrov DM: Reliability: Arguments for multiple perspectives and potential problems with generalization across studies. Educational and Psychological Measurement 2002, 62: 783–801. 10.1177/001316402236878
Smith AB, Fallowfield LJ, Stark DP, Velikova G, Jenkins V: A Rasch and confirmatory factor analysis of the General Health Questionnaire (GHQ)-12. Health and Quality of Life Outcomes 2010, 8: 45. 10.1186/1477-7525-8-45
Thompson B: Guidelines for authors. Educational and Psychological Measurement 1994, 54: 837–847.