Điều chỉnh cho thiên lệch xác minh trong các biện pháp độ chính xác chẩn đoán khi so sánh nhiều bài kiểm tra sàng lọc - một ứng dụng cho nghiên cứu IP1-PROSTAGRAM

BMC Medical Research Methodology - Tập 22 Số 1 - 2022
Emily Day1, David Eldred‐Evans2, A. Toby Prevost3, Hashim U. Ahmed2, Francesca Fiorentino3
1Imperial Clinical Trials Unit, Imperial College London, London, UK
2Imperial Prostate, Division of Surgery, Department of Surgery and Cancer, Faculty of Medicine, Imperial College London, London, UK
3Nightingale-Saunders Unit, King’s Clinical Trials Unit, King’s College London, London, UK

Tóm tắt

Tóm tắt Giới thiệu Các bài kiểm tra sàng lọc mới dùng để phát hiện một tình trạng mục tiêu được so sánh với một tiêu chuẩn tham chiếu hoặc các phương pháp sàng lọc hiện có khác. Tuy nhiên, vì không phải lúc nào cũng có thể áp dụng tiêu chuẩn tham chiếu trên toàn bộ quần thể được nghiên cứu, nên thiên lệch xác minh được đưa vào. Các phương pháp thống kê tồn tại để điều chỉnh các ước lượng nhằm tính đến thiên lệch này. Chúng tôi mở rộng các phương pháp phổ biến để điều chỉnh cho thiên lệch xác minh khi nhiều bài kiểm tra được so sánh với một tiêu chuẩn tham chiếu bằng cách sử dụng dữ liệu từ một nghiên cứu sàng lọc mù đôi triển vọng cho ung thư tuyến tiền liệt. Phương pháp Phương pháp của Begg và Greene cùng với phương pháp ước lượng nhiều lần được mở rộng để bao gồm kết quả của nhiều bài kiểm tra sàng lọc xác định trạng thái xác minh của tình trạng bệnh. Hai phương pháp này được so sánh với phân tích trường hợp hoàn chỉnh sử dụng dữ liệu từ nghiên cứu IP1-PROSTAGRAM. IP1-PROSTAGRAM sử dụng thiết kế mù đôi theo cặp để đánh giá việc sử dụng hình ảnh như các bài kiểm tra thay thế để sàng lọc ung thư tuyến tiền liệt, so với một bài kiểm tra máu gọi là kháng nguyên đặc hiệu với tuyến tiền liệt (PSA). Những người tham gia có hình ảnh dương tính (chỉ số) và/hoặc PSA (đối chứng) đã tiến hành sinh thiết tuyến tiền liệt (tiêu chuẩn tham chiếu). Kết quả Khi so sánh kết quả trường hợp hoàn chỉnh với các phương pháp của Begg và Greene và ước lượng nhiều lần, có sự gia tăng có ý nghĩa thống kê trong các ước lượng độ đặc hiệu cho tất cả các bài kiểm tra sàng lọc. Các ước lượng độ nhạy duy trì tương tự trên các phương pháp, với các khoảng tin cậy 95% hoàn toàn trùng lặp. Các ước lượng giá trị tiên đoán âm tính (NPV) cao hơn khi điều chỉnh cho thiên lệch xác minh, so với phân tích trường hợp hoàn chỉnh, mặc dù các khoảng tin cậy 95% cũng trùng lặp. Các ước lượng giá trị tiên đoán dương tính (PPV) tương tự nhau trên tất cả các phương pháp.

Từ khóa


Tài liệu tham khảo

Maxim LD, Niebo R, Utell MJ. Screening tests: a review with examples. Inhal Toxicol. 2014;26(13):811–28.

Knottnerus JA, van Weel C. General introduction: evaluation of diagnostic procedures. In: The evidence base of clinical diagnosis. London: BMJ Books; 2002. pp. 1–18.

Pepe MS. The Statistical Evaluation of Medical Tests for Classification and Prediction. Oxford University Press; 2003. p. 169.

De Groot JAH, Janssen KJM, Zwinderman AH, et al. Correcting for partial verification bias: a comparison of methods. Ann Epidemiol. 2011;21:139–48.

Begg CB, Greenes RA. Assessment of diagnostic tests when disease verification is subject to selection bias. Biometrics. 1983;39:207–15 [PubMed: 6871349].

Harel O, Zhou X-H. Multiple imputation for correcting verification bias. Stat Med. 2006;25:3769–86.

Rubin DB. Inference and Missing data. Biometrika. 1976;63:581–92.

Ankerst DP, Tangen CM, Thompson IM. Prostate cancer screening. Second Edition. Springer Science & Business Media; 2009. p. 323–25.

Punglia RS, D’Amico AV, Catalona WJ, Roehl KA, Kuntz KM. Effect of Verification Bias on Screening for Prostate Cancer by Measurement of Prostate-Specific Antigen. N Engl J Med. 2003;349:335–42.

Gaffikin L, McGrath J, Arbyn M, Blumenthal PD. Avoiding verification bias in screening test evaluation in resource poor settings: a case study from Zimbabwe. Clin Trials. 2008;5(5):496–503.

Roger VL, Pellikka PA, Bell MR, Chow CWH, Bailey KR, Seward JB. Sex and Test Verification Bias: Impact on the Diagnostic Value of Exercise Echocardiography. Circulation. 1997;97(2):405–10.

Eldred-Evans D, Burak P, Connor M, Day E, Evans M, Fiorentino F, et al. Population-based prostate cancer screening with Magnetic Resonance or Ultrasound Imaging: The IP1-PROSTAGRAM study. JAMA Oncol. 2020. ISSN: 2374-2445

National Institute for Health and Care Excellence (NICE). Prostate cancer: diagnosis and management (NG131). NICE Guidline, 2019. Available from: https://www.nice.org.uk/guidance/ng131

Altman DG, Bland JM. Diagnostic tests. 1: Sensitivity and specificity. BMJ. 1994;308:1552.

Alonzo TA. Verification Bias - Impact and Methods for Correction when Assessing Accuracy of Diagnostic Tests. REVSTAT. 2014;12(1):67–83.

Xue X, Kim MY, Castle PE, Strickler HD. A New Method to Address Verification Bias in Studies of Clinical Screening Tests: Cervical Cancer Screening Assays as an Example. J Clin Epidemiol. 2014;67(3):343–53.

O’Sullivan JW, Banerjee A, Heneghan C, et al. BMJ Evid-Based Med. 2018;23:54–5.

Efron B, Tibshirani RJ. An Introduction to the Bootstrap. London: Chapman & Hall; 1993.

De Groot JAH, Janssen KJM, Zwinderman AH, et al. Multiple imputation to correct for partial verification bias revisited. Stat Med. 2008;27:5880–9.

Moons KGM, de Groot JAH, Bouwmeester W, Vergouwe Y, Mallett S, Altman DG, Reitsma JB, Collins GS. Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies: The CHARMS Checklist. PLoS Med. 2014;11(10).

Moons KGM, Altman DG, Reitsma JB, Ioannidis JP, Macaskill P, Steyerberg EW, Vickers AJ, Ransohoff DF, Collins GS. Transparent Reporting of a multivariable prediction model for Individul Prognosis or Diagnosis (TRIPOD): Explanation and Elaboration. Ann Int Med. 2015;162(1).

Pavlou M, Ambler G, Seaman SR, Guttmann O, Elliott P, King M, Omar RZ. How to develop a more accurate risk prediction model when there are few events. BMJ. 2016.

Gart J, Zweifel J. On the Bias of Various Estimators of the Logit and Its Variance with Application to Quantal Bioassay. Vol. 1. 1967. p. 181–7.

Jewell N. Small-sample Bias of Point Estimators of the Odds Ratio from Matched Sets. Biometrics. 1984;40(2):421–35.

Firth D. Bias reduction of maximum likelihood estimates. Biometrika. 1993;80(1):27–38.

van Smeden M, de Groot JA, Moons KGM, Collins GS, Altman DG, Eijkemans MJ, Reitsma JB. No rationale for 1 variable per 10 events criterion for binary logistic regression analysis. BMC Med Res Methodol. 2016;16(1):163.

Lott A, Reiter JP. Wilson Confidence Intervals for Binomial Proportions with Multiple Imputation for Missing Data. Am Stat. 2020;74:109–15.

Li X, Mehrotra DV, Barnard J. Analysis of Incomplete Longitudinal Binary Data Using Multiple Imputation. Stat Med. 2006;25:2107–24.

Alonzo TA, Brinton JT, Ringham BM, Glueck DH. Bias in estimating accuracy of a binary screening test with differential disease verification. Stat Med. 2011;30(15):1852–64.

Kohn MA, Carpenter CR, Newman TB. Understanding the direction of bias in studies of diagnostic test accuracy. Acad Emerg Med. 2013;20(11):1194–206.

Zhou X-H. Correcting for verification bias in studies of a diagnostic test’s accuracy. Stat Methods Med Res. 1998;7:337–53.

Cronin AM, Vickers AJ. Statistical methods to correct for verification bias in diagnostic studies are inadequate when there are few false negatives: a simulation study. BMC Med Res Methodol. 2008;8(75).

Dannecker C, Siebert U, Thaler CJ, Kiermeir D, Hepp H, Hillemanns P. Primary cervical cancer screening by self-sampling of human papillomavirus DNA in internal medicine outpatient clinics. Ann Oncol. 2004;15(6):863–9.

Miller TD, Hodge DO, Christian TF, Milavetz JJ, Bailey KR, Gibbons RJ. Effects of adjustment for referral bias on the sensitivity and specificity of single photon emission computed tomography for the diagnosis of coronary artery disease. Am J Med. 2002;112(4):290–7.

Oudega R. Moons KG, Hoes AW. Ruling out deep venous thrombosis in primary care. A simple diagnostic algorithm including D-dimer testing. Thromb Haemost. 2005;94:200–5.