Dự đoán các rủi ro phản thực dưới các chiến lược điều trị giả định: một ứng dụng đối với HIV

European Journal of Epidemiology - Tập 37 - Trang 367-376 - 2022
Barbra A. Dickerman1,2, Issa J. Dahabreh1,2,3, Krystal V. Cantos4, Roger W. Logan1,2, Sara Lodi1,2,5, Christopher T. Rentsch6,7,8, Amy C. Justice7,8,9, Miguel A. Hernán1,2,3,10
1CAUSALab. Harvard T.H. Chan School of Public Health, Boston, USA
2Department of Epidemiology, Harvard T.H. Chan School of Public Health, Boston, USA
3Department of Biostatistics, Harvard T.H. Chan School of Public Health, Boston, USA
4Epidemiology and Drug Safety, IQVIA, Cambridge, Durham, USA
5Department of Biostatistics, Boston University School of Public Health, Boston, USA
6Faculty of Epidemiology and Population Health, London School of Hygiene & Tropical Medicine, London, UK
7Veterans Affairs Connecticut Healthcare System, West Haven, USA
8Department of Internal Medicine, Yale School of Medicine, New Haven, USA
9Center for Interdisciplinary Research on AIDS, Yale School of Public Health, New Haven, USA
10Harvard-MIT Division of Health Sciences and Technology, Boston, USA

Tóm tắt

Độ chính xác của một thuật toán dự đoán phụ thuộc vào các yếu tố ngữ cảnh có thể thay đổi giữa các thiết lập triển khai. Để giải quyết hạn chế vốn có này của dự đoán, chúng tôi đề xuất một phương pháp dự đoán phản thực dựa trên công thức g để dự đoán rủi ro trong các quần thể có phân phối chiến lược điều trị khác nhau. Chúng tôi áp dụng điều này để dự đoán rủi ro tử vong trong 5 năm đối với những người nhận chăm sóc HIV trong Hệ thống Y tế Cựu chiến binh Hoa Kỳ dưới các chiến lược điều trị giả định khác nhau. Đầu tiên, chúng tôi thực hiện một phương pháp thông thường để phát triển một thuật toán dự đoán trên dữ liệu quan sát được và chỉ ra cách thuật toán có thể thất bại khi được vận chuyển đến các quần thể mới có chiến lược điều trị khác nhau. Thứ hai, chúng tôi tạo dữ liệu phản thực dưới các chiến lược điều trị khác nhau và sử dụng nó để đánh giá độ bền vững của hiệu suất thuật toán gốc trước những khác biệt này và để phát triển các thuật toán dự đoán phản thực. Chúng tôi thảo luận về cách ước lượng rủi ro phản thực dưới một chiến lược điều trị cụ thể khó khăn hơn so với dự đoán thông thường vì nó yêu cầu cùng một dữ liệu, phương pháp và giả định không thể kiểm chứng như suy luận nguyên nhân. Tuy nhiên, điều này có thể cần thiết khi giả định thay thế rằng các mẫu điều trị không thay đổi giữa các thiết lập triển khai khó có thể xảy ra và dữ liệu mới vẫn chưa có sẵn để đào tạo lại thuật toán.

Từ khóa

#dự đoán phản thực #chiến lược điều trị giả định #HIV #thuật toán dự đoán #rủi ro tử vong

Tài liệu tham khảo

Dickerman BA, Hernán MA. Counterfactual prediction is not only for causal inference. Eur J Epidemiol. 2020;35(7):615–7. https://doi.org/10.1007/s10654-020-00659-8. van Geloven N, Swanson SA, Ramspek CL, et al. Prediction meets causal inference: the role of treatment in clinical prediction models. Eur J Epidemiol. 2020;35:619–30. Schulam P, Saria S. Reliable decision support using counterfactual models. Adv Neural Inf Process Syst. 2017;30:1697–708. Subbaswamy A, Saria S. From development to deployment: dataset shift, causality, and shift-stable models in health AI. Biostatistics. 2020;21(2):345–52. https://doi.org/10.1093/biostatistics/kxz041. Dahabreh IJ, Hernán MA. Extending inferences from a randomized trial to a target population. Eur J Epidemiol. 2019;34(8):719–22. https://doi.org/10.1007/s10654-019-00533-2. Dahabreh IJ, Robertson SE, Steingrimsson JA, Stuart EA, Hernán MA. Extending inferences from a randomized trial to a new target population. Stat Med. 2020;39(14):1999–2014. https://doi.org/10.1002/sim.8426. Finlayson SG, Subbaswamy A, Singh K, et al. The clinician and dataset shift in artificial intelligence. N Engl J Med. 2021;385(3):283–6. https://doi.org/10.1056/NEJMc2104626. Sperrin M, Martin GP, Pate A, Van Staa T, Peek N, Buchan I. Using marginal structural models to adjust for treatment drop-in when developing clinical prediction models. Stat Med. 2018;37(28):4142–54. https://doi.org/10.1002/sim.7913. Pajouheshnia R, Peelen LM, Moons KGM, Reitsma JB, Groenwold RHH. Accounting for treatment use when validating a prognostic model: a simulation study. BMC Med Res Methodol. 2017;17(1):103. https://doi.org/10.1186/s12874-017-0375-8. Lin L, Sperrin M, Jenkins DA, Martin GP, Peek N. A scoping review of causal methods enabling predictions under hypothetical interventions. Diagn Progn Res. 2021;5(1):3. https://doi.org/10.1186/s41512-021-00092-9. Hernán MA, Hsu J, Healy B. A second chance to get causal inference right: a classification of data science tasks. Chance. 2019;32(1):42–9. U.S. Department of Veterans Affairs. Veterans Affairs HIV Program Fact Sheet. 2020. https://www.hiv.va.gov/pdf/HIV-program-factsheet.pdf. Justice AC, Dombrowski E, Conigliaro J, et al. Veterans Aging Cohort Study (VACS): overview and description. Med Care. 2006;44(8 Suppl 2):S13-24. https://doi.org/10.1097/01.mlr.0000223741.02074.66. Tibshirani R. Regression shrinkage and selection via the lasso. J Royal Stat Soc Series B (Methodol). 1996;58(1):267–88. Steyerberg EW, Eijkemans MJC, Habbema JDF. Application of shrinkage techniques in logistic regression analysis: a case study. Stat Neerl. 2001;55(1):76–88. https://doi.org/10.1111/1467-9574.00157. Tate JP, Justice AC, Hughes MD, et al. An internationally generalizable risk index for mortality after one year of antiretroviral therapy. AIDS. 2013;27(4):563–72. https://doi.org/10.1097/QAD.0b013e32835b8c7f. Tate JP, Sterne JAC, Justice AC. Veterans Aging Cohort Study and the Antiretroviral Therapy Cohort Collaboration. Albumin, white blood cell count, and body mass index improve discrimination of mortality in HIV-positive individuals. AIDS. 2019;33(5):903–12. https://doi.org/10.1097/QAD.0000000000002140. Moons KGM, Altman DG, Reitsma JB, et al. Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD): explanation and elaboration. Ann Intern Med. 2015;162(1):W1–73. https://doi.org/10.7326/M14-0698. Austin PC, Steyerberg EW. Graphical assessment of internal and external calibration of logistic regression models by using loess smoothers. Stat Med. 2014;33(3):517–35. https://doi.org/10.1002/sim.5941. Hernán MA, Robins JM. Using big data to emulate a target trial when a randomized trial is not available. Am J Epidemiol. 2016;183(8):758–64. https://doi.org/10.1093/aje/kwv254. Hernán MA, Robins JM. Per-protocol analyses of pragmatic trials. N Engl J Med. 2017;377(14):1391–8. https://doi.org/10.1056/NEJMsm1605385. Hernán MA, Robins JM. Causal inference: what if. Boca Raton: Chapman & Hall/CRC; 2020. Robins JM. A new approach to causal inference in mortality studies with a sustained exposure period—Application to the healthy worker survivor effect [published errata appear in Mathl Modelling 1987;14:917–21]. Math Model. 1986;7:1393–512. Taubman SL, Robins JM, Mittleman MA, Hernán MA. Intervening on risk factors for coronary heart disease: an application of the parametric g-formula. Int J Epidemiol. 2009;38(6):1599–611. https://doi.org/10.1093/ije/dyp192. Young JG, Cain LE, Robins JM, O’Reilly EJ, Hernán MA. Comparative effectiveness of dynamic treatment regimes: an application of the parametric g-formula. Stat Biosci. 2011;3(1):119–43. https://doi.org/10.1007/s12561-011-9040-7. Sugiyama M, Krauledat M, Müller KM. Covariate shift adaptation by importance weighted cross validation. J Mach Learn Res. 2007;8:985–1005. Gretton A, Smola A, Huang J, Schmittfull M, Borgwardt K, Schölkopf B. Covariate shift by kernel mean matching. In: Quiñonero-Candela J, Sugiyama M, Schwaighofer A, Lawrence ND, editors. Dataset shift in machine learning. Cambridge, MA: The MIT Press; 2008. p. 131–60. Steingrimsson JA, Gatsonis C, Dahabreh IJ. Transporting a prediction model for use in a new target population. 2021; https://arxiv.org/abs/2101.11182v2. Subbaswamy A, Saria S. Counterfactual normalization: proactively addressing dataset shfit and improving reliability using causal mechanisms. Proceedings of the Thirty-Fourth Conference on Uncertainty in Artificial Intelligence. 2018. 947–57. Subbaswamy A, Schulam P, Saria S. Preventing failures due to dataset shift: learning predictive models that transport. Artificial Intelligence and Statistics (AISTATS). 2019. Dahabreh IJ, Robins JM, Haneuse S, Hernán MA. Generalizing causal inferences from randomized trials: counterfactual and graphical identification. 2019; https://arxiv.org/abs/1906.10792v1. Robins J, Orellana L, Rotnitzky A. Estimation and extrapolation of optimal treatment and testing strategies. Stat Med. 2008;27(23):4678–721. https://doi.org/10.1002/sim.3301. Hernán MA, VanderWeele TJ. Compound treatments and transportability of causal inference. Epidemiology. 2011;22(3):368–77. https://doi.org/10.1097/EDE.0b013e3182109296. VanderWeele TJ, Hernán MA. Causal inference under multiple versions of treatment. J Causal Inference. 2013;1(1):1–20. https://doi.org/10.1515/jci-2012-0002.