Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Học và hình dung các đại diện tiềm ẩn kinh niên sử dụng hồ sơ sức khỏe điện tử
Tóm tắt
Ngày nay, số bệnh nhân mắc các bệnh mãn tính như tiểu đường và tăng huyết áp đã đạt tới con số đáng báo động trên toàn thế giới. Những bệnh này làm tăng nguy cơ phát triển các biến chứng cấp tính và tạo ra gánh nặng kinh tế đáng kể cùng với nhu cầu về nguồn lực y tế. Sự áp dụng rộng rãi của Hồ sơ sức khỏe điện tử (EHR) đang mở ra những cơ hội lớn cho việc hỗ trợ quyết định. Tuy nhiên, dữ liệu trích xuất từ EHR phức tạp (không đồng nhất, có chiều cao và thường chứa nhiễu), làm cản trở việc trích xuất tri thức bằng các phương pháp thông thường. Chúng tôi đề xuất việc sử dụng Autoencoder làm sạch (DAE), một kỹ thuật Machine Learning (ML) cho phép biến đổi dữ liệu có chiều cao thành các đại diện tiềm ẩn (LR), từ đó giải quyết những thách thức chính với dữ liệu lâm sàng. Chúng tôi khám phá trong công trình này cách kết hợp LRs với một phương pháp hình dung có thể được sử dụng để xác định dữ liệu bệnh nhân trong không gian hai chiều, thu được tri thức về sự phân bố của các bệnh nhân với các tình trạng mãn tính khác nhau. Hơn nữa, việc đại diện này cũng có thể được sử dụng để mô tả sự tiến triển tình trạng sức khỏe của bệnh nhân, điều này rất quan trọng trong bối cảnh lâm sàng. Để thu được các LRs lâm sàng, chúng tôi đã xem xét dữ liệu thực tế trích xuất từ EHR liên quan đến Bệnh viện Đại học Fuenlabrada ở Tây Ban Nha. Kết quả thực nghiệm cho thấy tiềm năng to lớn của DAEs trong việc xác định bệnh nhân có các mẫu lâm sàng liên quan đến tăng huyết áp, tiểu đường và đa bệnh lý. Quy trình này cho phép chúng tôi tìm ra những bệnh nhân có cùng bệnh mãn tính chính nhưng đặc điểm lâm sàng khác nhau. Do vậy, chúng tôi đã xác định hai loại bệnh nhân tiểu đường với những khác biệt trong liệu pháp thuốc của họ (phụ thuộc insulin và không phụ thuộc insulin), và cũng một nhóm phụ nữ bị ảnh hưởng bởi tăng huyết áp và tiểu đường thai kỳ. Chúng tôi cũng trình bày một bằng chứng khái niệm cho việc xác định sự tiến triển tình trạng sức khỏe của các bệnh nhân tổng hợp khi xem xét những chẩn đoán và thuốc có liên quan nhất đối với bệnh nhân mãn tính. Kết quả của chúng tôi đã nêu bật giá trị của các kỹ thuật ML trong việc trích xuất tri thức lâm sàng, hỗ trợ việc xác định bệnh nhân mắc những tình trạng mãn tính nhất định. Hơn nữa, sự tiến triển tình trạng sức khỏe của bệnh nhân trong không gian hai chiều có thể được sử dụng như một công cụ cho các lâm sàng nhằm xác định điều kiện sức khỏe và nhận diện các mã lâm sàng quan trọng hơn.
Từ khóa
#Hồ sơ sức khỏe điện tử #bệnh mãn tính #Autoencoder #Machine Learning #dữ liệu lâm sàng #đại diện tiềm ẩn #phân tích dữ liệu.Tài liệu tham khảo
Hall M, Dondo TB, Yan AT, Mamas MA, Timmis AD, Deanfield JE, Jernberg T, Hemingway H, Fox KA, Gale CP. Multimorbidity and survival for patients with acute myocardial infarction in England and Wales: Latent class analysis of a nationwide population-based cohort. PLoS Med. 2018; 15(3):1002501.
Mills KT, Stefanescu A, He J. The global epidemiology of hypertension. Nat Rev Nephrol. 2020; 16(4):223–37.
Hamine S, Gerth-Guyette E, Faulx D, Green BB, Ginsburg AS. Impact of mHealth chronic disease management on treatment adherence and patient outcomes: a systematic review. J Med Internet Res. 2015; 17(2):52.
Pefoyo AJK, Bronskill SE, Gruneir A, Calzavara A, Thavorn K, Petrosyan Y, Maxwell CJ, Bai Y, Wodchis WP. The increasing burden and complexity of multimorbidity. BMC Public Health. 2015; 15(1):1–11.
Salive ME. Multimorbidity in older adults. Epidemiol Rev. 2013; 35(1):75–83.
Prados-Torres A, Calderón-Larrañaga A, Hancco-Saavedra J, Poblador-Plou B, van den Akker M. Multimorbidity patterns: a systematic review. J Clin Epidemiol. 2014; 67(3):254–66.
Brelsford KM, Spratt SE, Beskow LM. Research use of electronic health records: patients’ perspectives on contact by researchers. J Am Med Inform Assoc. 2018; 25(9):1122–29.
In: Michalski SR, Carbonell GJ, Mitchell MT, (eds).Machine Learning an Artificial Intelligence Approach. Volume II. San Francisco: Morgan Kaufmann Publishers Inc.; 1986.
Verma SS, Lucas A, Zhang X, Veturi Y, Dudek S, Li B, Li R, Urbanowicz R, Moore JH, Kim D, et al. Collective feature selection to identify crucial epistatic variants. BioData Min. 2018; 11(1):1–22.
Thangaraj PM, Kummer BR, Lorberbaum T, Elkind MS, Tatonetti NP. Comparative analysis, applications, and interpretation of electronic health record-based stroke phenotyping methods. BioData Min. 2020; 13(1):1–14.
Radhachandran A, Garikipati A, Zelin NS, Pellegrini E, Ghandian S, Calvert J, Hoffman J, Mao Q, Das R. Prediction of short-term mortality in acute heart failure patients using minimal electronic health record data. BioData Min. 2021; 14(1):1–15.
Bishop CM. Pattern Recognition and Machine Learning (Information Science and Statistics). Berlin, Heidelberg: Springer; 2006.
Hripcsak G, Albers DJ. Next-generation phenotyping of electronic health records. J Am Med Inform Assoc. 2012; 20(1):117–21.
Shivade C, Raghavan P, Fosler-Lussier E, Embi PJ, Elhadad N, Johnson SB, Lai AM. A review of approaches to identifying patient phenotype cohorts using electronic health records. J Am Med Inform Assoc. 2014; 21(2):221–30.
Cunningham JP, Ghahramani Z. Linear dimensionality reduction: Survey, insights, and generalizations. J Mach Learn Res. 2015; 16(1):2859–900.
Espadoto M, Martins RM, Kerren A, Hirata NS, Telea AC. Toward a quantitative survey of dimension reduction techniques. IEEE Trans Vis Comput Graph. 2019; 27(3):2153–73.
Hinton GE, Salakhutdinov RR. Reducing the dimensionality of data with neural networks. Science. 2006; 313(5786):504–07.
Vincent P, Larochelle H, Bengio Y, Manzagol P-A. Extracting and composing robust features with denoising autoencoders. In: Proceedings of the 25th International Conference on Machine Learning. Helsinki: Association for Computing Machinery; 2008. p. 1096–103. https://doi.org/10.1145/1390156.1390294.
Vincent P, Larochelle H, Lajoie I, Bengio Y, Manzagol P-A. Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion. J Mach Learn Res. 2010; 11(12):3371–408.
Pu Y, Gan Z, Henao R, Yuan X, Li C, Stevens A, Carin L. Variational autoencoder for deep learning of images, labels and captions. Adv Neural Inf Process Syst. 2016; 29:2352–60.
Lore KG, Akintayo A, Sarkar S. Llnet: A deep autoencoder approach to natural low-light image enhancement. Pattern Recog. 2017; 61:650–62.
Kampffmeyer M, Løkse S, Bianchi FM, Jenssen R, Livi L. The deep kernelized autoencoder. Appl Soft Comput. 2018; 71:816–25.
Che Z, Kale D, Li W, Bahadori MT, Liu Y. Deep computational phenotyping. In: Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Sydney: Association for Computing Machinery; 2015. p. 507–16. https://doi.org/10.1145/2783258.2783365.
Lasko TA, Denny JC, Levy MA. Computational phenotype discovery using unsupervised feature learning over noisy, sparse, and irregular clinical data. PLoS ONE. 2013; 8(6):66341.
Miotto R, Li L, Kidd BA, Dudley JT. Deep patient: an unsupervised representation to predict the future of patients from the electronic health records. Sci Rep. 2016; 6(1):26094.
Tabar YR, Halici U. A novel deep learning approach for classification of eeg motor imagery signals. J Neural Eng. 2016; 14(1):016003.
Al Rahhal MM, Bazi Y, AlHichri H, Alajlan N, Melgani F, Yager RR. Deep learning approach for active classification of electrocardiogram signals. Inf Sci. 2016; 345:340–54.
Beaulieu-Jones BK, Greene CS, et al. Semi-supervised learning of the electronic health record for phenotype stratification. J Biomed Inform. 2016; 64:168–78.
Golas SB, Shibahara T, Agboola S, Otaki H, Sato J, Nakae T, Hisamitsu T, Kojima G, Felsted J, Kakarmath S, et al. A machine learning model to predict the risk of 30-day readmissions in patients with heart failure: a retrospective analysis of electronic medical records data. BMC Med Inform Decis Making. 2018; 18(1):44.
Chushig-Muzo D, Soguero-Ruiz C, de Miguel-Bohoyo P, Mora-Jiménez I. "Interpreting clinical latent representations using autoencoders and probabilistic models." Artificial Intelligence in Medicine. 2021;122:102211.
Ye Z, Yu J. Health condition monitoring of machines based on long short-term memory convolutional autoencoder. Appl Soft Comput. 2021; 107:107379.
Hougland P, Xu W, Pickard S, Masheter C, Williams SD. "Performance of International Classification of Diseases, 9th Revision, Clinical Modification codes as an adverse drug event surveillance system." Medical care. 2006;629-36.
World Health Organization. The selection and use of essential medicines: report of the WHO expert committee, 2017 (including the 20th WHO model list of essential medicines and the 6th model list of essential medicines for children). World Health Organization; 2017.
Bouza C, Lopez-Cuadrado T, Amate-Blanco J. Use of explicit ICD9-CM codes to identify adult severe sepsis: impacts on epidemiological estimates. Crit Care. 2016; 20(1):313.
Pratt NL, Kerr M, Barratt JD, Kemp-Casey A, Ellett LMK, Ramsay E, Roughead EE. The validity of the Rx-risk comorbidity index using medicines mapped to the anatomical therapeutic chemical (ATC) classification system. BMJ Open. 2018; 8(4):021122.
Chushig-Muzo D, Soguero-Ruiz C, Engelbrecht A, Bohoyo PDM, Mora-Jiménez I. Data-driven visual characterization of patient health-status using electronic health records and self-organizing maps. IEEE Access. 2020; 8:137019–31.
Hughes JS, Averill RF, Eisenhandler J, Goldfield NI, Muldoon J, Neff JM, Gay JC. Clinical Risk Groups (CRGs): a classification system for risk-adjusted capitation-based payment and health care management. Med Care. 2004; 42:81–90.
Neff JM, Clifton H, Park KJ, Goldenberg C, Popalisky J, Stout JW, Danielson BS. Identifying children with lifelong chronic conditions for care coordination by using hospital discharge data. Acad Pediatr. 2010; 10(6):417–23.
Vivas-Consuelo D, Usó-Talamantes R, Trillo-Mata JL, Caballer-Tarazona M, Barrachina-Martínez I, Buigues-Pastor L. Predictability of pharmaceutical spending in primary health services using Clinical Risk Groups. Health Policy. 2014; 116(2-3):188–95.
Pfister DG, Rubin DM, Elkin EB, Neill US, Duck E, Radzyner M, Bach PB. Risk adjusting survival outcomes in hospitals that treat patients with cancer without information on cancer stage. JAMA Oncol. 2015; 1(9):1303–1310.
Monterde D, Vela E, Clèries M, Garcia-Eroles L, Roca J, Pérez-Sust P. Multimorbidity as a predictor of health service utilization in primary care: a registry-based study of the catalan population. BMC Fam Pract. 2020; 21(1):1–9.
Soguero-Ruiz C, Mora-Jiménez I, Mohedano-Munoz MA, Rubio-Sanchez M, de Miguel-Bohoyo P, Sanchez A. Visually guided classification trees for analyzing chronic patients. BMC Bioinformatics. 2020; 21(2):1–19.
Cao F, Liang J, Li D, Bai L, Dang C. A dissimilarity measure for the k-modes clustering algorithm. Knowl-Based Sys. 2012; 26:120–27.
Rodriguez MZ, Comin CH, Casanova D, Bruno OM, Amancio DR, Costa LdF, Rodrigues FA. Clustering algorithms: A comparative approach. PLoS ONE. 2019; 14(1):0210236.
Jain AK. Data clustering: 50 years beyond k-means. Pattern Recogn Lett. 2010; 31(8):651–66.
MacQueen J, et al. Some methods for classification and analysis of multivariate observations. In: Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, vol. 1. Berkeley: University of California Press; 1967. p. 281–97.
Murtagh F, Contreras P. Algorithms for hierarchical clustering: an overview. WIREs Data Min Knowl Disc. 2012; 2(1):86–97.
Luo Z, Yetisgen-Yildiz M, Weng C. Dynamic categorization of clinical research eligibility criteria by hierarchical clustering. J Biomed Inform. 2011; 44(6):927–35.
Papin G, Bailly S, Dupuis C, Ruckly S, Gainnier M, Argaud L, Azoulay E, Adrie C, Souweine B, Goldgran-Toledano D, et al. Clinical and biological clusters of sepsis patients using hierarchical clustering. PLoS ONE. 2021; 16(8):0252793.
Rozumalski A, Schwartz MH. Crouch gait patterns defined using k-means cluster analysis are related to underlying clinical pathology. Gait Posture. 2009; 30(2):155–60.
Mullin S, Zola J, Lee R, Hu J, MacKenzie B, Brickman A, Anaya G, Sinha S, Li A, Elkin PL. Longitudinal k-means approaches to clustering and analyzing EHR opioid use trajectories for clinical subtypes. J Biomed Inform. 2021; 122:103889.
Arbelaitz O, Gurrutxaga I, Muguerza J, Pérez JM, Perona I. An extensive comparative study of cluster validity indices. Pattern Recog. 2013; 46(1):243–56.
Hämäläinen J, Jauhiainen S, Kärkkäinen T. Comparison of internal clustering validation indices for prototype-based clustering. Algorithms. 2017; 10(3):105.
Wu K-L, Yang M-S. A cluster validity index for fuzzy clustering. Pattern Recogn Lett. 2005; 26(9):1275–91.
He H, Garcia EA. Learning from imbalanced data. IEEE Trans Knowl Data Eng. 2009; 21(9):1263–84.
Jiang X, Pang Y, Li X, Pan J, Xie Y. Deep neural networks with elastic rectified linear units for object recognition. Neurocomputing. 2018; 275:1132–39.
Sammouda R, El-Zaart A. "An Optimized Approach for Prostate Image Segmentation Using K-Means Clustering Algorithm with Elbow Method", Computational Intelligence and Neuroscience. 2021;2021:1-13. https://doi.org/10.1155/2021/4553832.
Van Der Maaten L. Accelerating t-sne using tree-based algorithms. J Mach Learn Res. 2014; 15(1):3221–45.
Gradman AH, Basile JN, Carter BL, Bakris GL, of Hypertension Writing Group AS, et al. Combination therapy in hypertension. J Am Soc Hypertens. 2010; 4(2):90–98.
Cho Y, Choe E, Lee Y-h, Seo JW, Choi Y, Yun Y, Wang HJ, Ahn CW, Cha BS, Lee HC, et al. Risk of diabetes in patients treated with HMG-CoA reductase inhibitors. Metabolism. 2015; 64(4):482–88.
Nathan DM. Diabetes: advances in diagnosis and treatment. JAMA. 2015; 314(10):1052–62.
Brown CM, Garovic VD. Drug treatment of hypertension in pregnancy. Drugs. 2014; 74(3):283–96.
Atkinson MA, Eisenbarth GS, Michels AW. Type 1 diabetes. Lancet. 2014; 383(9911):69–82.
Ahrén B. Glucagon-like peptide-1 receptor agonists for type 2 diabetes: a rational drug development. J Diabetes Investig. 2019; 10(2):196–201.
Müller T, Finan B, Clemmensen C, DiMarchi R, Tschöp M. The new biology and pharmacology of glucagon. Physiol Rev. 2017; 97(2):721–66.
Group IHS, et al. Minimizing hypoglycemia in diabetes. Diabetes Care. 2015; 38(8):1583–91.
Lago RM, Singh PP, Nesto RW. Diabetes and hypertension. Nat Clin Pract Endocrinol Metab. 2007; 3(10):667–67.
Collaboration ERF, et al. Diabetes mellitus, fasting blood glucose concentration, and risk of vascular disease: a collaborative meta-analysis of 102 prospective studies. Lancet. 2010; 375(9733):2215–22.
Crowther CA, Hiller JE, Moss JR, McPhee AJ, Jeffries WS, Robinson JS. Effect of treatment of gestational diabetes mellitus on pregnancy outcomes. N Engl J Med. 2005; 352(24):2477–86.
Lange JM, Hubbard RA, Inoue LY, Minin VN. A joint model for multistate disease processes and random informative observation times, with applications to electronic medical records data. Biometrics. 2015; 71(1):90–101.
Luo Y, Stephens DA, Verma A, Buckeridge DL. Bayesian latent multi-state modeling for nonequidistant longitudinal electronic health records. Biometrics. 2021; 77(1):78–90.
