Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Mô hình dự đoán dựa trên học máy và nền tảng phần mềm ứng dụng di động để dự đoán độ nhạy cảm nhiễm COVID-19 sử dụng dữ liệu y tế
Tóm tắt
Từ góc độ sức khỏe cộng đồng về đại dịch COVID-19, những ước lượng chính xác về mức độ nghiêm trọng của sự nhiễm bệnh ở cá nhân là vô cùng hữu ích cho việc ra quyết định thông minh và phản ứng có mục tiêu đối với một đại dịch mới nổi. Bài báo này trình bày mô hình dự đoán dựa trên học máy nhằm cung cấp cảnh báo sớm cho những cá nhân có nguy cơ nhiễm COVID-19, sử dụng tập dữ liệu y tế. Trong công trình hiện tại, một mô hình dự đoán sử dụng bộ phân loại rừng ngẫu nhiên và hồi quy vector hỗ trợ được phát triển để dự đoán điểm số xác suất nhạy cảm nhiễm bệnh (ISP) của COVID-19, và được áp dụng trên một tập dữ liệu y tế mở chứa 27 trường thông tin. Các trường thông tin tiêu biểu trong tập dữ liệu y tế gồm thông tin cá nhân cơ bản như tuổi, giới tính, số trẻ em trong hộ gia đình và tình trạng hôn nhân cùng với dữ liệu y tế như điểm số hôn mê, điểm số phổi, mức đường huyết, HDL cholesterol, v.v. Một phương pháp tiền xử lý hiệu quả được thực hiện để xử lý các giá trị số và phân loại (không số) cùng với dữ liệu bị thiếu trong tập dữ liệu y tế. Mối tương quan giữa các biến trong dữ liệu y tế được phân tích bằng hệ số tương quan, và bản đồ nhiệt với mã màu được sử dụng để xác định các yếu tố ảnh hưởng đến điểm số xác suất nhạy cảm nhiễm bệnh (ISP) của COVID-19. Dựa trên độ chính xác, độ chính xác tỷ lệ, độ nhạy và điểm số F, nhận thấy rằng bộ phân loại rừng ngẫu nhiên cung cấp hiệu suất phân loại cải thiện so với hồi quy vector hỗ trợ cho tập dữ liệu y tế đã cho. Nền tảng phần mềm ứng dụng di động dựa trên hệ điều hành Android được phát triển sử dụng phương pháp dự đoán được đề xuất nhằm giúp các cá nhân khỏe mạnh dự đoán điểm số nhạy cảm trước nguy cơ nhiễm COVID-19 để thực hiện các biện pháp phòng ngừa. Dựa trên kết quả của phương pháp được đề xuất, các bác sĩ lâm sàng và quan chức chính phủ có thể tập trung vào những người có nguy cơ cao nhằm hạn chế sự lan rộng của đại dịch. Trong công trình hiện tại, các kỹ thuật bộ phân loại rừng ngẫu nhiên và hồi quy vector hỗ trợ được ứng dụng cho một tập dữ liệu y tế chứa 27 biến để dự đoán điểm số nhạy cảm của một cá nhân đối với nhiễm COVID-19, và độ chính xác của dự đoán được so sánh. Một bước tiền xử lý hiệu quả đã được thực hiện để xử lý dữ liệu bị thiếu trong tập dữ liệu y tế. Phân tích tương quan sử dụng bản đồ nhiệt được thực hiện trên dữ liệu y tế để phân tích các yếu tố ảnh hưởng đến điểm số xác suất nhạy cảm nhiễm bệnh (ISP) của COVID-19. Ma trận nhầm lẫn được tính toán để hiểu hiệu suất phân loại dựa trên số lượng chính xác dương tính, chính xác âm tính, sai dương tính và sai âm tính. Các giá trị này sau đó được sử dụng để tính toán độ chính xác, độ chính xác tỷ lệ, độ nhạy và điểm số F. Từ các kết quả phân loại, nhận thấy rằng bộ phân loại rừng ngẫu nhiên cung cấp độ chính xác phân loại 99,7%, độ chính xác tỷ lệ 99,8%, độ nhạy 98,8% và điểm số F 99,29% cho tập dữ liệu y tế đã cho. Phương pháp học máy được đề xuất có thể giúp các cá nhân thực hiện các biện pháp phòng ngừa bổ sung nhằm bảo vệ mọi người khỏi nhiễm COVID-19, và các bác sĩ lâm sàng và quan chức chính phủ có thể tập trung vào những người có nguy cơ cao nhằm hạn chế sự lan rộng của đại dịch.
Từ khóa
#COVID-19 #học máy #mô hình dự đoán #rừng ngẫu nhiên #hồi quy vector hỗ trợ #dữ liệu y tế #độ nhạy cảm nhiễm bệnhTài liệu tham khảo
Al-Karawi D. Machine learning analysis of chest CT scan images as a complementary digital test of coronavirus (COVID-19) patients. medRxiv. 2020.
Carrillo-Larco RM, Castillo-Cara M. Using country-level variables to classify countries according to the number of confirmed COVID-19 cases: an unsupervised machine learning approach. Wellcome Open Res. 2020;5(56):56.
Chen M, Hao Y, Hwang K, Wang L, Wang L. Disease prediction by machine learning over big data from healthcare communities. IEEE Access. 2017;5:8869–79. https://doi.org/10.1109/ACCESS.2017.2694446.
Hui DS, Azhar EI, Memish ZA, Zumla A. Human coronavirus infections—severe acute respiratory syndrome (SARS), Middle East respiratory syndrome (MERS), and SARS-CoV-2, vol. 2. 2nd ed: Elsevier Inc.; 2020. https://doi.org/10.1016/b978-0-12-801238-3.11634-4.
Li L, Yang Z, Dang Z, Meng C, Huang J, Meng H, et al. Propagation analysis and prediction of the COVID-19. Infect Dis Model. 2020;5:282–92. https://doi.org/10.1016/j.idm.2020.03.002.
Liu D. A machine learning methodology for real-time forecasting of the 2019-2020 COVID-19 outbreak using Internet searches, news alerts, and estimates from mechanistic models. arXiv preprint arXiv:2004.04019. 2020.
Mei X, Lee H, Diao K. Artificial intelligence–enabled rapid diagnosis of patients with COVID-19. Nat Med. 2020;26:1224–8. https://doi.org/10.1038/s41591-020-0931-3.
Metsky HC. CRISPR-based COVID-19 surveillance using a genomically-comprehensive machine learning approach. bioRxiv. 2020.
Narin, Ali, Ceren Kaya, and Ziynet Pamuk. Automatic detection of coronavirus disease (covid-19) using x-ray images and deep convolutional neural networks. arXiv preprint arXiv: 2003.10849. 2020.
Pandey G. SEIR and regression model based COVID-19 outbreak predictions in India. arXiv preprint arXiv:2004.00958. 2020.
Pavlou M, Ambler G, Seaman SR, Guttmann O, Elliott P, King M, et al. How to develop a more accurate risk prediction model when there are few events. BMJ 2016. 2015;353:i3235. https://doi.org/10.1136/bmj.i3235.
Qayyum A, Qadir J, Bilal M, Al Fuqaha A. Secure and robust machine learning for healthcare: a survey. IEEE Rev Biomed Eng. 2020:1. https://doi.org/10.1109/rbme.2020.3013489.
Repici A, Maselli R, Colombo M, Gabbiadini R, Spadaccini M, Anderloni A, et al. Coronavirus (COVID-19) outbreak: what the department of endoscopy should know. Gastrointest Endosc. 2020;92:1–6. https://doi.org/10.1016/j.gie.2020.03.019.
Singh S. Flipr Hiring Challenge, 1. 2020. Retrieved May 2020 from https://www.kaggle.com/srijansingh53/flipr-hiring-challenge/version/1. Accessed 30 May 2020.
Tang Z. Severity assessment of coronavirus disease 2019 (COVID-19) using quantitative features from chest CT images. arXiv preprint arXiv:2003.11988. 2020.
Wynants L, Van Calster B, Bonten MMJ, Collins GS, Debray TPA, De Vos M, et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. BMJ. 2020;369. https://doi.org/10.1136/bmj.m1328.
Yan L. Prediction of survival for severe Covid-19 patients with three clinical features: development of a machine learning-based prognostic model with clinical data in Wuhan. medRxiv. 2020.
Yan L, Zhang H-T, Goncalves J, Xiao Y, Wang M, Guo Y, et al. An interpretable mortality prediction model for COVID-19 patients. Nat Mach Intell. 2020;2:283–8. https://doi.org/10.1038/s42256-020-0180-7.
Yang Z, Zeng Z, Wang K, Wong SS, Liang W, Zanin M. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. J Thorac Dis. 2020a;12:165–74. https://doi.org/10.21037/jtd.2020.02.64.
Yang Z, Zeng Z, Wang K, Wong SS, Liang W, Zanin M, et al. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. J Thorac Dis. 2020b;12:165–74. https://doi.org/10.21037/jtd.2020.02.64.