Học sâu để dự đoán triệu chứng trầm cảm trong một tập dữ liệu văn bản lớn

Neural Computing and Applications - Tập 34 - Trang 721-744 - 2021
Md Zia Uddin1, Kim Kristoffer Dysthe2, Asbjørn Følstad1, Petter Bae Brandtzaeg1,2
1SINTEF Digital, Oslo, Norway
2University of Oslo, Oslo, Norway

Tóm tắt

Trầm cảm là một căn bệnh phổ biến trên toàn thế giới với những hệ quả nghiêm trọng. Việc xác định sớm các triệu chứng trầm cảm là bước đi quan trọng đầu tiên hướng đến việc đánh giá, can thiệp và ngăn ngừa tái phát. Với sự gia tăng số lượng tập dữ liệu có liên quan đến trầm cảm và sự phát triển của học máy, có khả năng phát triển các hệ thống thông minh để phát hiện triệu chứng trầm cảm trong tài liệu viết. Công trình này đề xuất một phương pháp hiệu quả dựa trên mạng nơ-ron hồi tiếp (Recurrent Neural Network - RNN) dựa trên bộ nhớ dài ngắn hạn (Long Short-Term Memory - LSTM) để xác định các văn bản mô tả triệu chứng trầm cảm mà người viết cảm nhận. Phương pháp này được áp dụng trên một tập dữ liệu lớn từ một kênh thông tin trực tuyến công cộng dành cho giới trẻ tại Na Uy. Tập dữ liệu bao gồm các câu hỏi dựa trên văn bản của giới trẻ trên kênh thông tin này. Các đặc trưng sau đó được cung cấp từ một quy trình one-hot trên các đặc trưng mạnh mẽ được trích xuất từ phản ánh của các triệu chứng trầm cảm có thể đã được định nghĩa trước bởi các chuyên gia y tế và tâm lý học. Các đặc trưng này tốt hơn so với các phương pháp thông thường, chủ yếu dựa vào tần suất từ (tức là, một số từ có tần suất cao nhất được chọn làm đặc trưng từ toàn bộ tập dữ liệu văn bản và được áp dụng để mô hình hóa các sự kiện tiềm ẩn trong bất kỳ tin nhắn văn bản nào) thay vì triệu chứng. Sau đó, một phương pháp học sâu được áp dụng (tức là RNN) để huấn luyện các đặc trưng theo thời gian phân biệt các văn bản mô tả triệu chứng trầm cảm từ các bài viết không có mô tả như vậy (bài viết không trầm cảm). Cuối cùng, RNN đã được huấn luyện được sử dụng để tự động dự đoán các bài viết về trầm cảm. Hệ thống được so sánh với các phương pháp thông thường và đã đạt được hiệu suất vượt trội hơn so với các phương pháp khác. Không gian phân biệt tuyến tính rõ ràng tiết lộ tính vững chắc của các đặc trưng bằng cách tạo ra cụm tốt hơn so với các đặc trưng truyền thống khác. Bên cạnh đó, vì các đặc trưng dựa trên các triệu chứng có thể của trầm cảm, hệ thống có thể tạo ra các giải thích ý nghĩa cho quyết định từ các mô hình học máy bằng cách sử dụng một thuật toán trí tuệ nhân tạo giải thích (Explainable Artificial Intelligence - XAI) gọi là Giải thích mô hình linh hoạt, không phụ thuộc (Local Interpretable Model-Agnostic Explanations - LIME). Phương pháp dựa trên các đặc trưng triệu chứng trầm cảm đề xuất cho thấy hiệu suất vượt trội so với các phương pháp truyền thống dựa trên tần suất từ chung, nơi tần suất của các đặc trưng trở nên quan trọng hơn các triệu chứng cụ thể của trầm cảm. Mặc dù phương pháp đề xuất được áp dụng trên một tập dữ liệu Na Uy, một phương pháp vững mạnh tương tự có thể được áp dụng trên các tập dữ liệu trầm cảm phát triển bằng các ngôn ngữ khác với ghi chú và trích xuất đặc trưng dựa trên triệu chứng phù hợp. Do đó, phương pháp dự đoán trầm cảm có thể được áp dụng để góp phần phát triển công nghệ chăm sóc sức khỏe tâm thần tốt hơn như chatbot thông minh.

Từ khóa

#trầm cảm #học sâu #mạng nơ-ron hồi tiếp #triệu chứng #dự đoán

Tài liệu tham khảo

WHO (2021) https://www-who-int.ezproxy.uio.no/news-room/fact-sheets/detail/suicide. Häfner H, Maurer K, Trendler G, an der Heiden W, Schmidt M (2005) The early course of schizophrenia and depression. Eur Arch Psychiatry Clin Neurosci 255(3):167–173 Fusar-Poli P, Nelson B, Valmaggia L, Yung AR, McGuire PK (2014) Comorbid depressive and anxiety disorders in 509 individuals with an at-risk mental state: impact on psychopathology and transition to psychosis. Schizophr Bull 40(1):120–131 World Health Organization (2017) Depression and other common mental disorders: global health estimates (No. WHO/MSD/MER/2017.2) Kessler RC, Bromet EJ (2013) The epidemiology of depression across cultures. Annu Rev Public Health 34:119–138. https://doi.org/10.1146/annurev-publhealth-031912-114409 Depression WHO (2017) Other common mental disorders: global health estimates. World Health Organization, Geneva, pp 1–24 Weinberger AH, Gbedemah M, Martinez AM, Nash D, Galea S, Goodwin RD (2018) Trends in depression prevalence in the USA from 2005 to 2015: widening disparities in vulnerable groups. Psychol Med 48(8):1308–1315 Cambria E, White B (2014) Jumping NLP curves: a review of natural language processing research. IEEE Comput Intell Mag 9(2):48–57 Picard RW (2003) Affective computing: challenges. Int J Human Comput Stud 59(1–2):55–64 Cambria E (2016) Affective computing and sentiment analysis. IEEE Intell Syst 31(2):102–107 Shangfei W, Guozhu P, Zhuangqiang Z, Zhiwei Xu (2019) Capturing emotion distribution for multimedia emotion tagging. IEEE Trans Affect Comput. https://doi.org/10.1109/taffc.2019.2900240 Havigerová JM, Haviger J, Kučera D, Hoffmannová P (2019) Text-based detection of the risk of depression. Front Psychol 10:513 Tao J, Tan T (2005) Affective computing: a review. In: Proceedings of the international conference on affective computing and intelligent interaction, pp 981–995 Yang H, Willis A, De Roeck A, Nuseibeh B (2012) A hybrid model for automatic emotion recognition in suicide notes. Biomed Inform Insights 5(1):17–30 Desmet B, Hoste VR (2013) Emotion detection in suicide notes. Expert Syst Appl 40(16):6351–6358 Allouch M, Azaria A, Azoulay R, Ben‐Izchak E, Zwilling M, Zachor DA (2018) Automatic detection of insulting sentences in conversation. Paper presented at: Proceedings of the 2018 IEEE international conference on the science of electrical engineering in Israel (ICSEE); pp 1–4; IEEE. John S, Ederyn W, Bruce C (1976) The social psychology of telecommunication. Wiley, London Strapparava C, Mihalcea R (2008) Learning to identify emotions in text. Paper presented at: Proceedings of the 2008 ACM symposium on applied computing, pp 1556–1560; ACM Ding Y, Chen X, Fu Q, Zhong S (2020) A depression recognition method for college students using deep integrated support vector algorithm. IEEE Access 8:75616–75629. https://doi.org/10.1109/ACCESS.2020.2987523 Yildirim E, Avci E (2018) Classificationof groutability of sands by linear discriminant analysis. ZBORNIK RADOVA GEO-EXPO 2018, Oct. 2018. Vannatta RA, LaVenia KN (2020) Linear discriminant analysis. In Atkinson P, Delamont S, Cernat A, Sakshaug JW, Williams RA (eds) SAGE research methods foundations. doi: https://doi.org/10.4135/9781526421036889610 Gardner-Lubbe S (2020) Linear discriminant analysis for multiple functional data analysis. J Appl Stat pp 1–17 Uddin MZ, Torresen J (2019) Activity recognition using smartphone sensors, robust features, and recurrent neural network. In: 2019 13th international symposium on medical information and communication technology (ISMICT), May 2019. Kiranyaz S, Ince T, Gabbouj M (2016) Real-time patient-specific ECG classification by 1-D convolutional neural networks. IEEE Trans Biomed Eng 63(3):664–675 Hinton GE, Osindero S, Teh Y-W (2006) A fast learning algorithm for deep belief nets. Neural Comput 18(7):1527–1554 Deboeverie F, Roegiers S, Allebosch G, Veelaert P, Philips W (2016) Human gesture classification by brute-force machine learning for exergaming in physiotherapy. In: Proceedings of IEEE conference on computational intelligence and games (CIG), Santorini, pp 1–7 Graves A, Mohamed A, Hinton G (2013) Speech recognition with deep recurrent neural networks. In: 2013 IEEE international conference on acoustics, speech and signal processing (ICASSP). IEEE, pp 6645–6649 Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780 Zaremba W, Sutskever I, Vinyals O (2014) Recurrent neural network regularization. arXiv preprint arXiv: 1409.2329 Gers FA, Schraudolph NN, Schmidhuber J (2003) Learning precise timing with LSTM recurrent networks. J Mach Learn Res 3:115–143 Sak H, Senior AW, Beaufays F (2014) Long short-term memory recurrent neural network architectures for large scale acoustic modeling. INTERSPEECH, pp 338–342 Kumari T, Mishra A (2020) Deep networks and deep learning algorithms. In: Artificial intelligence trends for data analytics using machine learning and deep learning approaches, pp 199–214 Liu P, Wang J, Guo Z (2020) Multiple and complete stability of recurrent neural networks with sinusoidal activation function. IEEE Trans Neural Netw Learn Syst, pp 1–12 Uddin MZ, Hassan M, Alsanad A, Savaglio C (2020) A body sensor data fusion and deep recurrent neural network-based behavior recognition approach for robust healthcare. Inform Fusion. https://doi.org/10.1016/j.inffus.2019.08.004 Govindasamy KA, Palanichamy N (2021) Depression detection using machine learning techniques on twitter data. In: 2021 5th international conference on intelligent computing and control systems (ICICCS), May 2021. Dong Y, Yang X (2021) A hierarchical depression detection model based on vocal and emotional cues. Neurocomputing 441:279–290 Fortino G, Parisi D, Pirrone V, Di Fatta G (2014) BodyCloud: a SaaS approach for community Body Sensor Networks. Futur Gener Comput Syst 35:62–79 Fortino G, Galzarano S, Gravina R, Li W (2015) A framework for collaborative computing and multi-sensor data fusion in body sensor networks. Inform Fusion 22:50–70 Zhang Y, Gravina R, Lu H, Villari M, Fortino G (2018) PEA: Parallel electrocardiogram-based authentication for smart healthcare systems. J Netw Comput Appl 117:10–16 Wang R, Hao Y, Yu Q, Chen M, Humar I, Fortino G (2021) Depression Analysis and Recognition based on Functional Near-infrared Spectroscopy. IEEE J Biomed Health Inform. doi: https://doi.org/10.1109/JBHI.2021.3076762. Epub ahead of print. PMID: 33929968. Hassan MM, Alam MGR, Uddin MZ, Huda S, Almogren A, Fortino G (2019) Human emotion recognition using deep belief network architecture. Inform Fusion 51:10–18 Tjoa E, Guan C (2021) A survey on explainable artificial intelligence (XAI): toward medical XAI. IEEE Trans Neural Netw Learn Syst. https://doi.org/10.1109/TNNLS.2020.3027314 Wang N, Kosinski M, Stillwell DJ, Rust J (2014) Can well-being be measured using Facebook status updates? Validation of facebook’s gross national happiness index. Soc Indic Res 115(1):483–491 Baines T, Baines T, Wittkowski A, Wittkowski A (2013) A systematic review of the literature exploring illness perceptions in mental health utilising the self-regulation model. J Clin Psychol Med Settin 20(3):263–274 Cohen JR, So FK, Young JF, Hankin BL, Lee BA (2019) Youth depression screening with parent and self-reports: assessing current and prospective depression risk. Child Psychiatry Hum Dev 50(4):647–660 Coyne JC, Thompson R, Racioppo MW (2001) Validity and efficiency of screening for history of depression by self-report. Psychol Assess 13(2):163–170 Sim AYL, Borthwick A (2018) Record2Vec: unsupervised representation learning for structured records. IEEE Int Confer Data Min 2018:1236–1241. https://doi.org/10.1109/ICDM.2018.00165 Yuan X, Li L, Shardt YAW, Wang Y, Yang C (2021) Deep learning with spatiotemporal attention-based LSTM for industrial soft sensor model development. IEEE Trans Industr Electron 68(5):4404–4414. https://doi.org/10.1109/TIE.2020.2984443