Phân tích cảm xúc trên dữ liệu văn bản đa miền bằng các phương pháp học máy truyền thống và học sâu

Multimedia Tools and Applications - Tập 82 - Trang 30759-30782 - 2023
K. Paramesha1, H. L. Gururaj2, Anand Nayyar3, K. C. Ravishankar4
1Vidyavardhaka College of Engineering, Mysuru, India
2Department of Information Technology, Manipal Institute of Technology Bengaluru, Manipal Academy of Higher Education, Manipal, India
3Graduate School, Faculty of Information Technology, Duy Tan University, Da Nang, Viet Nam
4Department of Computer Science, Engineering, Hassan, India

Tóm tắt

Phân tích Cảm xúc (SA) sử dụng các phương pháp học máy là một lĩnh vực nghiên cứu thú vị nhằm khám phá ý kiến của người dùng trực tuyến. Nó giải quyết vấn đề phân loại các ý kiến được bày tỏ về một sản phẩm hoặc dịch vụ trong các văn bản đánh giá là tích cực, tiêu cực hoặc trung tính. Phân loại ngoài các lớp nhị phân đặt ra những thách thức lớn hơn khi sử dụng học máy. Trong bài báo này, hai bộ phương pháp được trình bày, bộ phương pháp đầu tiên dựa trên học máy truyền thống và bộ thứ hai dựa trên kỹ thuật học sâu đã được đánh giá và phân tích cho phân loại độ phân cực đa lớp ở mức tinh vi trên tập dữ liệu đánh giá đa miền. Phân tích hiệu suất của các phương pháp học máy truyền thống bao gồm các mô hình tập hợp và kết hợp các đặc trưng ngữ nghĩa và thống kê đa dạng, cho thấy rằng các mô hình tập hợp hoạt động tốt hơn trong danh mục của chúng. Với mô hình tài liệu cảm xúc được đề xuất kết hợp với độ ổn định của các mô hình tập hợp đã đề xuất, chúng tôi đã có thể điều tra và xác lập rằng độ phân cực của tài liệu có thể phục vụ như một thông tin chung tiềm ẩn giúp nâng cao hiệu suất của mô hình trong việc dự đoán cảm xúc ở cấp độ câu và tài liệu. Hơn nữa, việc đánh giá các mô hình học sâu cho thấy chúng là lựa chọn khả thi hơn cho phân loại độ phân cực đa lớp của tập dữ liệu đa miền. Chúng vượt trội hơn so với các phương pháp truyền thống dựa trên trích xuất và kỹ thuật đặc trưng và đạt được độ chính xác và điểm F1 tốt hơn.

Từ khóa

#phân tích cảm xúc #học máy #học sâu #phân loại độ phân cực #dữ liệu đa miền

Tài liệu tham khảo

Aggarwal CC, Zhai C (2012) Mining text data (Springer Science Business Media, 2012) Al-Moslmi T, Omar N, Abdullah S, Albared M (2017) Approaches to cross-domain sentiment analysis: a systematic literature review. IEEE access 5:16173 Aue A, Gamon M (2005) .. In: Proceedings of recent advances in natural language processing (RANLP), vol 1 (Citeseer, 2005), pp 2–1 Baccianella S, Esuli A, Sebastiani F (2010) .. In: LREC, vol 10, pp 2200–2204 Benamara F, Chardon B, Mathieu Y, Popescu V, Asher N (2012) .. In: Proceedings of the workshop on extra-propositional aspects of meaning in computational linguistics (Association for computational linguistics, 2010), pp 10–18 Benamara F, Chardon B, Mathieu YY, Popescu V et al (2011). In: IJCNLP, pp 1180–1188 Boiy E, Moens MF (2009) A machine learning approach to sentiment analysis in multilingual web texts. Inf Retrieval 12(5):526 Church KW, Hanks P (1990) Word association norms, mutual information, and lexicography. Comput Linguist 16(1):22 De Marneffe MC, MacCartney B, Manning CD et al (2006) .. In: Proceedings of LREC, vol 6 (Genoa Italy, 2006), vol 6, pp 449–454 Ding X, Liu B, Yu PS (2008) .. In: Proceedings of the 2008 international conference on web search and data mining (ACM, 2008), pp 231–240 Esuli A, Sebastiani F (2006) .. In: EACL, vol 6, p 2006 Hoang M, Bihorac OA, Rouces J (2019) .. In: NEAL proceedings of the 22nd nordic conference on computional linguistics (NoDaLiDa), September 30-October 2, Turku, Finland (Linköping University Electronic Press, 2019), vol 167, pp 187–196 Hung C, Chen SJ (2016) Word sense disambiguation based sentiment lexicons for sentiment classification. Knowl-Based Syst 110:224 Indurkhya N, Damerau FJ (2010) Handbook of natural language processing, vol 2 (CRC Press, 2010) Ji-won J, Jee-Eun K (2017) Sentiment analysis utilizing modal expressions. J British American Studies 39:179 Kaji N, Kitsuregawa M (2007) .. In: EMNLP-CoNLL (2007), pp 1075–1083 Koppel M, Schler J (2006) The importance of neutral examples for learning sentiment. Comput Intell 22(2):100 Kotzias D, Denil M, De Freitas N, Smyth P (2015) .. In: Proceedings of the 21th ACM SIGKDD international conference on knowledge discovery and data mining (ACM, 2015), pp 597–606 Ku LW, Lee CY, Chen HH (2009) Identification of opinion holders. Comput Linguist Chinese Language Process:383 Li X, Bing L, Zhang W, Lam W (2019) Exploiting bert for end-to-end aspect-based sentiment analysis, arXiv:1910.00883 Li T, Sindhwani V, Ding C, Zhang Y (2009) .. In: Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval, pp 716–717 Liu B (2007) Web data mining: exploring hyperlinks, contents and usage data (Springer Science & Business Media Liu B (2012) Sentiment analysis and opinion mining. Synthesis Lectures Human Language Technol 5(1):1 Liu Y, Yu X, Chen Z, Liu B (2013) Proceedings of the 2013 international workshop on Mining unstructured big data using natural language processing (ACM, 2013), pp 39–44 Liu Y, Yu X, Liu B, Chen Z (2014) .. In: Proceedings of the 15th international conference on computational linguistics and intelligent text processing-vol 8404 (Springer New York, Inc., 2014), pp 1–16 Martineau J, Finin T (2009) Delta tfidf: an improved feature space for sentiment analysis. Icwsm 9:106 McDonald R, Hannan K, Neylon T, Wells M, Reynar J (2007) .. In: Proceedings of the 45th annual meeting of the association of computational linguistics, pp 432–439 Mihalcea R (2011) .. In: Encyclopedia of machine learning (Springer, 2011), pp 1027–1030 Mikolov T, Sutskever I, Chen K, Corrado GS, Dean J (2013) .. In: Advances in neural information processing systems, pp 3111–3119 Narayanan R, Liu B, Choudhary A (2009) .. In: Proceedings of the 2009 conference on empirical methods in natural language processing: vol 1. (Association for computational linguistics, 2009), pp 180–189 Paltoglou G, Thelwall M (2010) .. In: Proceedings of the 48th annual meeting of the association for computational linguistics (Association for computational linguistics, 2010), pp 1386–1395 Pang B, Lee L (2004) .. In: Proceedings of the 42nd annual meeting on association for computational linguistics (Association for computational linguistics, 2004), p 271 Pang B, Lee L (2004) A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts. In: Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics (ACL-04), pages 271–278, Barcelona, Spain Pang B, Lee L, et al. (2008) Opinion mining and sentiment analysis. Found Trends®;, Inf Retrieval 2(1–2):1 Paramesha K, Gururaj H, Jena OP (2021) Applications of machine learning in biomedical text processing and food industry. Mach Learn Healthcare Appl:151–167 Paramesha K, Ravishankar KC (2016) Analysis of opinionated text for opinion mining. Mach Learn Appl: Int J (MLAIJ) 3(2):65 Polpinij J, Ghose AK (2008) .. In: Proceedings of the 2008 IEEE/WIC/ACM international conference on web intelligence and intelligent agent technology-vol 01 (IEEE computer society, 2008), pp 518–524 Poria S, Cambria E, Gelbukh A (2016) Aspect extraction for opinion mining with a deep convolutional neural network. Knowl-Based Syst 108:42 Severyn A, Moschitti A (2015) .. In: Proceedings of the 38th international ACM SIGIR conference on research and development in information retrieval, pp 959–962 Stevenson M, Wilks Y (2003) Word sense disambiguation. The Oxford Handbook of Comp. Linguistics pp 249–265 Sumanth C, Inkpen D (2015) .. In: Proceedings of the 6th workshop on computational approaches to subjectivity, sentiment and social media analysis, pp 115–121 Sun C, Huang L, Qiu X (2019) Utilizing bert for aspect-based sentiment analysis via constructing auxiliary sentence, arXiv:1903.09588 Täckström O, McDonald R (2011) .. In: Advances in information retrieval (Springer, 2011), pp 368–374 Turney PD (2002) .. In: Proceedings of the 40th annual meeting on association for computational linguistics (Association for computational linguistics, 2002), pp 417–424 Wang G, Sun J, Ma J, Xu K, Gu J (2014) Sentiment classification: the contribution of ensemble learning. Decision Support Syst 57:77 Whitelaw C, Garg N, Argamon S (2005) .. In: Proceedings of the 14th ACM international conference on Information and knowledge management (ACM, 2005), pp 625–631 Wiebe J, Mihalcea R (2006) .. In: Proceedings of the 21st international conference on computational linguistics and the 44th annual meeting of the association for computational linguistics (Association for computational linguistics, 2006), pp 1065–1072 Wiegand M, Balahur A, Roth B, Klakow D, Montoyo A (2010) .. In: Proceedings of the workshop on negation and speculation in natural language processing (Association for computational linguistics, 2010), pp 60–68 Wilson T, Wiebe J, Hoffmann P (2009) Recognizing contextual polarity: an exploration of features for phrase-level sentiment analysis. Comput Linguist 35(3):399 Xu H, Liu B, Shu L, Yu PS (2019) Bert post-training for review reading comprehension and aspect-based sentiment analysis, arXiv:1904.02232 Yadav A, Vishwakarma DK (2020) Sentiment analysis using deep learning architectures: a review. Artif Intell Rev 53(6):4335 Yarowsky D (2010) .. In: Handbook of natural language processing, 2nd edn. (Chapman and Hall/CRC, 2010), pp 315–338 Zhang L, Wang S, Liu B (2018) Deep learning for sentiment analysis: a survey. Wiley Interdisciplinary Rev: Data Mining Knowl Discover 8(4):e1253 Zhang W, Yoshida T, Tang X (2011) A comparative study of tf* idf, lsi and multi-words for text classification. Expert Syst Appl 38(3):2758