Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Robot thông minh Simon với Phân tích Tâm trạng Công chúng cho Việc Phân loại Tweet về Covid-19 Mới
Tóm tắt
Trong kỷ nguyên hiện đại ngày nay, sự bùng phát của đại dịch COVID-19 đã tạo ra một cuộc khủng hoảng thông tin. Các cảm xúc công cộng được thu thập từ nhiều phản ánh khác nhau (hashtag, bình luận, tweet, bài đăng trên Twitter) được đo lường một cách tương ứng, đảm bảo rằng các quyết định chính sách và thông điệp khác nhau được tích hợp vào quy trình. Việc thực hiện này thể hiện trực giác trong việc nâng cao cảm giác sợ hãi của cộng đồng khi COVID-19 tiến đến mức tối đa trên toàn cầu, bằng cách sử dụng phân tích văn bản chi tiết với sự hỗ trợ của trực quan hóa dữ liệu văn bản cần thiết. Hơn nữa, khung kỹ thuật của các phương pháp phân tầng học máy cũng được cung cấp trong bối cảnh phân tích văn bản, và so sánh hiệu quả của chúng trong việc phân loại tweets về coronavirus với các độ dài khác nhau. Sử dụng phương pháp Naïve Bayes, độ chính xác đạt được là 91% cho các tweet ngắn và sử dụng phương pháp phân loại hồi quy logistic, độ chính xác đạt được là 74% cho các tweet ngắn.
Từ khóa
#COVID-19 #phân tích tâm trạng #học máy #phân loại tweet #Naïve Bayes #hồi quy logisticTài liệu tham khảo
COVID-19: briefing materials homepage. https://www.mckinsey.com/~/media/mckinsey/business%20functions/risk/our%20insights/covid%2019%20implications%20for%20business/covid%2019%20may%2013/covid-19-facts-and-insights-may-6.ashx. Accessed 11 June 2020.
Jin, D, Jin, Z, Zhou, J.T, Szolovits, P. Is bert really robust? A strong baseline for natural language attack on text classification and entailment. arXiv 2019. arXiv:1907.11932.
Samuel, J. Information Token Driven Machine Learning for Electronic Markets: Performance Effects in Behavioral Financial Big Data Analytics. JISTEM J. Inf. Syst. Technol. Manag. 2017;14:371–83.
Shu K, Sliva A, Wang S, Tang J, Liu H. Fake news detection on social media: a data mining perspective. ACM SIGKDD Explor Newsl. 2017;19:22–36.
Makris C, Pispirigos G, Rizos IO. A distributed bagging ensemble methodology for community prediction in social networks. Information. 2020;11:199.
Heist N, Hertling S, Paulheim H. Language-agnostic relation extraction from abstracts in Wikis. Information. 2018;9:75.
Akula V, Shen J, et al. A novel social media competitive analytics framework with sentiment benchmarks. Inf Manag. 2015;52:801–12.
Wang W, Tang J, Wei F. Updated understanding of the outbreak of 2019 novel coronavirus (2019-nCoV) in Wuhan, China. J Med Virol. 2020;92(4):441–7.
Coronavirus disease 2019 (COVID-19): situation report. World Health Organization; 2020. p. 70.
World Health Organization. Report of the WHO-China Joint Mission on Coronavirus Disease 2019 (COVID-19) February 2020 [Internet]. Available from: https://www.who.int/news-room/commentaries/detail/modes-of-transmission-of-virus-causing-covid-19-implications-for-ipc-precautionrecommendations.
Centers for Disease Control and Prevention Symptoms of coronavirus. 2020. https://www.cdc.gov/coronavirus/2019-ncov/symptoms-testing/symptoms. Accessed 11 July 2020.
India COVID-19 TRACKER. 2020. https://www.covid19india.org. Accessed 11 July 2020.
Barkur G, Vibha: Sentiment analysis of nationwide lockdown due to COVID 19 outbreak: Evidence from India. Asian J Psychiatr 2020; 51:102089. https://doi.org/10.1016/j.ajp.2020.102089.
Regression. https://www.educba.com/regression-formula/. Accessed May 2020.
Ren J, Lee SD, Chen X, Kao B, Cheng R, Cheung D. Naïve Bayes classification of uncertain data. In: ICDM 2009, the ninth IEEE international conference on data mining, Miami, Florida, USA, 6–9 Dec 2009.
Khare P, Burse K. Feature selection using genetic algorithm. Int J Comput Sci Inf Technol IJCSIT. 2016;1:194–6.
Kretinin A,Samuel J, Kashyap, R. When the going gets tough, the tweets get going! An exploratory analysis of tweets sentiments in the stock market. Am J Manag 2018;18.
Conner C, Samuel J, Kretinin A, et al. A picture for the words! Textual visualization in big data analytics. Northeast Bus Econ Assoc Annu Proc. 2019;46:37–43.
Pepin L, Kuntz P, Blanchard J, Guillet F, Suignard P. Visual analytics for exploring topic long-term evolution and detecting weak signals in company targeted tweets. Comput Ind Eng 2017;112:450–8.
Saif H, Fernández M, He Y, Alani H. On stopwords, filtering and data sparsity for sentiment analysis of twitter. In: European Language Resources Association (ELRA): Reykjavik, Iceland; 2014.
Ravi. K, Ravi. V. A survey on opinion mining and sentiment analysis: Tasks, approaches and applications. Knowl. Based Syst 2015;89:14–46.
Widener MJ, Li W. Using geolocated Twitter data to monitor the prevalence of healthy and unhealthy food references across the US. Appl Geogr 2014;54:189–97.
Wang Z, Ye X, Tsou MH. Spatial, temporal, and content analysis of Twitter for wildfire hazards. Nat Hazards 2016;83:523–40.
Nagar R, Yuan Q, Freifeld CC, Santillana M, Nojima A, Chunara R, Brownstein JS. A case study of the New York City 2012–2013 influenza season with daily geocoded Twitter data from temporal and spatiotemporal perspectives. J Med Internet Res 2014;16:e236.