Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Khái thác ý kiến và phân tích cảm xúc cho các văn bản trực tuyến tiếng Ả Rập: ứng dụng trong lĩnh vực chính trị
Tóm tắt
Kể từ sự bùng nổ không ngừng của nội dung báo chí trực tuyến và bối cảnh chính trị đang thay đổi ở nhiều quốc gia Ả Rập, chúng tôi đã bắt đầu nghiên cứu hiện tại để triển khai một hệ thống giám sát truyền thông về việc khái thác ý kiến trong lĩnh vực chính trị. Hệ thống này cho phép các diễn viên chính trị, mặc dù lượng dữ liệu trực tuyến rất lớn, luôn được thông báo về các ý kiến được đưa ra trên web nhằm giám sát chính xác vị thế hiện tại của họ, định hướng chiến lược truyền thông và chuẩn bị cho các chiến dịch bầu cử. Hệ thống được phát triển dựa trên một tiếp cận ngôn ngữ học, sử dụng động cơ ngôn ngữ NooJ để chính thức hóa các quy tắc nhận diện tự động và áp dụng chúng vào một tập hợp động gồm các bài báo báo chí. Các quy tắc đầu tiên đã được thực hiện cho phép xác định và gán nhãn các thực thể chính trị khác nhau (các diễn viên chính trị và tổ chức). Sau đó, các nhãn này được sử dụng trong hệ thống giám sát truyền thông của chúng tôi để xác định các ý kiến liên quan đến các thực thể tên đã được trích xuất. Hệ thống chủ yếu dựa trên một bộ ngữ pháp địa phương được phát triển cho việc nhận diện các cấu trúc khác nhau của các cụm từ ý kiến chính trị. Các ngữ pháp này sử dụng các mục từ của từ điển ý kiến, chứa các từ diễn đạt ý kiến khác nhau (động từ, tính từ, danh từ) nơi mỗi mục từ được gán với ký hiệu ngữ nghĩa tương ứng (đảo ngược và cường độ). Hệ thống mà chúng tôi phát triển có khả năng xác định và gán nhãn chính xác người giữ ý kiến, mục tiêu ý kiến và đảo ngược (tích cực hoặc tiêu cực) của cụm biểu đạt ngữ nghĩa (danh từ hoặc động từ) diễn đạt ý kiến. Các thí nghiệm của chúng tôi đã cho thấy rằng phương pháp trích xuất được áp dụng đạt độ chính xác 0.83 F-measure.
Từ khóa
Tài liệu tham khảo
Abdul-Mageed, M. & Diab M. (2012a). AWATIF: A multi-genre corpora for modern standard arabic subjectivity and sentiment analysis. LREC, Istanbul, Turkey
Abdul-Mageed, M. & Diab, M. (2012b). Toward building a large-scale arabic sentiment lexicon. In Proceedings of the 6th International Global WordNet Conference.
Abdul-Mageed, M., Diab, M. T., & Korayem, M. (2011). Subjectivity and sentiment analysis of modern standard Arabic. In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies: short papers (vol. 2, pp. 587–591). Association for Computational Linguistics.
Abdul-Mageed, M., Diab, M., & Kübler, S. (2014). SAMAR: Subjectivity and sentiment analysis for Arabic social media. Computer Speech & Language, 28(1), 20–37.
Alaa El-Dine, A. H., & Fatma El-zahraa, E.-t. (2013). Sentiment analyzer for Arabic comments system. International Journal of Advanced Computer Science and Applications.
Amira, F. E. G., Torky, I. S., Maha, A. H., Mohamed, M. E. D. (2013). A computational approach for analyzing and detecting emotions in Arabic text. International Journal of Engineering Research and Applications (IJERA), 3, 100–107.
Bing, L. (2010). Sentiment analysis and subjectivity. In Handbook of Natural Language Processing, (pp. 627–666). Boca Raton, FL: CRC Press.
Esuli, A. & Sebastiani, F. (2006). SentiWordNet: A publicly available lexical resource for opinion mining. In LREC06.
Farra, N., Challita, E., Assi, R. A., & Hajj, H. (2010). Sentence-level and document-level sentiment mining for Arabic texts. In IEEE International Conference, (pp. 1114–1119).
Maamouri, M., Bies, A., Buckwalter, T., & Mekki, W. (2004). The penn arabic treebank: Building a large-scale annotated arabic corpus. In NEMLAR conference on Arabic language resources and tools (vol. 27, pp. 466–467).
Mathieu, Y. Y. (2005). Annotation of emotions and feelings in texts. In International Conference on Affective Computing and Intelligent Interaction (pp. 350–357). Berlin: Springer.
Mesfar, S. (2008). Analyse morpho-syntaxique et reconnaissance des entités nommées en arabe standard. Thèse, Université de franche-comté, France.
Mesfar, S. (2010). Towards a cascade of morpho-syntactic tools for Arabic natural language processing. In Proceedings of CICLing 2010, LNCS 6008, (pp. 150–162).
Pang, B., Lee, L. & Vaithyanathan, S. (2002). Thumbs up? Sentiment classification using machine learning techniques. In Proceedings of the ACL-02 conference on Empirical methods in natural language processing. Association for Computational Linguistics, (pp. 79–86).
Strapparava, C. & Valitutti, A. (2004). WordNet-Affect: An affective extension of WordNet. In Proceedings of LREC (vol. 4, pp. 1083–1086).
Silberztein, M. (2015). La formalisation des langues : l’approche de NooJ. ISTE Ed.: Londres (p. 426).
Vernier, M. & Monceaux, L. (2009). Enrichissement d’un lexique de termes subjectifs à partir de tests sémantiques.
Wiebe, J. M., Bruce, R. F. & O’hara, T. P. (1999). Development and use of a gold-standard data set for subjectivity classifications. In Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics. Association for Computational Linguistics (pp. 246–253).