Một hệ thống lai hiệu quả cho việc phát hiện bất thường trong mạng xã hội

Cybersecurity - Tập 4 Số 1 - 2021
Md. Shafiur Rahman1, Sajal Halder2, Md. Ashraf Uddin2, Uzzal Kumar Acharjee2
1Department of Computer Science and Engineering, Dhaka International University, Dhaka, Bangladesh
2Department of Computer Science and Engineering, Jagannath University, Dhaka, Bangladesh

Tóm tắt

Tóm tắtPhát hiện bất thường đã trở thành một lĩnh vực nghiên cứu thiết yếu và năng động trong khai thác dữ liệu. Nhiều ứng dụng khác nhau, bao gồm các mạng xã hội, đã áp dụng nhiều phương pháp hiện đại khác nhau để xác định bất thường nhằm đảm bảo an ninh và quyền riêng tư cho người dùng. Mạng xã hội đề cập đến một diễn đàn được sử dụng bởi các nhóm người khác nhau để bày tỏ suy nghĩ, giao tiếp với nhau và chia sẻ nội dung cần thiết. Những mạng xã hội này cũng tạo điều kiện cho các hoạt động bất thường, phát tán tin tức giả, tin đồn, thông tin sai lệch, tin nhắn không mong muốn và tuyên truyền các liên kết độc hại. Do đó, việc phát hiện các bất thường là một trong những hoạt động phân tích dữ liệu quan trọng để xác định người dùng bình thường hoặc bất thường trên các mạng xã hội. Trong bài báo này, chúng tôi đã phát triển một phương pháp phát hiện bất thường lai có tên DT-SVMNB, kết hợp nhiều thuật toán học máy bao gồm cây quyết định (C5.0), Máy Vector Hỗ trợ (SVM) và bộ phân loại Bayes đơn giản (NBC) để phân loại người dùng bình thường và bất thường trong các mạng xã hội. Chúng tôi đã trích xuất một danh sách các đặc điểm độc đáo từ hồ sơ và nội dung của người dùng. Sử dụng hai loại dữ liệu với các đặc điểm đã chọn, mô hình học máy đề xuất có tên DT-SVMNB được huấn luyện. Mô hình của chúng tôi phân loại người dùng thành người trầm cảm hoặc người có ý định tự tử trong mạng xã hội. Chúng tôi đã tiến hành một thí nghiệm về mô hình của mình bằng cách sử dụng dữ liệu tổng hợp và dữ liệu thực từ mạng xã hội. Phân tích hiệu suất cho thấy độ chính xác khoảng 98%, điều này chứng minh hiệu quả và năng suất của hệ thống mà chúng tôi đề xuất.

Từ khóa


Tài liệu tham khảo

Abulaish, M, Bhat SY (2015) Classifier ensembles using structural features for spammer detection in online social networks. Found Comput Decis Sci 40(2):89–105.

Adewole, KS, Anuar NB, Kamsin A, Varathan KD, Razak SA (2017) Malicious accounts: dark of the social networks. J Netw Comput Appl 79:41–67.

Ahmed, F, Abulaish M (2013) A generic statistical approach for spam detection in online social networks. Comput Commun 36(10-11):1120–1129.

Aljawarneh, S, Aldwairi M, Yassein MB (2018) Anomaly-based intrusion detection system through feature selection analysis and building hybrid efficient model. J Comput Sci 25:152–160.

Almeida, T, Hidalgo JMG, Silva TP (2013) Towards sms spam filtering: Results under a new dataset. Int J Inf Secur Sci 2(1):1–18.

Ashraf Uddin, M, Stranieri A, Gondal I, Balasubramanian V (2020) Dynamically recommending repositories for health data: a machine learning model In: Proceedings of the Australasian Computer Science Week Multiconference, 1–10.. ACM. https://dl.acm.org/doi/abs/10.1145/3373017.3373041.

Belavagi, MC, Muniyal B (2016) Performance evaluation of supervised machine learning algorithms for intrusion detection. Procedia Comput Sci 89:117–123.

Benevenuto, F, Rodrigues T, Cha M, Almeida V (2012) Characterizing user navigation and interactions in online social networks. Inf Sci 195:1–24.

Bindu, P, Thilagam PS, Ahuja D (2017) Discovering suspicious behavior in multilayer social networks. Comput Hum Behav 73:568–582.

Caruana, G, Li M (2012) A survey of emerging approaches to spam filtering. ACM Comput Surv (CSUR) 44(2):9.

Çatak, FÖ, Mustacoglu AF (2018) Cpp-elm: cryptographically privacy-preserving extreme learning machine for cloud systems. Int J Comput Intell Syst 11(1):33–44.

Chen, C-M, Guan D, Su Q-K (2014) Feature set identification for detecting suspicious urls using bayesian classification in social networks. Inf Sci 289:133–147.

Chu, Z, Widjaja I, Wang H (2012) Detecting social spam campaigns on twitter In: International Conference on Applied Cryptography and Network Security, 455–472.. Springer.

Erdélyi, M, Garzó A, Benczúr AA (2011) Web spam classification: a few features worth more In: Proceedings of the 2011 Joint WICOW/AIRWeb Workshop on Web Quality, 27–34.. ACM. https://dl.acm.org/.

Gupta, A, Kaushal R (2015) Improving spam detection in online social networks In: 2015 International Conference on Cognitive Computing and Information Processing (CCIP), 1–6.. IEEE. https://ieeexplore.ieee.org/document/7100738.

Islam, MR, Kabir MA, Ahmed A, Kamal ARM, Wang H, Ulhaq A (2018) Depression detection from social network data using machine learning techniques. Health Inf Sci Syst 6(1):8.

Manjunatha, H, Mohanasundaram R (2018) Brnads: Big data real-time node anomaly detection in social networks In: 2018 2nd International Conference on Inventive Systems and Control (ICISC), 929–932.. IEEE. https://ieeexplore.ieee.org/abstract/document/8398937.

Martinez-Romo, J, Araujo L (2013) Detecting malicious tweets in trending topics using a statistical analysis of language. Expert Syst Appl 40(8):2992–3000.

Rahman, MS, Dey LR, Haider S, Uddin MA, Islam M (2017) Link prediction by correlation on social network In: 2017 20th International Conference of Computer and Information Technology (ICCIT), 1–6.. IEEE. https://ieeexplore.ieee.org/abstract/document/8281812.

Rathore, S, Loia V, Park JH (2018) Spamspotter: An efficient spammer detection framework based on intelligent decision support system on facebook. Appl Soft Comput 67:920–932.

Rathore, S, Sangaiah AK, Park JH (2018) A novel framework for internet of knowledge protection in social networking services. J Comput Sci 26:55–65.

Savyan, P, Bhanu SMS (2017) Behaviour profiling of reactions in facebook posts for anomaly detection In: 2017 Ninth International Conference on Advanced Computing (ICoAC), 220–226.. IEEE. https://ieeexplore.ieee.org/abstract/document/8441402.

Sohrabi, MK, Karimi F (2018) A feature selection approach to detect spam in the facebook social network. Arab J Sci Eng 43(2):949–958.

Sudha, MS, Priya KA, Lakshmi AK, Kruthika A, Priya DL, Valarmathi K (2018) Data mining approach for anomaly detection in social network analysis In: 2018 Second International Conference on Inventive Communication and Computational Technologies (ICICCT), 1862–1866.. IEEE. https://ieeexplore.ieee.org/abstract/document/8472985.

Thaseen, IS, Kumar CA (2017) Intrusion detection model using fusion of chi-square feature selection and multi class svm. J King Saud Univ-Comput Inf Sci 29(4):462–472.

Thaseen, IS, Kumar CA, Ahmad A (2019) Integrated intrusion detection model using chi-square feature selection and ensemble of classifiers. Arab J Sci Eng 44(4):3357–3368.

Uddin, MA, Stranieri A, Gondal I, Balasubramanian V (2020) Rapid health data repository allocation using predictive machine learning. Health Inf J 26(4):3009–3036. SAGE Publications Sage UK: London, England.

Wang, D, Irani D, Pu C (2014) Spade: a social-spam analytics and detection framework. Soc Netw Anal Min 4(1):189.

Xu, H, Sun W, Javaid A (2016) Efficient spam detection across online social networks In: 2016 IEEE International Conference on Big Data Analysis (ICBDA), 1–6.. IEEE. https://ieeexplore.ieee.org/abstract/document/7509829.

Yang, C, Harkreader R, Gu G (2013) Empirical evaluation and new design for fighting evolving twitter spammers. IEEE Trans Inf Forensic Secur 8(8):1280–1293.

Yang, Z, Wilson C, Wang X, Gao T, Zhao BY, Dai Y (2014) Uncovering social network sybils in the wild. ACM Trans Knowl Discov Data (TKDD) 8(1):2.

Yasami, Y, Safaei F (2017) A statistical infinite feature cascade-based approach to anomaly detection for dynamic social networks. Comput Commun 100:52–64.

Yazdi, HS, Bafghi AG, et al. (2020) A drift aware adaptive method based on minimum uncertainty for anomaly detection in social networking. Expert Syst Appl 162:113881.

Yu, D, Chen N, Jiang F, Fu B, Qin A (2017) Constrained nmf-based semi-supervised learning for social media spammer detection. Knowl-Based Syst 125:64–73.

Zephoria Digital Marketing (2018) The Top 20 Valuable Facebook Statistics – Updated April 2018. https://zephoria.com/top-15-valuable-facebook-statistics/. Accessed 11 May 2018.

Zheng, X, Zeng Z, Chen Z, Yu Y, Rong C (2015) Detecting spammers on social networks. Neurocomputing 159:27–34.

Zhou, B, Yao Y, Luo J (2014) Cost-sensitive three-way email spam filtering. J Intell Inf Syst 42(1):19–45.