Phát hiện cộng đồng trong mạng xã hội

Data Mining and Knowledge Discovery - Tập 24 - Trang 515-554 - 2011
Symeon Papadopoulos1,2, Yiannis Kompatsiaris1, Athena Vakali2, Ploutarchos Spyridonos2
1Informatics and Telematics Institute, CERTH, Thessaloniki, Greece
2Department of Informatics, Aristotle University of Thessaloniki, Thessaloniki, Greece

Tóm tắt

Bài khảo sát đề xuất thảo luận chủ đề phát hiện cộng đồng trong bối cảnh Mạng xã hội. Phát hiện cộng đồng là một công cụ quan trọng cho việc phân tích các mạng lưới phức tạp, cho phép nghiên cứu các cấu trúc mesoscopic thường liên quan đến các đặc điểm tổ chức và chức năng của các mạng lưới cơ sở. Phát hiện cộng đồng đã chứng minh giá trị của nó trong nhiều lĩnh vực, chẳng hạn như sinh học, khoa học xã hội và thư mục học. Tuy nhiên, mặc dù quy mô chưa từng có, độ phức tạp và bản chất động của các mạng lưới được thu thập từ dữ liệu Mạng xã hội, vẫn có rất ít thảo luận về phát hiện cộng đồng trong bối cảnh này. Cụ thể hơn, hầu như không có thảo luận nào về các đặc điểm hiệu suất của các phương pháp phát hiện cộng đồng cũng như việc khai thác kết quả của chúng trong bối cảnh khai thác dữ liệu web và các kịch bản truy xuất thông tin trong thế giới thực. Để đạt được điều này, bài khảo sát đầu tiên xác định khái niệm cộng đồng và vấn đề phát hiện cộng đồng trong bối cảnh Mạng xã hội, đồng thời cung cấp một phân loại ngắn gọn các thuật toán hiện có dựa trên các nguyên tắc phương pháp của chúng. Bài khảo sát đặc biệt nhấn mạnh hiệu suất của các phương pháp hiện tại về mặt độ phức tạp tính toán và yêu cầu bộ nhớ. Nó trình bày cả một thảo luận so sánh lý thuyết và thực nghiệm về một số phương pháp phổ biến. Ngoài ra, bài khảo sát thảo luận về khả năng ứng dụng gia tăng của các phương pháp và đề xuất năm chiến lược để mở rộng việc phát hiện cộng đồng tới các mạng lưới thực tế với quy mô lớn. Cuối cùng, bài khảo sát đề cập đến việc giải thích và khai thác kết quả phát hiện cộng đồng trong bối cảnh các ứng dụng và dịch vụ web thông minh.

Từ khóa

#phát hiện cộng đồng #mạng xã hội #phân tích mạng #thuật toán #khai thác dữ liệu

Tài liệu tham khảo

Chakrabarti D (2004) Autopart: parameter-free graph partitioning and outlier detection. Lecture notes in computer science 3202. Springer, pp 112–124

Donetti L, Munoz MA (2004) Detecting network communities: a new systematic and efficient algorithm. J Stat Mech P10012. doi:10.1088/1742-5468/2004/10/P10012

Fortunato S, Castellano C (2007) Community structure in graphs. Eprint arXiv:0712.2716

Java A, Joshi A, Finin T (2008a) Detecting communities via simultaneous clustering of graphs and folksonomies. In: Proceedings of WebKDD 2008, KDD workshop on web mining and web usage analysis, Las Vegas, NV

Kumar SR, Raghavan P, Rajagopalan S, Sivakumar D, Tomkins A, Upfal E (2000) The web as a graph. In: ACM symposium on principles of database systems, Dallas, Texas

Leskovec J, Lang K, Dasgupta A, Mahoney M (2008) Community structure in large networks: natural cluster sizes and the absence of large well-defined clusters. Eprint arXiv:0810.1355

Lin Y, Chi Y, Zhu S, Sundaram H, Tseng BL (2008) Facetnet: a framework for analyzing communities and their evolutions in dynamic networks. In: Proceeding of the 17th international conference on World Wide Web, Beijing, China, 21–25 April 2008. WWW ’08. ACM, New York, pp 685–694

Lin Y, Sun J, Castro P, Konuru R, Sundaram H, Kelliher A (2009) MetaFac: community discovery via relational hypergraph factorization. In: Proceedings of KDD ’09. ACM, pp 527–536

Papadopoulos S, Kompatsiaris Y, Vakali A (2009b) Leveraging collective intelligence through community detection in tag networks. In: Proceedings of CKCaR’09 workshop on collective knowledge capturing and representation, Redondo Beach, California, USA

Schaeffer SE (2007) Graph clustering. Comput Sci Rev 1(1): 27–64

Sun J, Faloutsos C, Papadimitriou S, Yu PS (2007) GraphScope: parameter-free mining of large time-evolving graphs. In: Proceedings of KDD ’07. ACM, pp 687–696

Xu X, Yuruk N, Feng Z, Schweiger TA (2007) SCAN: a structural clustering algorithm for networks. In: Proceedings of KDD ’07. ACM, pp 824–833