Mã hóa người dùng cho phân nhóm trong các tác vụ hệ thống gợi ý rất thưa thớt

Multimedia Tools and Applications - Tập 81 - Trang 2467-2488 - 2021
Pablo Pérez-Núnez1, Jorge Díez1, Oscar Luaces1, Antonio Bahamonde1
1Artificial Intelligence Center, University of Oviedo, Gijón, Spain

Tóm tắt

Các hệ thống gợi ý là công cụ rất hữu ích cho phép các công ty và nhà cung cấp dịch vụ tập trung vào sở thích của khách hàng, giúp họ tránh khỏi sự đa dạng áp đảo của các lựa chọn. Trong bối cảnh này, các công cụ phân nhóm có thể đóng một vai trò quan trọng trong việc phát hiện các nhóm khách hàng có sở thích tương tự. Do đó, các công ty có thể thực hiện các chiến dịch tiếp thị cá nhân hóa, cung cấp cho người dùng những sản phẩm mới đã được tiêu thụ bởi những người dùng khác có sở thích tương đồng. Trong bài báo này, chúng tôi trình bày một khung tổng quát để phân nhóm người dùng dựa trên sở thích của họ khi những hồ sơ lưu trữ về các tương tác giữa người dùng và sản phẩm rất khan hiếm. Thông thường, các phương pháp phân nhóm sử dụng các giá trị của các đặc trưng mô tả các mẫu được phân nhóm (người dùng trong trường hợp của chúng tôi), nhưng những đặc trưng đó không phải lúc nào cũng có sẵn. Chúng tôi đề xuất một số đại diện thay thế cho người dùng, trong đó sở thích của họ được thu thập đến một mức độ nhất định, để các thuật toán phân nhóm có thể tận dụng và tạo ra những nhóm đồng nhất hơn về mặt này. Để minh họa hiệu suất của toàn bộ khung, chúng tôi đã thử nghiệm trên sáu tập dữ liệu phổ biến thường được sử dụng làm tiêu chuẩn cho các hệ thống gợi ý, cũng như trên một tập dữ liệu thực tế cực kỳ thưa thớt ghi lại sở thích của độc giả trong việc nhấp vào các liên kết quảng cáo trong các ấn phẩm kỹ thuật số. Trong phần thực nghiệm, chúng tôi so sánh các đại diện mà chúng tôi đề xuất với các mã hóa người dùng thông dụng khác. Chúng tôi chỉ ra rằng việc phân nhóm người dùng chỉ dựa vào các giá trị đặc trưng của họ hoặc các mặt hàng mà họ đã đánh giá thường dẫn đến điểm số tồi tệ nhất về mặt đồng nhất sở thích.

Từ khóa

#hệ thống gợi ý #phân nhóm người dùng #mã hóa người dùng #sở thích #thưa thớt #dữ liệu

Tài liệu tham khảo

Abadi M, Barham P, Chen J, Chen Z, Davis A, Dean J, Devin M, Ghemawat S, Irving G, Isard M, Kudlur M, Levenberg J, Monga R, Moore S, Murray DG, Steiner B, Tucker P, Vasudevan V, Warden P, Wicke M, Yu Y, Zheng X (2016) Tensorflow: A system for large-scale machine learning. In Proceedings of the 12th USENIX Symposium on Operating Systems Design and Implementation, OSDI 2016 Ali Z, Kefalas P, Muhammad K, Ali B, Imran M (2020) Deep learning in citation recommendation models survey. Exp Syst Appl, 113790 Bahamonde A, Bayón GF, Díez J, Quevedo JR, Luaces O, del Coz JJ, Alonso J, Goyache F (2004) Feature subset selection for learning preferences: A case study. In Proceedings of the International Conference on Machine Learning (ICML ’04) (Banff, Alberta (Canada)), R. Greiner and D. Schuurmans, Eds., pp. 49–56 Boratto L, Carta S (2011) State-of-the-Art in Group Recommendation and New Approaches for Automatic Identification of Groups. In: Soro A, Vargiu E, Armano G, Paddeu G (eds) Information Retrieval and Mining in Distributed Environments. Springer, Berlin Heidelberg, pp 1–20 Bu J, Shen X, Xu B, Chen C, He X, Cai D (2016) Improving Collaborative Recommendation via User-Item Subgroups. IEEE Trans Knowl Data Eng 28(9):2363–2375 Dara S, Chowdary CR, Kumar C (2020) A survey on group recommender systems. J Int Info Syst 54(2):271–295 Dau A, Salim N (2020) Recommendation system based on deep learning methods: a systematic review and new directions. Artif Intell Rev 53(4):2709–2748 Fan B, Zhang P (2009) Spatially enabled customer segmentation using a data classification method with uncertain predicates. Decis Support Syst 47(4):343–353 Fang H, Zhang D, Shu Y, Guo G (2020) Deep learning for sequential recommendation: Algorithms, influential factors, and evaluations. ACM Transactions on Information Systems (TOIS) 39(1):1–42 Garcia S, Herrera F (2008) An extension on statistical comparisons of classifiers over multiple data sets for all pairwise comparisons. J Mach Learn Res 9:2677–2694 Goldberg K, Roeder T, Gupta D, Perkins C (2001) Eigentaste: A constant time collaborative filtering algorithm. Inf Retr 4(2):133–151 Gong S (2010) A collaborative filtering recommendation algorithm based on user clustering and item clustering. J Soft 5(7):745–752 Guo G, Zhang J, Thalmann D, Yorke-Smith N (2014) Etaf: An extended trust antecedents framework for trust prediction. In Proceedings of the 2014 International Conference on Advances in Social Networks Analysis and Mining (ASONAM) Guo G, Zhang J, Yorke-Smith N (2013) A novel bayesian similarity measure for recommender systems. In IJCAI, pp. 2619–2625 Gupta U, Patil N (2015) Recommender system based on Hierarchical Clustering algorithm Chameleon. In 2015 IEEE International Advance Computing Conference (IACC), IEEE, pp. 1006–1010 Harper FM, Konstan JA (2015) The movielens datasets: History and context. ACM Trans. Interact. Intell. Syst. 5:4 Herbrich R, Graepel T, Obermayer K (1999) Support vector learning for ordinal regression. In Proceedings of the Ninth International Conference on Artificial Neural Networks (Edinburgh, UK), pp. 97–102 Herlocker JL, Konstan JA, Borchers A, Riedl J (1999) An algorithmic framework for performing collaborative filtering. In Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (New York, NY, USA), SIGIR ’99, Association for Computing Machinery, p. 230-237 Hiziroglu A (2013) Soft computing applications in customer segmentation: State-of-art review and critique. Expert Syst Appl 40(16):6491–6507 Jiang S, Ding Z, Fu Y (2020) Heterogeneous recommendation via deep low-rank sparse collective factorization. IEEE Trans Pattern Anal Mach Intell 42(5):1097–1111 Joachims T (2002) Optimizing search engines using clickthrough data. In Proceedings of the ACM Conference on Knowledge Discovery and Data Mining (KDD), pp. 133 – 142 Katarya R, Verma OP (2017) An effective web page recommender system with fuzzy c-mean clustering. Multi Tools Appl 76(20):21481–21496 Kingma D, Ba J (2014) Adam: A method for stochastic optimization. arXiv preprint https://arxiv.org/abs/1412.6980 Koren Y, Bell R, Volinsky C (2009) Matrix factorization techniques for recommender systems. Computer 42(8):30–37 Liao CL, Lee SJ (2016) A clustering based approach to improving the efficiency of collaborative filtering recommendation. Electron Commer Res Appl 18:1–9 Liu J, Wu C (2017) Deep learning based recommendation: A survey. In International Conference on Information Science and Applications, Springer, pp. 451–458 Luaces O, Díez J, Joachims T, Bahamonde A (2015) Mapping preferences into euclidean space. Expert Syst Appl 42(22):8588–8596 Lucas JP, Laurent A, Moreno MN, Teisseire M (2012) A fuzzy associative classification approach for recommender systems. Internat J Uncertain Fuzziness Knowledge-Based Systems 20(04):579–617 O’Connor M, Herlocker J (1999) Clustering items for collaborative filtering. Proceedings of the ACM SIGIR Workshop on Recommender Systems Park YJ (2013) The adaptive clustering method for the long tail problem of recommender systems. IEEE Trans Knowl Data Eng 25(8):1904–1915 Park YJ, Tuzhilin A (2008) The long tail of recommender systems and how to leverage it. Proceedings of the 2008 ACM conference on Recommender Systems RecSys 08, 11–18 Reddy S, Labutov I, Joachims T (2015) Learning representations of student knowledge and educational content. In Proceedings of the 31st ICML (Workshop: Machine Learning for Education) Reddy S, Labutov I, Joachims T (2016) Learning student and content embeddings for personalized lesson sequence recommendation. In Proceedings of the Third (2016) ACM Conference on Learning@ Scale, ACM, pp. 93–96 Roy S, Biswas M, De D (2020) imusic: a session-sensitive clustered classical music recommender system using contextual representation learning. Multi Tools Appl 79(33):24119–24155 Sculley D (2010) Web-scale k-means clustering. In Proceedings of the 19th international conference on World wide web, ACM, pp. 1177–1178 Selvi C, Sivasankar E (2019) A novel adaptive genetic neural network (agnn) model for recommender systems using modified k-means clustering approach. Multimedia Tools and Applications 78(11):17763–17798 Shannon CE (1948) A mathematical theory of communication. Bell Syst Tech J 27(3):379–423 Wu RS, Chou PH (2011) Customer segmentation of multiple category data in e-commerce using a soft-clustering approach. Electron Commer Res Appl 10(3):331–341 Wu Y, Liu X, Xie M, Ester M, Yang Q (2016) CCCF: Improving Collaborative Filtering via Scalable User-Item Co-Clustering. Proceedings of the Ninth ACM International Conference on Web Search and Data Mining - WSDM ’16, 73–82 Xu B, Bu J, Chen C, Cai D (2012) An exploration of improving collaborative recommender systems via user-item subgroups. Proceedings of the 21st international conference on World Wide Web - WWW ’12, 21 Zhang S, Yao L, Sun A, Tay Y (2019) Deep learning based recommender system: A survey and new perspectives. ACM Comput Surv 52:1 Ziegler CN, McNee SM, Konstan JA, Lausen G (2005) Improving recommendation lists through topic diversification. In Proceedings of the 14th International Conference on World Wide Web (New York, NY, USA), WWW ’05, Association for Computing Machinery, p. 22-32