Khung imputation tối đa cho lọc cộng tác dựa trên hàng xóm

Social Network Analysis and Mining - Tập 4 - Trang 1-15 - 2014
Yongli Ren1, Gang Li1, Jun Zhang1, Wanlei Zhou1
1School of Information Technology, Deakin University, Burwood, Australia

Tóm tắt

Tình trạng thưa thớt dữ liệu là một vấn đề nổi tiếng trong bối cảnh lọc cộng tác, và nó đặt ra những khó khăn đặc thù trong việc cung cấp các khuyến nghị chính xác. Trong bài viết này, chúng tôi tập trung vào vấn đề thưa thớt dữ liệu trong bối cảnh lọc cộng tác dựa trên hàng xóm, và đề xuất một khung imputation tối đa để giải quyết vấn đề này. Ý tưởng cơ bản là xác định một khu vực imputation có thể tối đa hóa lợi ích imputation cho mục đích khuyến nghị, đồng thời tối thiểu hóa lỗi imputation phát sinh. Để đạt được lợi ích imputation tối đa, khu vực imputation được xác định từ cả góc độ người dùng và mặt hàng; để tối thiểu hóa lỗi imputation, cần ít nhất một đánh giá thực từ trước được giữ lại cho mỗi mặt hàng trong khu vực imputation đã xác định. Một phân tích lý thuyết được cung cấp để chứng minh rằng phương pháp imputation được đề xuất vượt trội hơn so với các phương pháp CF dựa trên hàng xóm thông thường thông qua việc xác định hàng xóm chính xác hơn. Chúng tôi đánh giá khung đề xuất trên hai tập dữ liệu chuẩn bằng cách so sánh nó với bảy phương pháp liên quan. Kết quả thử nghiệm cho thấy phương pháp đề xuất vượt trội so với các phương pháp tương ứng khác một cách đáng kể.

Từ khóa

#khung imputation #lọc cộng tác #thưa thớt dữ liệu #phương pháp CF #xác định hàng xóm

Tài liệu tham khảo

