Phân loại Dữ liệu Dòng Dựa trên Bộ Phân loại Gamma
Tóm tắt
Sự gia tăng không ngừng của việc tạo ra dữ liệu đã đặt ra cho chúng ta vấn đề xử lý lượng thông tin khổng lồ trên mạng. Một trong những thách thức lớn nhất là làm thế nào để trích xuất thông tin có giá trị từ những dòng dữ liệu liên tục khổng lồ này trong quá trình quét đơn. Trong bối cảnh dòng dữ liệu, dữ liệu đến một cách liên tục với tốc độ cao; do đó, các thuật toán được phát triển để giải quyết bối cảnh này phải hiệu quả về mặt quản lý bộ nhớ và thời gian, và có khả năng phát hiện sự thay đổi theo thời gian trong phân phối nền tảng đã tạo ra dữ liệu. Công trình này mô tả một phương pháp mới cho nhiệm vụ phân loại mẫu trên một dòng dữ liệu liên tục dựa trên một mô hình liên kết. Phương pháp được đề xuất dựa trên bộ phân loại Gamma, được lấy cảm hứng từ bộ nhớ liên kết Alpha-Beta, là cả hai mô hình nhận dạng mẫu có giám sát. Phương pháp được đề xuất có khả năng xử lý các hạn chế về không gian và thời gian vốn có trong các kịch bản dòng dữ liệu. Bộ phân loại Gamma cho Dữ liệu Dòng (bộ phân loại DS-Gamma) triển khai một phương pháp cửa sổ trượt để cung cấp phát hiện trôi ý tưởng và cơ chế quên. Để kiểm tra bộ phân loại, nhiều thí nghiệm đã được thực hiện sử dụng các kịch bản dòng dữ liệu khác nhau với các dòng dữ liệu thực và tổng hợp. Kết quả thí nghiệm cho thấy phương pháp này thể hiện hiệu suất cạnh tranh khi so sánh với các thuật toán tiên tiến khác.
Từ khóa
Tài liệu tham khảo
2010
2010
1996, Machine Learning, 23, 69
2011, International Journal of Computational Intelligence Systems, 4, 680
2013
2010