Phân loại Dữ liệu Dòng Dựa trên Bộ Phân loại Gamma

Mathematical Problems in Engineering - Tập 2015 - Trang 1-17 - 2015
Abril Valeria Uriarte-Arcia1, Itzamá López-Yáñez2, Cornelio Yáñez-Márquéz1, João Gama3, Oscar Camacho-Nieto2
1Neural Networks and Unconventional Computing Lab/Alpha-Beta Group, Centro de Investigación en Computación, Instituto Politécnico Nacional, Avenida Juan de Dios Bátiz, Colonia Nuevo Industrial Vallejo, Delegación Gustavo A. Madero, 07738 Mexico City, DF, Mexico
2Intelligent Computing Lab/Alpha-Beta Group, Centro de Innovación y Desarrollo Tecnológico en Cómputo, Instituto Politécnico Nacional, Avenida Juan de Dios Bátiz, Colonia Nuevo Industrial Vallejo, Delegación Gustavo A. Madero, 07700 Mexico City, DF, Mexico
3LIAAD-INESC INESC TEC and Faculty of Economics, University of Porto, Rua Dr. Roberto Frias 378, 4200-378 Porto, Portugal

Tóm tắt

Sự gia tăng không ngừng của việc tạo ra dữ liệu đã đặt ra cho chúng ta vấn đề xử lý lượng thông tin khổng lồ trên mạng. Một trong những thách thức lớn nhất là làm thế nào để trích xuất thông tin có giá trị từ những dòng dữ liệu liên tục khổng lồ này trong quá trình quét đơn. Trong bối cảnh dòng dữ liệu, dữ liệu đến một cách liên tục với tốc độ cao; do đó, các thuật toán được phát triển để giải quyết bối cảnh này phải hiệu quả về mặt quản lý bộ nhớ và thời gian, và có khả năng phát hiện sự thay đổi theo thời gian trong phân phối nền tảng đã tạo ra dữ liệu. Công trình này mô tả một phương pháp mới cho nhiệm vụ phân loại mẫu trên một dòng dữ liệu liên tục dựa trên một mô hình liên kết. Phương pháp được đề xuất dựa trên bộ phân loại Gamma, được lấy cảm hứng từ bộ nhớ liên kết Alpha-Beta, là cả hai mô hình nhận dạng mẫu có giám sát. Phương pháp được đề xuất có khả năng xử lý các hạn chế về không gian và thời gian vốn có trong các kịch bản dòng dữ liệu. Bộ phân loại Gamma cho Dữ liệu Dòng (bộ phân loại DS-Gamma) triển khai một phương pháp cửa sổ trượt để cung cấp phát hiện trôi ý tưởng và cơ chế quên. Để kiểm tra bộ phân loại, nhiều thí nghiệm đã được thực hiện sử dụng các kịch bản dòng dữ liệu khác nhau với các dòng dữ liệu thực và tổng hợp. Kết quả thí nghiệm cho thấy phương pháp này thể hiện hiệu suất cạnh tranh khi so sánh với các thuật toán tiên tiến khác.

Từ khóa


Tài liệu tham khảo

2010

2010

2007, Intelligent Data Analysis, 11, 627, 10.3233/IDA-2007-11604

10.1145/2523813

10.1016/j.ins.2012.05.023

10.1109/tkde.2013.34

1996, Machine Learning, 23, 69

10.1016/j.eswa.2013.12.041

10.1007/s12530-012-9059-0

10.1007/s12530-013-9076-7

10.1016/j.neucom.2013.05.003

10.1007/s00500-014-1233-9

10.1016/j.eswa.2013.05.001

10.1016/j.ins.2013.12.011

10.1109/tkde.2012.136

10.1007/s12530-012-9064-3

10.1007/s10044-011-0263-5

10.1109/tkde.2010.61

10.1016/j.cie.2011.12.023

10.1016/j.ipm.2014.04.001

10.1016/j.ins.2014.04.034

10.1016/j.ins.2013.11.016

10.1016/j.jocs.2015.04.024

10.1007/s13748-011-0002-6

10.1109/tkde.2011.226

10.1016/j.patrec.2011.08.019

10.1007/978-3-540-28645-5_29

10.1016/j.neucom.2011.08.041

10.1007/s10844-012-0231-6

10.1007/s10115-011-0447-8

10.1007/s10994-012-5279-6

2011, International Journal of Computational Intelligence Systems, 4, 680

10.1007/s11063-007-9040-2

10.1007/11892755_55

10.1016/j.patrec.2013.11.008

2013

10.1109/69.250074

10.1007/s10994-012-5320-9

10.2307/3001968

2010