Các thước đo tính thú vị trong khai thác dữ liệu
Tóm tắt
Các thước đo tính thú vị đóng một vai trò quan trọng trong khai thác dữ liệu, bất kể loại mẫu nào đang được khai thác. Những thước đo này nhằm mục đích chọn lọc và xếp hạng các mẫu dựa trên mức độ quan tâm tiềm năng của người dùng. Các thước đo tốt cũng cho phép giảm thiểu chi phí về thời gian và không gian trong quá trình khai thác. Bài khảo sát này xem xét các thước đo tính thú vị cho quy tắc và tóm tắt, phân loại chúng theo nhiều góc độ khác nhau, so sánh các thuộc tính của chúng, xác định vai trò của chúng trong quá trình khai thác dữ liệu, đưa ra các chiến lược để chọn thước đo phù hợp cho các ứng dụng và xác định các cơ hội cho nghiên cứu trong tương lai trong lĩnh vực này.
Từ khóa
Tài liệu tham khảo
Agrawal R., Proceedings of the 20th International Conference on Very Large Databases
Bastide Y., Proceedings of the Ist International Conference on Computational Logic
Breiman L. Freidman J. Olshen R. and S tone C. 1984. Classification and Regression Trees. Wadsworth and Brooks Pacific Grove CA.]] Breiman L. Freidman J. Olshen R. and S tone C. 1984. Classification and Regression Trees. Wadsworth and Brooks Pacific Grove CA.]]
Cai C. H., Proceedings of the International Database Engineering and Applications Symposium (IDEAS '98)
Carter C. L., Proceedings of the Ist European Symposium on Principles of Data Mining and Knowledge Discovery (PKDD '97)
Chan R., Proceedings of the 3rd IEEE International Conference on Data Mining (ICDM '03)
Clark P., Proceedings of the 5th European Working Session on Learning (EWSL '91)
Dong G., Proceedings of the 2nd Pacific Asia Conference on Knowledge Discovery in Databases (PAKDD-98)
Fabris C. C., 2001, Proceedings of the 16th Brazilian Symposium on Databases (SBBD
Fayyad U. M., Advances in Knowledge Discovery and Data Mining, U. M. Fayyad et al., Eds
Gray B., Proceedings of the 2nd Pacific Asia Conference on Knowledge Discovery and Data Mining (PAKDD-98)
Hilderman R. J., Proceedings of the 2nd Pacific Asia Conference on Knowledge Discovery in Databases (PAKDD-98)
Hilderman R. J. and Hamilton H. J. 2001. Knowledge Discovery and Measures of Interest. Kluwer Academic Boston MA.]] Hilderman R. J. and Hamilton H. J. 2001. Knowledge Discovery and Measures of Interest. Kluwer Academic Boston MA.]]
Hoaglin D. C. Mosteller F. and Tukey J. W. Eds. 1985. Exploring Data Tables Trends and Shapes. Wiley New York.]] Hoaglin D. C. Mosteller F. and Tukey J. W. Eds. 1985. Exploring Data Tables Trends and Shapes. Wiley New York.]]
Klosgen W., 1996, Explora: A multipattern and multistrategy discovery assistant. In Advances in Knowledge Discovery and Data Mining, U. M. Fayyad et al., Eds
Lavrac N., Proceedings of the 9th International Workshop on Inductive Logic Programming (ILP '99)
Li G., Proceedings of the 4th SIAM International Conference on Data Mining
Ling C., Proceedings of the 2002 IEEE International Conference on Data Mining (ICDM '02)
Liu B., Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining (KDD-97)
Ohsaki M., 2004, Proceedings of the 8th European Conference on Principles of Data Mining and Knowledge Discovery (PKDD
Padmanabhan B., Proceedings of the 4th International Conference on Knowledge Discovery and Data Mining (KDD-98)
Piatetsky-Shapiro G., Knowledge Discovery in Databases
Piatetsky-Shapiro G., Proceedings of the AAAI-94 Workshop on Knowledge Discovery in Databases (KDD-94)
Sarawagi S., Proceedings of the 6th International Conference of Extending Database Technology (EDBT '98)
Shen Y. D., Proceedings of the 2002 IEEE International Conference on Data Mining (ICDM '02)
Silberschatz A., Proceedings of the Ist International Conference on Knowledge Discovery and Data Mining (KDD-95)
Tan P., 2000, Tech. Rep. 00-036, Department of Computer Science
Vaillant B., 2004, Proceedings of the 7th International Conference on Discovery Science (DS
Wang K., 2002, Proceedings of the 8th Conference on Extending Database Technology (EDBT
Webb G. I., 2002, Proceedings of the 2002 Pacific Rim Knowledge Acquisition Workshop (PKAW
Yao Y. Y. Chen Y. H. and Yang X. D. 2006. A measurement-theoretic foundation of rule interestingness evaluation. In Foundations and Novel Approaches in Data Mining T. Y. Lin et al. Eds. Springer-Verlag Berlin 41--59.]] Yao Y. Y. Chen Y. H. and Yang X. D. 2006. A measurement-theoretic foundation of rule interestingness evaluation. In Foundations and Novel Approaches in Data Mining T. Y. Lin et al. Eds. Springer-Verlag Berlin 41--59.]]
Yao Y. Y., Proceedings of the 3rd Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD-99)
Yao H., Proceedings of the SIAM International Conference on Data Mining