Các thước đo tính thú vị trong khai thác dữ liệu

ACM Computing Surveys - Tập 38 Số 3 - Trang 9 - 2006
Liqiang Geng1, Howard J. Hamilton1
1University of Regina, Saskatchewan, Canada

Tóm tắt

Các thước đo tính thú vị đóng một vai trò quan trọng trong khai thác dữ liệu, bất kể loại mẫu nào đang được khai thác. Những thước đo này nhằm mục đích chọn lọc và xếp hạng các mẫu dựa trên mức độ quan tâm tiềm năng của người dùng. Các thước đo tốt cũng cho phép giảm thiểu chi phí về thời gian và không gian trong quá trình khai thác. Bài khảo sát này xem xét các thước đo tính thú vị cho quy tắc và tóm tắt, phân loại chúng theo nhiều góc độ khác nhau, so sánh các thuộc tính của chúng, xác định vai trò của chúng trong quá trình khai thác dữ liệu, đưa ra các chiến lược để chọn thước đo phù hợp cho các ứng dụng và xác định các cơ hội cho nghiên cứu trong tương lai trong lĩnh vực này.

Từ khóa


Tài liệu tham khảo

Agrawal R., Proceedings of the 20th International Conference on Very Large Databases

10.1023/A:1022419032620

Bastide Y., Proceedings of the Ist International Conference on Computational Logic

10.1145/312129.312263

10.1145/312129.312219

Breiman L. Freidman J. Olshen R. and S tone C. 1984. Classification and Regression Trees. Wadsworth and Brooks Pacific Grove CA.]] Breiman L. Freidman J. Olshen R. and S tone C. 1984. Classification and Regression Trees. Wadsworth and Brooks Pacific Grove CA.]]

Cai C. H., Proceedings of the International Database Engineering and Applications Symposium (IDEAS '98)

Carter C. L., Proceedings of the Ist European Symposium on Principles of Data Mining and Knowledge Discovery (PKDD '97)

10.5555/645804.669849

Chan R., Proceedings of the 3rd IEEE International Conference on Data Mining (ICDM '03)

Clark P., Proceedings of the 5th European Working Session on Learning (EWSL '91)

Dong G., Proceedings of the 2nd Pacific Asia Conference on Knowledge Discovery in Databases (PAKDD-98)

Fabris C. C., 2001, Proceedings of the 16th Brazilian Symposium on Databases (SBBD

Fayyad U. M., Advances in Knowledge Discovery and Data Mining, U. M. Fayyad et al., Eds

10.1080/09528139408953790

10.5555/645802.758204

10.1007/s10994-005-5011-x

Gray B., Proceedings of the 2nd Pacific Asia Conference on Knowledge Discovery and Data Mining (PAKDD-98)

10.1016/j.jal.2005.06.005

Hilderman R. J., Proceedings of the 2nd Pacific Asia Conference on Knowledge Discovery in Databases (PAKDD-98)

Hilderman R. J. and Hamilton H. J. 2001. Knowledge Discovery and Measures of Interest. Kluwer Academic Boston MA.]] Hilderman R. J. and Hamilton H. J. 2001. Knowledge Discovery and Measures of Interest. Kluwer Academic Boston MA.]]

Hoaglin D. C. Mosteller F. and Tukey J. W. Eds. 1985. Exploring Data Tables Trends and Shapes. Wiley New York.]] Hoaglin D. C. Mosteller F. and Tukey J. W. Eds. 1985. Exploring Data Tables Trends and Shapes. Wiley New York.]]

10.5555/645805.670137

Klosgen W., 1996, Explora: A multipattern and multistrategy discovery assistant. In Advances in Knowledge Discovery and Data Mining, U. M. Fayyad et al., Eds

10.1007/s007780050006

Lavrac N., Proceedings of the 9th International Workshop on Inductive Logic Programming (ILP '99)

Li G., Proceedings of the 4th SIAM International Conference on Data Mining

Ling C., Proceedings of the 2002 IEEE International Conference on Data Mining (ICDM '02)

Liu B., Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining (KDD-97)

10.1109/69.824588

10.5555/1294134.1294136

10.1017/S0269888905000408

10.1023/A:1009744630224

Ohsaki M., 2004, Proceedings of the 8th European Conference on Principles of Data Mining and Knowledge Discovery (PKDD

Padmanabhan B., Proceedings of the 4th International Conference on Knowledge Discovery and Data Mining (KDD-98)

10.1145/347090.347103

10.1023/A:1022611825350

Piatetsky-Shapiro G., Knowledge Discovery in Databases

Piatetsky-Shapiro G., Proceedings of the AAAI-94 Workshop on Knowledge Discovery in Databases (KDD-94)

10.1023/A:1022643204877

10.1145/312129.312272

10.5555/645925.671500

Sarawagi S., Proceedings of the 6th International Conference of Extending Database Technology (EDBT '98)

Shen Y. D., Proceedings of the 2002 IEEE International Conference on Data Mining (ICDM '02)

Silberschatz A., Proceedings of the Ist International Conference on Knowledge Discovery and Data Mining (KDD-95)

10.1109/69.553165

Tan P., 2000, Tech. Rep. 00-036, Department of Computer Science

10.1145/775047.775053

Vaillant B., 2004, Proceedings of the 7th International Conference on Discovery Science (DS

10.1109/18.825807

Wang K., 2002, Proceedings of the 8th Conference on Extending Database Technology (EDBT

Webb G. I., 2002, Proceedings of the 2002 Pacific Rim Knowledge Acquisition Workshop (PKAW

Yao Y. Y. Chen Y. H. and Yang X. D. 2006. A measurement-theoretic foundation of rule interestingness evaluation. In Foundations and Novel Approaches in Data Mining T. Y. Lin et al. Eds. Springer-Verlag Berlin 41--59.]] Yao Y. Y. Chen Y. H. and Yang X. D. 2006. A measurement-theoretic foundation of rule interestingness evaluation. In Foundations and Novel Approaches in Data Mining T. Y. Lin et al. Eds. Springer-Verlag Berlin 41--59.]]

Yao Y. Y., Proceedings of the 3rd Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD-99)

Yao H., Proceedings of the SIAM International Conference on Data Mining

10.1016/j.datak.2005.10.004

10.1007/s10994-005-5066-8

10.1145/1014052.1014094

10.1109/TKDE.2003.1209011