Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Phương pháp phân cụm tự động dựa trên thuật toán di truyền đa mục tiêu cho khai thác quy tắc liên kết mờ
Tóm tắt
Các nhà nghiên cứu nhận thức được tầm quan trọng của việc tích hợp tính mờ vào việc khai thác quy tắc liên kết trong các cơ sở dữ liệu có thuộc tính nhị phân và định lượng. Tuy nhiên, hầu hết các thuật toán trước đây được đề xuất cho việc khai thác quy tắc liên kết mờ đều giả định rằng các tập mờ đã được cung cấp hoặc sử dụng một thuật toán phân cụm, như CURE, để xác định các tập mờ; trong cả hai trường hợp, số lượng tập mờ được xác định trước. Trong bài báo này, chúng tôi đề xuất một phương pháp tự động để xác định số lượng các tập mờ và cho việc khai thác tự động cả các tập mờ và quy tắc liên kết mờ. Chúng tôi đạt được điều này bằng cách phát triển một phương pháp phân cụm tự động dựa trên Thuật toán Di truyền (GA) đa mục tiêu; mục tiêu của phương pháp đề xuất là tự động phân cụm các giá trị của một thuộc tính định lượng nhằm thu được số lượng lớn các tập mục lớn trong thời gian ngắn hơn. Chúng tôi so sánh phương pháp dựa trên GA đa mục tiêu đã đề xuất với hai phương pháp khác, cụ thể là: (1) phương pháp dựa trên CURE, được biết đến là một trong những thuật toán phân cụm hiệu quả nhất; (2) phương pháp phân cụm của Chien và cộng sự, là một phương pháp phân chia khoảng tự động dựa trên sự thay đổi mật độ. Các kết quả thực nghiệm trên 100K giao dịch được trích xuất từ dữ liệu người lớn trong cuộc điều tra dân số Hoa Kỳ năm 2000 cho thấy phương pháp phân cụm tự động được đề xuất thể hiện hiệu suất tốt hơn so với cả phương pháp dựa trên CURE và công trình của Chien và cộng sự về thời gian thực thi, số lượng tập mục lớn và số lượng quy tắc liên kết.
Từ khóa
#khai thác quy tắc liên kết mờ #phương pháp phân cụm tự động #thuật toán di truyền đa mục tiêu #tập mục lớnTài liệu tham khảo
citation_journal_title=Fuzzy Sets and Systems; citation_title=Determination of fuzzy logic membership functions using genetic algorithms; citation_author=A. Arslan, M. Kaya; citation_volume=118; citation_issue=2; citation_publication_date=2001; citation_pages=297-306; citation_doi=10.1016/S0165-0114(99)00065-2; citation_id=CR1
Au, W. H., & Chan, K. C. C. (1998). An effective algorithm for discovering fuzzy rules in relational databases. Proceedings of IEEE International Conference on Fuzzy Systems, 1314–1319.
Chan, K. C. C., & Au, W. H. (1997). Mining fuzzy association rules. Proceedings of ACM International Conference on Information and Knowledge Management, Las Vegas, pp. 209–215.
Chien, B. C., Lin, Z. L., & Hong, T. P. (2001). An efficient clustering algorithm for mining fuzzy quantitative association rules. Proceedings of IFSA World Congress and NAFIPS International Conference, Vol. 3, pp. 1306–1311.
Fonseca, C. M., & Fleming, P. J. (1993). Genetic algorithms for multi-objective optimization: Formulation, discussion and generalization. In S. Forrest (Ed.), Proceedings of the International Conference on Genetic Algorithms (pp. 416–423). San Mateo, CA.
Fu, A. W. C., Wong, M. H., Sze, S. C., Wong, W. C., Wong, W. L., Yu, W. K. (1998). Finding fuzzy sets for the mining of association rules for numerical attributes. Proceedings of the International Symposium of Intelligent Data Engineering and Learning, pp. 263–268.
citation_title=Genetic algorithms in search, optimization, and machine learning; citation_publication_date=1989; citation_id=CR7; citation_author=D. E. Goldberg; citation_publisher=Addison-Wesley
citation_journal_title=Information Systems; citation_title=Cure: An efficient clustering algorithm for large databases; citation_author=S. Guha, R. Rastogi, K. Shim; citation_volume=26; citation_issue=1; citation_publication_date=2001; citation_pages=35-58; citation_doi=10.1016/S0306-4379(01)00008-4; citation_id=CR8
Gyenesei, A. (2000). A fuzzy approach for mining quantitative association rules. TUCS Technical Report No.336.
citation_journal_title=Artificial Intelligence Review; citation_title=Tackling real-coded genetic algorithms: Operators and tools for behavioural analysis; citation_author=F. Herrera, M. Lozano, J. L. Verdegay; citation_volume=12; citation_issue=4; citation_publication_date=1998; citation_pages=265-319; citation_doi=10.1023/A:1006504901164; citation_id=CR10
citation_journal_title=Proceedings of IEEE International Conference on Fuzzy Systems; citation_title=Linguistic data mining and fuzzy modelling; citation_author=K. Hirota, W. Pedrycz; citation_volume=2; citation_publication_date=1996; citation_pages=1488-1496; citation_id=CR11
citation_title=Adaptation in natural and artificial systems; citation_publication_date=1992; citation_id=CR12; citation_author=J. H. Holland; citation_publisher=MIT Press
Hong, T. P., Chen, C. H., Wu, Y. L., & Lee, Y. C. (2004). Using divide-and-conquer GA strategy in fuzzy data mining. Proceedings of the IEEE Symposium on Computers and Communications.
Hong, T. P., Kuo, C. S., & Chi, S. C. (1999a). A fuzzy data mining algorithm for quantitative values. Proceedings of the International Conference on Knowledge-Based Intelligent Information Engineering Systems, pp. 480–483.
citation_journal_title=Intelligent Data Analysis; citation_title=Mining association rules from quantitative data; citation_author=T. P. Hong, C. S. Kuo, S. C. Chi; citation_volume=3; citation_publication_date=1999; citation_pages=363-376; citation_doi=10.1016/S1088-467X(99)00028-1; citation_id=CR15
Ishibuchi, H., Nakashima, T., & Yamamoto, T. (2001). Fuzzy association rules for handling continuous attributes. Proceedings of IEEE International Symposium on Industrial Electronics, pp. 118–121.
Kaya, M., Alhajj, R., Polat, F., & Arslan, A. (2002). Efficient automated mining of fuzzy association rules. Proceedings of the International Conference on Database and Expert Systems with Applications.
citation_journal_title=SIGMOD Record; citation_title=Mining fuzzy association rules in databases; citation_author=C. M. Kuok, A. W. Fu, M. H. Wong; citation_volume=17; citation_issue=1; citation_publication_date=1998; citation_pages=41-46; citation_doi=10.1145/273244.273257; citation_id=CR18
Lent, B., Swami, A., & Widom, J. (1997). Clustering association rules. Proceedings of IEEE International Conference on Data Engineering, pp. 220–231.
Michalewicz, Z. (1992). Genetic algorithms + data structures = evolution programs. Berlin: Springer.
Miller, R. J., & Yang, Y. (1997). Association rules over interval data. Proceedings of the ACM SIGMOD International Conference on Management of Data, pp. 452–461.
Ng, R., & Han, J. (1994). Efficient and effective clustering methods for spatial data mining. Proceedings of the International Conference on Very Large Databases.
citation_journal_title=Fuzzy Sets and Systems; citation_title=Fuzzy sets technology in knowledge discovery; citation_author=W. Pedrycz; citation_volume=98; citation_publication_date=1998; citation_pages=279-290; citation_doi=10.1016/S0165-0114(96)00377-6; citation_id=CR23
Srikant, R., & Agrawal, R. (1996). Mining quantitative association rules in large relational tables. Proceedings of ACM SIGMOD International Conference on Management of Data, pp. 1–12.
Veldhuizen, D. A. V., & Lamont, G. B. (1998). Multi-objective evolutionary algorithm research: A history and analysis. Technical Report TR-98-03. Department of Electrical and Computer Engineering, Graduate School of Engineering, Air Force Institute of Technology, Ohio.
Wang, W., & Bridges, S. M. (2000). Genetic algorithm optimization of membership functions for mining fuzzy association rules. Proceedings of the International Conference on Fuzzy Theory & Technology, pp. 131–134.
Yager, R. R. (1995). Fuzzy summaries in database mining. Proceedings of the Conference on Artificial Intelligence for Application, pp. 265–269.
citation_journal_title=Information and Control; citation_title=Fuzzy sets; citation_author=L. A. Zadeh; citation_volume=8; citation_publication_date=1965; citation_pages=338-353; citation_doi=10.1016/S0019-9958(65)90241-X; citation_id=CR28
Zhang, W. (1999). Mining fuzzy quantitative association rules. Proceedings of IEEE International Conference on Tools with Artificial Intelligence (pp. 99–102). Illinois.
citation_journal_title=IEEE Transactions on Evolutionary Computation; citation_title=Multiobjective evolutionary algorithms: A comparative case study and the strength Pareto approach; citation_author=E. Zitzler, L. Thiele; citation_volume=3; citation_issue=4; citation_publication_date=1999; citation_pages=257-271; citation_doi=10.1109/4235.797969; citation_id=CR30
