Kết hợp phân cụm và bộ phân loại cây quyết định trong một nhiệm vụ dự đoán

A. K. Kirshners1, S. V. Parshutin1, A. N. Borisov1
1Riga Technical University, Riga, Latvia

Tóm tắt

Bài nghiên cứu này phân tích chung dữ liệu liên tục (quan sát nhu cầu theo chuỗi thời gian) và dữ liệu rời rạc (các tham số mô tả tốt). Các kỹ thuật khai thác dữ liệu như thu thập dữ liệu, tiền xử lý, phân tích phân cụm và phân loại được xem xét. Sau khi tiền xử lý dữ liệu liên tục và phân cụm, các hình ảnh về sự phát triển doanh số có thể xảy ra được xây dựng. Nhu cầu về một sản phẩm mới được tìm kiếm bằng cách sử dụng cây quyết định quy nạp được xây dựng trên dữ liệu mô tả tốt.

Từ khóa

#phân cụm #cây quyết định #dự đoán #phân tích dữ liệu #khai thác dữ liệu

Tài liệu tham khảo

Flores, J.J. and Loaeza, R., Financial Time Series Forecasting Using a Hybrid Neural-Evaluative Approach, Proc. 15th SIGEF Int. Conf., Lugo, Spain, 2009, pp. 547–555.

Salam, A. Najim, Zakaria, A. M. Al-Omari, and Samir M. Said, On the Application of Artificial Neural Network in Analyzing and Studying Daily Loads of Jordan Power System Plant, Comput. Sci. Inf. Syst., 2008, vol. 5, no. 1, pp. 127–136.

Armstrong, J.S., Collopy, F., and Yokum, J.T., Decomposition by Causal Forces: a Procedure for Forecasting Complex Time Series, Int. J. Forecasting, 2005, no. 21, pp. 25–36.

Kirshners, A. and Sukov, A., Rule Induction for Forecasting Transition Points in Product Life Cycle Data, Proc. of Riga Tech. Univ., Inf. Technol. Management Sci., 2008, vol. 36, pp. 170–177.

Thomassey, S. and Fiordaliso, A., A Hybrid Sales Forecasting System Based on Clustering and Decisions Trees, Decision Support Systems, 2006, vol. 42, no. 1, pp. 408–421.

Devisscher, M., De Baets, B., and Nopens, I., Pattern Discovery in Intensive Care Data through Sequence Alignment of Qualitative Trends: Proof Concept on a Dieresis Dataset, Proc. ICML/UAI/COLT Worsh. on Machine Learning for Health-Care Appl., Helsinki, Finland, 2008.

Parshutin, S. and Borisov, A., Data Mining Driven Decision Support, Pol. J. Environ. Stud., 2009, vol. 18, no. 4A, pp. 8–11.

Symeonidis, A.L. et al., Data Mining for Agent Reasoning: a Synergy for Training Intelligent Agents, Eng. Appl. Art. Intel., 2007, vol. 20, no. 8, pp. 1097–1111.

Written, I.H. and Frank, E., Data Mining: Practical Machine Learning Tools and Techniques, Amsterdam etc.: Morgan Kauffman, 2005, 2nd ed.

Tekhnologii analiza dannykh: Data Mining, Visual Mining, Text Mining (Technologies of Data Analysis: Data Mining, Visual Mining, Text Mining, OLAP), Barsegyan, A., Kupriyanov, M., Stepanenko, V., and Holod, I., Eds., St. Petersburg, 2007.

Quinlan, J.R., C4.5: Programs for Machine Learning, UK: Morgan Kaufmann Publishers, 1993.

Das, G., Lin, K., Manilla, H., Renganathan, G., and Smyth, P., Rule Discovery from Time Series, Proc. 3rd Int. Conf. on Knowledge Discovery and Data Mining, 1998, pp. 16–22.

Montgomery, D.C., Jennings, C.L., and Kulachi, M., Introduction to Time Series Analysis and Forecasting, Wiley, 2008.

Kohavi, R., A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection, Proc. 14th Int. Conf. on Artificial Intelligence, San Mateo, CA: Morgan Kauffman, 1995, pp. 1137–1143.

Borisov, A. and Kornienko, Y., A Study of Methods of Classifier Construction and Updating, Aut. Cont. Comput. Sci., 2008, vol. 42, no. 6, pp. 300–305.

Craven, M.W. and Shavlik, J.W., Extracting Tree-Structured Representations of Trained Networks, Advances in Neural Information Processing Systems, Cambridge: MIT Press, 1996, vol. 8, pp. 24–30.