Phương pháp dự đoán có thể giải thích cho cảnh báo khủng hoảng học tập của sinh viên đại học

Mingyu Zhai1, Sutong Wang1, Yanzhang Wang1, Dujuan Wang2
1School of Economics and Management, Dalian University of Technology, Dalian, China
2Business School, Sichuan University, Chengdu, China

Tóm tắt

Tóm tắtCác kỹ thuật dựa trên dữ liệu cải thiện chất lượng đào tạo tài năng cho các trường đại học bằng cách phát hiện các vấn đề học thuật tiềm năng và đề xuất các giải pháp. Chúng tôi đề xuất một phương pháp dự đoán có thể giải thích cho cảnh báo khủng hoảng học tập của sinh viên đại học, bao gồm việc xây dựng chân dung sinh viên dựa trên K-prototype và dự đoán thành tích học tập dựa trên Catboost–SHAP. Thí nghiệm cảnh báo khủng hoảng học tập được thực hiện trên dữ liệu sinh viên đa nguồn đã được phi nhạy cảm của một trường đại học. Kết quả thí nghiệm cho thấy phương pháp đề xuất có những ưu điểm đáng kể so với các thuật toán học máy thông thường. Về mặt dự đoán thành tích, sai số bình quân (MSE) đạt 24.976, sai số tuyệt đối bình quân (MAE) đạt 3.551, hệ số xác định ($$R^{2}$$ R 2 ) đạt 80.3%. Phương pháp chân dung sinh viên và Catboost–SHAP được sử dụng để phân tích trực quan các yếu tố thành tích học tập, cung cấp hỗ trợ quyết định trực quan và trợ giúp hướng dẫn cho các nhà quản lý giáo dục.

Từ khóa


Tài liệu tham khảo

Peterson JS, Colangelo N (1996) Gifted achievers and underachievers: a comparison of patterns found in school files. J Couns Dev 74:399–407. https://doi.org/10.1002/j.1556-6676.1996.tb01886.x

Reis SM, McCoach DB (2000) The underachievement of gifted students: what do we know and where do we go? Gift Child Q 44:152–170. https://doi.org/10.1177/001698620004400302

Preece A (2018) Asking “Why” in AI: explainability of intelligent systems—perspectives and challenges. Intell Syst Accounting, Financ Manag 25:63–72. https://doi.org/10.1002/isaf.1422

Aslam M (2019) Neutrosophic analysis of variance: application to university students. Complex Intell Syst 5:403–407. https://doi.org/10.1007/s40747-019-0107-2

Matthes B, Stoeger H (2018) Influence of parents’ implicit theories about ability on parents’ learning-related behaviors, children’s implicit theories, and children’s academic achievement. Contemp Educ Psychol 54:271–280. https://doi.org/10.1016/j.cedpsych.2018.07.001

Zimmerman BJ, Kitsantas A (2014) Comparing students’ self-discipline and self-regulation measures and their prediction of academic achievement. Contemp Educ Psychol 39:145–155. https://doi.org/10.1016/j.cedpsych.2014.03.004

Fonteyne L, Duyck W, De Fruyt F (2017) Program-specific prediction of academic achievement on the basis of cognitive and non-cognitive factors. Learn Individ Differ 56:34–48. https://doi.org/10.1016/j.lindif.2017.05.003

Huang S, Fang N (2013) Predicting student academic performance in an engineering dynamics course: a comparison of four types of predictive mathematical models. Comput Educ 61:133–145. https://doi.org/10.1016/j.compedu.2012.08.015

Antonenko PD, Toy S, Niederhauser DS (2012) Using cluster analysis for data mining in educational technology research. Educ Technol Res Dev 60:383–398. https://doi.org/10.1007/s11423-012-9235-8

Dharmarajan A, Velmurugan T (2013) Applications of partition based clustering algorithms: a survey. In: 2013 IEEE International Conference on computational intelligence and computing research. IEEE, pp 1–5

Miguéis VL, Freitas A, Garcia PJV, Silva A (2018) Early segmentation of students according to their academic performance: A predictive modelling approach. Decis Support Syst 115:36–51. https://doi.org/10.1016/j.dss.2018.09.001

Yukselturk E, Ozekes S, Türel YK (2014) Predicting Dropout Student: An Application of Data Mining Methods in an Online Education Program. Eur J Open, Distance E-Learning 17:118–133. https://doi.org/10.2478/eurodl-2014-0008

Hachey AC, Wladis CW, Conway KM (2014) Do prior online course outcomes provide more information than G.P.A. alone in predicting subsequent online course grades and retention? An observational study at an urban community college. Comput Educ 72:59–67. https://doi.org/10.1016/j.compedu.2013.10.012

Asif R, Merceron A, Ali SA, Haider NG (2017) Analyzing undergraduate students’ performance using educational data mining. Comput Educ 113:177–194. https://doi.org/10.1016/j.compedu.2017.05.007

Jugo I, Kovačić B, Slavuj V (2016) Increasing the adaptivity of an intelligent tutoring system with educational data mining: a system overview. Int J Emerg Technol Learn 11:67. https://doi.org/10.3991/ijet.v11i03.5103

Elbadrawy A, Polyzou A, Ren Z et al (2016) Predicting student performance using personalized analytics. Computer (Long Beach Calif) 49:61–69. https://doi.org/10.1109/MC.2016.119

Xu X, Wang J, Peng H, Wu R (2019) Prediction of academic performance associated with internet usage behaviors using machine learning algorithms. Comput Human Behav 98:166–173. https://doi.org/10.1016/j.chb.2019.04.015

Lu J, Liu A, Song Y, Zhang G (2020) Data-driven decision support under concept drift in streamed big data. Complex Intell Syst 6:157–163. https://doi.org/10.1007/s40747-019-00124-4

Ribeiro MT, Singh S, Guestrin C (2016) “Why should i trust you?” In: Proceedings of the 22nd ACM SIGKDD International Conference on knowledge discovery and data mining. ACM, New York, NY, USA, pp 1135–1144

Cruz-Jesus F, Castelli M, Oliveira T et al (2020) Using artificial intelligence methods to assess academic achievement in public high schools of a European Union country. Heliyon 6:e04081. https://doi.org/10.1016/j.heliyon.2020.e04081

Lundberg SM, Lee SI (2017) A unified approach to interpreting model predictions. In: Advances in neural information processing systems

García S, Luengo J, Herrera F (2016) Tutorial on practical tips of the most influential data preprocessing algorithms in data mining. Knowl-Based Syst 98:1–29. https://doi.org/10.1016/j.knosys.2015.12.006

Wang S, Wang Y, Wang D et al (2020) An improved random forest-based rule extraction method for breast cancer diagnosis. Appl Soft Comput 86:105941. https://doi.org/10.1016/j.asoc.2019.105941

Hoque N, Singh M, Bhattacharyya DK (2018) EFS-MI: an ensemble feature selection method for classification. Complex Intell Syst 4:105–118. https://doi.org/10.1007/s40747-017-0060-x

Boodhun N, Jayabalan M (2018) Risk prediction in life insurance industry using supervised learning algorithms. Complex Intell Syst 4:145–154. https://doi.org/10.1007/s40747-018-0072-1