Sử dụng phân tích học tập để phát triển hệ thống cảnh báo sớm cho sinh viên gặp khó khăn

Gökhan Akçapınar1, Arif Altun1, Petek Aşkar1
1Department of Computer Education and Instructional Technology, Hacettepe University, Ankara, 06800, Turkey

Tóm tắt

Trong nghiên cứu hiện tại, dữ liệu tương tác của sinh viên trong môi trường học trực tuyến đã được sử dụng để nghiên cứu xem liệu hiệu suất học tập của sinh viên vào cuối kỳ có thể được dự đoán từ những tuần đầu hay không. Nghiên cứu được thực hiện với 76 sinh viên năm hai đại học đăng ký trong một khóa học phần cứng máy tính. Nghiên cứu nhằm trả lời hai câu hỏi chính: những thuật toán và đặc điểm nào dự đoán tốt nhất hiệu suất học tập cuối kỳ của sinh viên bằng cách so sánh các thuật toán phân loại khác nhau và kỹ thuật tiền xử lý, và liệu hiệu suất học tập có thể được dự đoán trong những tuần đầu hay không bằng cách sử dụng các đặc điểm và thuật toán đã chọn. Kết quả của nghiên cứu cho thấy thuật toán kNN đã dự đoán chính xác sinh viên không thành công vào cuối kỳ với tỷ lệ 89%. Khi xem xét các phát hiện liên quan đến phân tích dữ liệu thu được trong các tuần 3, 6, 9, 12 và 14 để dự đoán liệu hiệu suất học tập cuối kỳ của sinh viên có thể được dự đoán trong những tuần đầu hay không, người ta đã quan sát rằng sinh viên không thành công vào cuối kỳ có thể được dự đoán với tỷ lệ 74% chỉ trong 3 tuần. Những phát hiện từ nghiên cứu này rất quan trọng cho việc xác định các đặc thù cho các hệ thống cảnh báo sớm có thể được phát triển cho các hệ thống học trực tuyến và như những chỉ báo về sự thành công của sinh viên. Đồng thời, nó sẽ hỗ trợ các nhà nghiên cứu trong việc lựa chọn các thuật toán và kỹ thuật tiền xử lý trong phân tích dữ liệu giáo dục.

Từ khóa

#phân tích học tập #hệ thống cảnh báo sớm #sinh viên gặp khó khăn #thuật toán kNN #hiệu suất học tập

Tài liệu tham khảo

Akçapınar, G., Çoşgun, E., & Altun, A. (2013, October 17th - 18th). Mining Wiki Usage Data for Predicting Final Grades of Students. Paper presented at the International Academic Conference on Education, Teaching and E-learning (IAC-ETeL 2013), Prague, Czech Republic.

Akçapınar, G., Hasnine, M. N., Majumdar, R., Flanagan, B., & Ogata, H. (2019). Developing an early-warning system for spotting at-risk students by using eBook interaction logs. Smart Learning Environments, 6(4), 1–15. https://doi.org/10.1186/s40561-019-0083-4 .

Arnold, K. E. (2010). Signals: Applying academic analytics. Educause Quarterly, 33(1) Retrieved from http://www.educause.edu/ero/article/signals-applying-academic-analytics .

Arnold, K. E., & Pistilli, M. D. (2012). Course signals at Purdue: Using learning analytics to increase student success. Paper presented at the proceedings of the 2nd international conference on learning analytics and knowledge, Vancouver, British Columbia, Canada.

Baker, R. S. J. d. (2010). Data Mining. In International encyclopedia of education (Third Edition) (pp. 112–118). Oxford: Elsevier.

Bienkowski, M., Feng, M., & Means, B. (2012). Enhancing teaching and learning through educational data mining and learning analytics: An issue brief. Retrieved from Washington, D.C.:

Campbell, J. P., DeBlois, P. B., & Oblinger, D. G. (2007). Academic analytics: A new tool for a new era. Educause Review, 42(4), 40.

Chatti, M. A., Dyckhoff, A. L., Schroeder, U., & Thüs, H. (2012). A reference model for learning analytics. International Journal of Technology Enhanced Learning, 4(5), 318–331. https://doi.org/10.1504/IJTEL.2012.051815 .

Costa, E. B., Fonseca, B., Santana, M. A., de Araújo, F. F., & Rego, J. (2017). Evaluating the effectiveness of educational data mining techniques for early prediction of students' academic failure in introductory programming courses. Computers in Human Behavior, 73(supplement C), 247-256. doi: https://doi.org/10.1016/j.chb.2017.01.047

Demšar, J., Curk, T., Erjavec, A., Gorup, Č., Hočevar, T., Milutinovič, M., … Zupan, B. (2013). Orange: Data mining toolbox in python. Journal of Machine Learning Research, 14(1), 2349–2353.

Dougherty, J., Kohavi, R., & Sahami, M. (1995). Supervised and unsupervised discretization of continuous features. Paper presented at the ICML.

Gašević, D., Dawson, S., Rogers, T., & Gasevic, D. (2016). Learning analytics should not promote one size fits all: The effects of instructional conditions in predicting academic success. The Internet and Higher Education, 28, 68–84. https://doi.org/10.1016/j.iheduc.2015.10.002 .

Han, J., Kamber, M., & Pei, J. (2006). Data Mining: Concepts and Techniques, Second Edition (The Morgan Kaufmann Series in Data Management Systems): Morgan Kaufmann.

Hu, Y.-H., Lo, C.-L., & Shih, S.-P. (2014). Developing early warning systems to predict students’ online learning performance. Computers in Human Behavior, 36, 469–478. https://doi.org/10.1016/j.chb.2014.04.002 .

Johnson, L., Smith, R., Willis, H., Levine, A., & Haywood, K. (2006). The 2011 horizon report. Austin, Texas: The new media consortium, 2011. In.

Lavoué, É. (2011). Social Tagging to Enhance Collaborative Learning. In H. Leung, E. Popescu, Y. Cao, R. H. Lau, & W. Nejdl (Eds.), Advances in Web-Based Learning - ICWL 2011 (Vol. 7048, pp. 92–101): Springer Berlin Heidelberg.

Lopez, M. I., Luna, J. M., Romero, C., & Ventura, S. (2012). Classification via clustering for predicting final marks based on student participation in forums. Paper presented at the 5th international conference on educational data mining, EDM 2012, Chania, Greece.

Macfadyen, L. P., & Dawson, S. (2010). Mining LMS data to develop an “early warning system” for educators: A proof of concept. Computers & Education, 54(2), 588–599. https://doi.org/10.1016/j.compedu.2009.09.008 .

Osmanbegović, E., & Suljić, M. (2012). Data mining approach for predicting student performance. Economic Review, 10(1).

Peña-Ayala, A. (2014). Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, 41(4, part 1), 1432-1462. doi: https://doi.org/10.1016/j.eswa.2013.08.042

Piramuthu, S. (2004). Evaluating feature selection methods for learning in data mining applications. European Journal of Operational Research, 156(2), 483–494. https://doi.org/10.1016/S0377-2217(02)00911-6 .

Pretnar, A. (2019). The Mystery of Test & Score. Retrieved from http://orange.biolab.si/blog/2019/1/28/the-mystery-of-test-and-score/

Ribeiro, M. X., Traina, A. J. M., & Caetano Traina, J. (2008). A new algorithm for data discretization and feature selection. Fortaleza, Ceara, Brazil: Paper presented at the Proceedings of the 2008 ACM symposium on applied computing.

Romero, C., Espejo, P. G., Zafra, A., Romero, J. R., & Ventura, S. (2010). Web usage mining for predicting final marks of students that use Moodle courses. Computer Applications in Engineering Education, n/a-n/a. https://doi.org/10.1002/cae.20456 .

Romero, C., Espejo, P. G., Zafra, A., Romero, J. R., & Ventura, S. (2013). Web usage mining for predicting final marks of students that use Moodle courses. Computer Applications in Engineering Education, 21(1), 135–146. https://doi.org/10.1002/cae.20456 .

Romero, C., Olmo, J., & Ventura, S. (2013). A meta-learning approach for recommending a subset of white-box classification algorithms for Moodle datasets. Paper presented at the 6th International Conference on Educational Data Mining (EDM 2013), Memphis, Tennessee, USA.

Romero, C., Ventura, S., Hervás, C., & Gonzales, P. (2008). Data mining algorithms to classify students. Paper presented at the Proc. Data Mining, Montreal: Int. Conf. Educ.

Tanes, Z., Arnold, K. E., King, A. S., & Remnet, M. A. (2011). Using signals for appropriate feedback: Perceptions and practices. Computers & Education, 57(4), 2414–2422. https://doi.org/10.1016/j.compedu.2011.05.016 .