Thuật toán bandit để cá nhân hóa chatbot giáo dục

Machine Learning - Tập 110 - Trang 2389-2418 - 2021
William Cai1, Josh Grossman1, Zhiyuan Jerry Lin1, Hao Sheng1, Johnny Tian-Zheng Wei2, Joseph Jay Williams3, Sharad Goel1
1Stanford University, Stanford, USA
2University of Massachusetts Amherst, Amherst, USA
3University of Toronto, Toronto, USA

Tóm tắt

Để mô phỏng tính tương tác của việc giảng dạy toán học trực tiếp, chúng tôi đã phát triển MathBot, một chatbot dựa trên quy tắc có khả năng giải thích các khái niệm toán học, cung cấp câu hỏi luyện tập và đưa ra phản hồi cá nhân hóa. Chúng tôi đã đánh giá MathBot qua ba nghiên cứu trên Amazon Mechanical Turk, trong đó người tham gia học về dãy số cộng. Trong nghiên cứu đầu tiên, chúng tôi phát hiện rằng hơn 40% người tham gia cho biết họ thích học với MathBot hơn so với video và tài liệu viết từ Khan Academy. Nghiên cứu thứ hai đo lường mức độ tăng trưởng học tập, và cho thấy MathBot mang lại mức độ tăng trưởng tương đương với video và tài liệu của Khan Academy. Chúng tôi đã thu thập phản hồi từ người dùng trong hai nghiên cứu đó để mô phỏng một chu kỳ phát triển thực tế, với một số người dùng cảm thấy bài học quá chậm và những người khác cảm thấy quá nhanh. Chúng tôi đã giải quyết những mối quan tâm này trong nghiên cứu thứ ba và chính bằng cách tích hợp một thuật toán bandit ngữ cảnh vào MathBot để cá nhân hóa tốc độ cuộc trò chuyện, cho phép bandit chèn thêm bài tập luyện tập hoặc bỏ qua các giải thích. Chúng tôi đã phân ngẫu nhiên người tham gia giữa hai điều kiện trong đó các hành động được chọn hoàn toàn ngẫu nhiên (tức là, một thí nghiệm A/B ngẫu nhiên) hoặc bởi thuật toán bandit ngữ cảnh. Chúng tôi phát hiện ra rằng bandit đã học được một chính sách sư phạm hiệu quả tương tự như chính sách học được từ thí nghiệm A/B ngẫu nhiên trong khi chịu chi phí thí nghiệm thấp hơn. Các phát hiện của chúng tôi gợi ý rằng các tác nhân hội thoại cá nhân hóa là công cụ đầy hứa hẹn để bổ sung cho các nguồn tài nguyên trực tuyến hiện có cho giáo dục toán học, và rằng các phương pháp dựa trên dữ liệu như bandit ngữ cảnh là công cụ quý giá để học cách cá nhân hóa hiệu quả.

Từ khóa

#chatbot giáo dục #thuật toán bandit #cá nhân hóa #học tập toán học

Tài liệu tham khảo

Agrawal, S., & Goyal, N. (2013, May). Thompson sampling for contextual bandits with linear payoffs. In International Conference on Machine Learning (pp. 127–135). PMLR. Al-Rfou, R., Pickett, M., Snaider, J., Sung, Y.-H., Strope, B., & Kurzweil, R. (2016). Conversational contextual cues: The case of personalization and history for response ranking. arXiv preprint arXiv:1606.00372 Aleven, V., McLaren, B. M., & Sewall, J. (2009a). Scaling up programming by demonstration for intelligent tutoring systems development: An open-access web site for middle school mathematics learning. IEEE Transactions on Learning Technologies, 2(2), 64–78 Aleven, V., Mclaren,B. M., Sewall, J., & Koedinger, K. R. (2009b). A new paradigm for intelligent tutoring systems: Example-tracing tutors. Technical report Aleven, V., McLaren, B. M., Sewall, J., van Velsen, M., Popescu, O., Demi, S., Ringenberg, M., & Koedinger, K. R. (2016). Example-tracing tutors: Intelligent tutor development for non-programmers. International Journal of Artificial Intelligence in Education, 26(1), 224–269 Andrews, P., De Boni, M., Manandhar, S., & De, M. (2006) Persuasive argumentation in human computer dialogue. In AAAI spring symposium: Argumentation for consumers of healthcare (pp. 8–1) Bala, K., Kumar, M., Hulawale, S., & Pandita, S. (2017). Chat-bot for college management system using ai. International Research Journal of Engineering and Technology, 4(11), 2030–2033. Bobrow, D. G., & Winograd, T. (1977). An overview of krl, a knowledge representation language. Cognitive science, 1(1), 3–46 Chi, M., VanLehn, K., Litman, D., & Jordan, P. (2011). Empirically evaluating the application of reinforcement learning to the induction of effective and adaptive pedagogical strategies. User Modeling and User-Adapted Interaction, 21(1), 137–180. Chu-Carroll, J., Brown,M. K. (1997) Tracking initiative in collaborative dialogue interactions. In Proceedings of the eighth conference on European chapter of the association for computational linguistics (pp. 262–270). Association for Computational Linguistics Clement, B., Oudeyer, P.-Y., Roy, D., & Lopes, M. (2015). Multi-armed bandits for intelligent tutoring systems., 7(2), 20–48 Craig, S. D., Hu, X., Graesser, A. C., Bargagliotti, A. E., Sterbinsky, A., Cheney, K. R., Okwumabua, T. & Cheney, S. (2013). The impact of a technology-based mathematics after-school program using ALEKS on student’s knowledge and behaviors. Computers & Education, 68, 495–504 Davis, D., Hauff, C., & Houben, G.-J. (2018) Evaluating crowdworkers as a proxy for online learners in video-based learning contexts. In Proceedings of the ACM on human-computer interaction (pp. 42:1–42:16). ACM Falmagne, J.-C., Albert, D., Doble, C., Eppstein, D., & Hu,X. (2013) Knowledge spaces: Applications in education. Springer Science & Business Media Feng, M., Heffernan, N., & Koedinger, K. (2009). Addressing the assessment challenge with an online system that tutors as it assesses. User Modeling and User-Adapted Interaction, 19(3), 243–266 Graesser, A. C., Lu, S., Jackson, G. T., Mitchell, H. H., Ventura, M., Olney, A., & Louwerse, M. M. (2004). AutoTutor: A tutor with dialogue in natural language. Behavior Research Methods, Instruments, & Computers, 36(2), 180–192 Graesser, A. C., Penumatsa, P., Ventura, M., Cai, Z., & Hu, X. (2007). Using lsa in autotutor: Learning through mixed initiative dialogue in natural language. Handbook of latent semantic analysis, 243–262 Graesser, A. C., Person, N. K., & Magliano, J. P. (1995). Collaborative dialogue patterns in naturalistic one-to-one tutoring. Applied Cognitive Psychology, 9(6), 495–522 Graesser, A. C., VanLehn, K., Rosé, C. P., Jordan, P. W., & Harter, D. (2001). Intelligent tutoring systems with conversational dialogue. AI magazine, 22(4), 39 Graesser, A. C., Wiemer-Hastings, K., Wiemer-Hastings, P., & Kreuz, R. (1999). AutoTutor: A simulation of a human tutor. Cognitive Systems Research, 1(1), 35–51 Heffernan, N. T., & Heffernan, C. L. (2014). The assistments ecosystem: Building a platform that brings scientists and teachers together for minimally invasive research on human learning and teaching. International Journal of Artificial Intelligence in Education, 24(4), 470–497 Horzyk, A., Magierski, S., & Miklaszewski, G. (2009). An intelligent internet shop-assistant recognizing a customer personality for improving man-machine interactions. Recent Advances in intelligent information systems, 13–26 Koedinger, K. R., Aleven, V., Heffernan, N., Mclaren, B., & Hockenberry, M. (2004). Opening the door to non-programmers: Authoring intelligent tutor behavior by demonstration. Technical report Lai, T. L., & Robbins, H. (1985). Asymptotically efficient adaptive allocation rules. Advances in applied mathematics, 6(1), 4–22 Lan, A. S., & Baraniuk, R. G. (2016). A contextual bandits framework for personalized learning action selection. In Proceedings of the 9th international conference on educational data mining (pp. 424–429) Lee, S. J., Liu, Y.-E., & Popovic, Z. (2014) Learning individual behavior in an educational game: A data-driven approach. In Proceedings of the 7th international conference on educational data mining (EDM) (pp. 114–121) Li, L., Chu, W., Langford, J., & Schapire, R. E. (2010). A contextual-bandit approach to personalized news article recommendation. WWW, 2010, 661–670 Li, L., Chu, W., Langford, J., & Wang, X. (2011, February). Unbiased offline evaluation of contextual-bandit-based news article recommendation algorithms. In Proceedings of the fourth ACM international conference on Web search and data mining (pp. 297–306). Nye, B. D., Graesser, A. C., & Hu, X. (2014). AutoTutor and family: A review of 17 years of natural language tutoring. International Journal of Artificial Intelligence in Education, 24(4), 427–469 Nye, B. D., Pavlik, P. I., Windsor, A., Olney, A. M., Hajeer, M., & Hu, X. (2018). SKOPE-IT (Shareable Knowledge Objects as Portable Intelligent Tutors): overlaying natural language tutoring on an adaptive learning system for mathematics. International Journal of STEM Education, 5(1), 12 O'Rourke, E., Andersen, E., Gulwani, S., & Popović, Z. (2015, April). A framework for automatically generating interactive instructional scaffolding. In Proceedings of the 33rd annual ACM conference on human factors in computing systems (pp. 1545–1554). Person, N. K. (2003). AutoTutor improves deep learning of computer literacy: Is it the dialog or the talking head. Artificial intelligence in education: Shaping the future of learning through intelligent technologies, 97, 47 Quarteroni, S., & Manandhar, S. (2007). A chatbot-based interactive question answering system. Decalog 2007, 83 Raux, A., & Eskenazi, M. (2009) A finite-state turn-taking model for spoken dialog systems. In Proceedings of human language technologies: The 2009 annual conference of the North American chapter of the association for computational linguistics (pp. 629–637). Association for Computational Linguistics Ritter, S., Anderson, J. R., Koedinger, K. R., & Corbett, A. (2007). Cognitive tutor: Applied research in mathematics education. Psychonomic Bulletin & Review, 14(2), 249–255 Ruan, S., Jiang, L., Xu, J., Tham, B. J. K., Qiu, Z., Zhu, Y., … Landay, J. A. (2019, May). Quizbot: A dialogue-based adaptive learning system for factual knowledge. In Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems (pp. 1–13). Segal, A., David, Y. B., Williams, J. J., Gal, K., & Shalom, Y. (2018, June). Combining difficulty ranking with multi-armed bandits to sequence educational content. In International conference on artificial intelligence in education (pp. 317–321). Cham: Springer. Seneff, S. (1992). Tina: A natural language system for spoken language applications. Computational linguistics, 18(1), 61–86 Shin, H., Ko, E.-Y., Williams, J. J., & Kim, J. (2018). Understanding the effect of in-video prompting on learners and instructors. In Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems (p. 319). ACM Snow, R. E. (1989). Aptitude-treatment interaction as a framework for research on individual differences in learning. A series of books in psychology (pp. 13–59). Advances in theory and research: Learning and individual differences VanLehn, K. (1996). Conceptual and meta learning during coached problem solving (pp. 29–47) VanLehn, K., Jordan, P. W., Rosé, C. P., Bhembe, D., Böttner, M., Gaydos, A., Makatchev, M., Pappuswamy, U., Ringenberg, M., Roque, A., Siler, S., & Srivastava, R. (2002). The architecture of why2-atlas: A coach for qualitative physics essay writing. In International conference on intelligent tutoring systems (pp. 158–167). Springer Walker, M., & Whittaker, S. (1990) Mixed initiative in dialogue: An investigation into discourse segmentation. In Proceedings of the 28th annual meeting on association for computational linguistics (pp. 70–78). Association for Computational Linguistics Weeraratne, B., & Chin, B. (2018). Can khan academy e-learning video tutorials improve mathematics achievement in Srilanka? International Journal of Education and Development Using Information and Communication Technology, 14(3), 93–112 Winkler, R., Hobert, S., Salovaara, A., Söllner, M., & Leimeister, J. M. (2020). Sara, the lecturer: Improving learning in online education with a scaffolding-based conversational agent. In Proceedings of the 2020 CHI conference on human factors in computing systems (pp. 1–14) Xu, A., Liu, Z., Guo, Y., Sinha, V., & Akkiraju, R. (2017). A new chatbot for customer service on social media. In Proceedings of the 2017 CHI conference on human factors in computing systems (pp. 3506–3510). ACM Yan, R., Song, Y., & Wu, H. (2016). Learning to respond with deep neural networks for retrieval-based human-computer conversation system. In Proceedings of the 39th international ACM SIGIR conference on research and development in information retrieval (pp. 55–64). ACM Zhou, G., Wang, J., Lynch, C., & Chi, M. (2017). Towards closing the loop: Bridging machine-induced pedagogical policies to learning theories. In Proceedings of the 10th international conference on educational data mining (pp. 112–119)