Có cần một người điều khiển (Wizard-of-Oz) cho việc thực hành hội thoại do robot dẫn dắt trong một ngôn ngữ thứ hai?
Tóm tắt
Phần lớn các nghiên cứu trước đây về hội thoại giữa con người và robot trong ngôn ngữ thứ hai đều được thực hiện với sự hỗ trợ của một người điều khiển Wizard-of-Oz. Lý do là việc nhận dạng giọng nói tự động đối với lời nói hội thoại không phải bản ngữ được coi là không đáng tin cậy và nhiệm vụ quản lý hội thoại trong việc lựa chọn các câu robot phù hợp trong một lượt nói nhất định là phức tạp trong các cuộc đối thoại xã hội. Nghiên cứu này do đó điều tra xem việc thực hành hội thoại do robot dẫn dắt trong một ngôn ngữ thứ hai với các cặp người học trưởng thành có thể được một robot tự động quản lý hay không. Đầu tiên, chúng tôi điều tra mức độ chính xác và khả năng hiểu của các bản sao lời nói từ người học ngôn ngữ thứ hai khi được thực hiện bởi một công nghệ nhận diện giọng nói tiên tiến. Chúng tôi phát hiện ra tỷ lệ sai sót từ vựng tương đối cao (41%) và một phần đáng kể (42%) của các câu nói được đánh giá là không thể hiểu hoặc chỉ có thể hiểu một phần bởi người đọc. Sau đó, chúng tôi đánh giá mức độ phù hợp của việc lựa chọn câu nói robot, khi được thực hiện thủ công dựa trên các bản sao giọng nói hoặc tự động sử dụng (a) các chuỗi câu nói robot được định trước, (b) một mô hình ngôn ngữ tiên tiến tổng quát mà lựa chọn các câu nói dựa trên đầu vào của người học hoặc câu nói trước đó của robot, hoặc (c) một phương pháp thống kê tùy chỉnh được huấn luyện dựa trên các quan sát về lựa chọn của người điều khiển trong các cuộc hội thoại trước đó. Kết quả cho thấy câu nói robot phù hợp hoặc ít nhất là chấp nhận được được người điều khiển chọn trong hầu hết các trường hợp (96%), mặc dù các bản sao ASR có tỷ lệ sai sót từ vựng cao. Hơn nữa, phương pháp thống kê tùy chỉnh hoạt động tốt như việc lựa chọn câu nói robot thủ công dựa trên bản sao ASR. Cũng đã được tìm thấy rằng chiến lược tương tác mà robot áp dụng, có sự khác biệt về mức độ mà robot duy trì sáng kiến trong cuộc trò chuyện và liệu trọng tâm của cuộc hội thoại nằm ở robot hay người học, có tác động nhỏ đến tỷ lệ sai sót từ vựng và khả năng hiểu của các bản sao nhưng có tác động lớn hơn đến tính phù hợp của việc lựa chọn câu nói. Do đó, các cuộc hội thoại do robot dẫn dắt có thể hoạt động tốt hơn với một số chiến lược tương tác của robot.
Từ khóa
