Hệ thống truy xuất thông tin dựa trên truy vấn bằng lời nói MERL: một hệ thống để truy xuất tài liệu liên quan từ truy vấn bằng lời nói

P. Wolf1, B. Raj1
1Mitsubishi Electric Research Laboratories, Inc., Cambridge, MA, USA

Tóm tắt

Bài báo này mô tả một số khái niệm chính được phát triển và sử dụng trong thiết kế của một hệ thống truy xuất thông tin dựa trên truy vấn bằng lời nói được phát triển tại Phòng thí nghiệm Nghiên cứu Mitsubishi Electric (MERL). Những đổi mới trong hệ thống bao gồm việc tự động đưa vào từ khóa của tài liệu trong từ vựng của các bộ nhận diện, việc sử dụng vector không chắc chắn để đại diện cho các truy vấn bằng lời nói, và một phương pháp lập chỉ mục mà có thể chấp nhận việc sử dụng các vector không chắc chắn. Bài báo này mô tả các kỹ thuật này và bao gồm các kết quả thí nghiệm chứng minh hiệu quả của chúng.

Từ khóa

#Truy xuất thông tin #Nhận diện giọng nói #Từ vựng #Các bộ máy #Tính không chắc chắn #Đổi mới công nghệ #Lập chỉ mục #Bàn phím #Các trợ lý kỹ thuật số cá nhân #Điện thoại di động

Tài liệu tham khảo

turney, 1999, Learning to extract keyphrases from text, NRC Technical Report ERB-1057 10.1108/eb046814 evermann, 0, Large vocabuary recognition and confidence estimation using word posterior probabilities, Proc ICASSP 2000 cavnar, 1994, Using an N-gram based document representation with a vector processing retrieval model, Proc TREC, 3 10.1002/(SICI)1099-1506(199607/08)3:4<301::AID-NLA84>3.0.CO;2-S monz, 2000, Computational semantics and information retrieval, Proc Second Workshop on Inference in Computational Semantics breiman, 1984, Classi3cation and Regression Trees lee, 1999, Learning the parts of objects by non-negative matrix factorization, Nature, 401, 788, 10.1038/44565 berry, 1992, Large scale singular value computations, Intl Journal of Supercomputer Applications, 6, 13, 10.1177/109434209200600103