Nhận dạng tiếng Việt sử dụng âm vị có thanh điệu dựa trên mô hình phân bố đa không gian

Journal of Computer Science and Cybernetics - Tập 30 Số 1 - Trang 28-38 - 2014
Nguyen Van Huy1, Luong Chi Mai2, Vu Tat Thang2, Do Quoc Truong3
1Electronic faculty, Thai Nguyen University of Technology, VietNam
2Institute of Information Technology, Vietnam Academy of Sience and Technology, Vietnam
3Graduate School of Information Science, Nara Institute of Science and Technology, Japan

Tóm tắt

Báo cáo trình bày việc áp dụng mô hình Markov ẩn phân bố đa không gian Multi Space Distribution Hidden Markov Model (MSD-HMM) cho nhận dạng tiếng Việt. Nghiên cứu đề xuất một kiểu mô hình MSD-HMM để mô hình hoá cho các âm vị có chứa thông tin thanh điệu với đặc trưng đầu vào gồm bốn lớp độc lập. Các âm vị có thanh điệu được tạo ra bằng cách bổ sung thêm các ký hiệu thanh điệu tương ứng với từ chứa âm vị đó dựa theo bảng ngữ âm quốc tế (International Phonetic Alphabet). Kết quả nhận dạng sau khi áp dụng mô hình MSD-HMM trên tập âm vị có thanh điệu tốt hơn so với hệ thống cơ sở là 2.49%. Báo cáo cũng trình bày một cách tiếp cận để trích trọn đặc trưng thanh điệu nhằm tìm ra dạng đặc trưng thanh điệu phù hợp với mô hình MSD-HMM. Các kết quả thử nghiệm trong nghiên cứu này đã chỉ ra rằng mô hình MSD-HMM kết hợp với tập từ vị có thanh điệu đã làm tăng đáng kể độ chính xác nhận dạng, đồng thời cho thấy đặc trưng thanh điệu là một thành phân quan trọng trong các hệ thống nhận tiếng Việt.

Từ khóa

#Multi Space Distribution #tone recognition #Vietnamese recognition #pitch feature

Tài liệu tham khảo