Nhận dạng tiếng Việt sử dụng âm vị có thanh điệu dựa trên mô hình phân bố đa không gian
Tóm tắt
Báo cáo trình bày việc áp dụng mô hình Markov ẩn phân bố đa không gian Multi Space Distribution Hidden Markov Model (MSD-HMM) cho nhận dạng tiếng Việt. Nghiên cứu đề xuất một kiểu mô hình MSD-HMM để mô hình hoá cho các âm vị có chứa thông tin thanh điệu với đặc trưng đầu vào gồm bốn lớp độc lập. Các âm vị có thanh điệu được tạo ra bằng cách bổ sung thêm các ký hiệu thanh điệu tương ứng với từ chứa âm vị đó dựa theo bảng ngữ âm quốc tế (International Phonetic Alphabet). Kết quả nhận dạng sau khi áp dụng mô hình MSD-HMM trên tập âm vị có thanh điệu tốt hơn so với hệ thống cơ sở là 2.49%. Báo cáo cũng trình bày một cách tiếp cận để trích trọn đặc trưng thanh điệu nhằm tìm ra dạng đặc trưng thanh điệu phù hợp với mô hình MSD-HMM. Các kết quả thử nghiệm trong nghiên cứu này đã chỉ ra rằng mô hình MSD-HMM kết hợp với tập từ vị có thanh điệu đã làm tăng đáng kể độ chính xác nhận dạng, đồng thời cho thấy đặc trưng thanh điệu là một thành phân quan trọng trong các hệ thống nhận tiếng Việt.