Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo

Nhận diện cảm xúc trong giọng nói bằng cách sử dụng hàm phân biệt bậc hai đã được điều chỉnh

Journal of Electronics (China) - Tập 25 - Trang 840-844 - 2008

Yan Zhao¹, Li Zhao¹, Cairong Zou¹, Yinhua Yu¹

¹School of Information Science and Technology, Southeast University, Nanjing, China

Tóm tắt

Hàm phân biệt bậc hai (QDF) thường được sử dụng trong nhận diện cảm xúc trong giọng nói, với giả thuyết rằng dữ liệu đầu vào có phân phối chuẩn. Trong bài báo này, chúng tôi đề xuất một phép biến đổi để chuẩn hóa các đặc trưng cảm xúc, sau đó phát triển một hàm phân biệt bậc hai đã được điều chỉnh (MQDF) cho nhận diện cảm xúc trong giọng nói. Các đặc trưng dựa trên ngữ điệu và chất lượng giọng nói được trích xuất và Mạng nơ-ron phân tích thành phần chính (PCANN) được sử dụng để giảm chiều của các vector đặc trưng. Kết quả cho thấy các đặc trưng về chất lượng giọng nói là một bổ sung hiệu quả cho quá trình nhận diện, và phương pháp trong bài báo này có thể cải thiện tỷ lệ nhận diện một cách hiệu quả.

Từ khóa

#nhận diện cảm xúc #hàm phân biệt bậc hai #chuẩn hóa #đặc trưng giọng nói #phân tích thành phần chính

Tài liệu tham khảo

Rosalind W. Picard. Affective Computing. Cambridge, MA, MIT Press, 1997, 47–85. K. Alter, E. Tank, and S. Kotz. Accentuation and emotions-two different systems. ISCA Workshop (ITRW) on Speech and Emotion, Newcastle, Northern Ireland, 2000, 138–142. S. Chennoukh, A. Gerrits, G. Miet, and P. Sluijter. Speech enhancement via frequency bandwidth extension using line spectral frequencies. ICASSP’01, Salt Lake City, UT, USA, May 1, 2001, 665–668. C. E. Osgood, J. G. Suci, and P. H. Tannenbaum. The Measurement of Meaning. Urbana, University of Illinois Press, 1957, 31–76. Wang Zhiping, Zhao Li, and Zou Cairong. Emotional speech recognition based on modified parameter and distance of statistical model of pitch. Acta Acustica, 31(2006)1, 29–34 (in Chinese). 王治平, 赵力, 邹采荣. 基于基音参数规整及统计分布模型距离的语音情感识别. 声学学报, 31(2006)1, 29–34. Xie Bo, Chen Ling, Chen Gencai, and Chen Chun. Feature selection for emotion recognition of mandarin speech. Journal of Zhejiang University, 41(2007)11, 1816–1822 (in Chinese). 킻늨, 돂쇫, 돂룹닅, 돂뒿. 웕춨뮰폯틴쟩룐쪶뇰뗄쳘 헷톡퓱벼쫵. 헣붭듳톧톧놨(릤톧 냦), 41(2007)11, 1816–1822. Christer Gobl and Ailbhe Ni Chasaide. The role of voice quality in communicating emotion, mood and attitude. Speech Communication, 40(2003)1–2, 189–212. Jin Xuecheng and Wang Zengfu. An emotion space model for recognition of emotions in spoken Chinese. ACII2005, Beijing, 2005, 397–402. Jin Xuecheng. A study on recognition of emotions in speech. [Ph.D. dissertation], Hefei, University of Science and Technology of China, 2007 (in Chinese). 뷰톧돉. 믹폚폯틴탅뫅뗄쟩룐쪶뇰퇐뺿. [늩쪿톧캻싛 컄], 뫏럊, 훐맺뿆톧벼쫵듳톧, 2007. P. M. Sakia. The Box-Cox transformation technique: a review. The Statistician, 42(1992)2, 169–178. J. W. Tukey. The comparative anatomy of transformations. Annals of Mathematical Statistics, 28 (1957)3, 602–632. Tian Jun-feng and Liu Xian-yue. Data classify model of intrusion detection-PCANN. Microelectronics & Computer, 24(2007)09, 126–133 (in Chinese). 田俊峰, 刘仙跃. 入侵检测数据分类模型-PCANN. 微电子学与计算机, 24(2007)09, 126–133.

Scholar Hub - Công cụ hỗ trợ trích dẫn và phân tích khoa học Việt Nam

Về chúng tôi

Scholar Hub là công cụ hỗ trợ trích dẫn và phân tích các bài báo, công bố khoa học Việt Nam. Công cụ trợ giúp người nghiên cứu, tạp chí, đơn vị nghiên cứu tra cứu, phân tích và thống kê dữ liệu nghiên cứu khoa học tại Việt Nam và quốc tế.
ScholarHub KHÔNG đăng thông tin tổng hợp, KHÔNG đăng lại nội dung từ các trang báo chí Việt Nam hoặc trang thông tin điện tử khác tại Việt Nam.

Thông tin, cập nhật

Đăng ký Tạp chí tham gia vào Scholar Hub

Phản hồi ý kiến về Scholar Hub

Bài viết, nội dung cập nhật

Chủ đề khoa học

Website liên kết

Hệ thống CSDL Khoa học & Công nghệ

Phần mềm kiểm tra trùng lặp Kiểm Tra Tài Liệu

Phần mềm xuất bản tạp chí điện tử VOJS

Nền tảng trắc nghiệm và đề thi đa lĩnh vực LetQA