Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Nhận diện cảm xúc trong giọng nói bằng cách sử dụng hàm phân biệt bậc hai đã được điều chỉnh
Tóm tắt
Hàm phân biệt bậc hai (QDF) thường được sử dụng trong nhận diện cảm xúc trong giọng nói, với giả thuyết rằng dữ liệu đầu vào có phân phối chuẩn. Trong bài báo này, chúng tôi đề xuất một phép biến đổi để chuẩn hóa các đặc trưng cảm xúc, sau đó phát triển một hàm phân biệt bậc hai đã được điều chỉnh (MQDF) cho nhận diện cảm xúc trong giọng nói. Các đặc trưng dựa trên ngữ điệu và chất lượng giọng nói được trích xuất và Mạng nơ-ron phân tích thành phần chính (PCANN) được sử dụng để giảm chiều của các vector đặc trưng. Kết quả cho thấy các đặc trưng về chất lượng giọng nói là một bổ sung hiệu quả cho quá trình nhận diện, và phương pháp trong bài báo này có thể cải thiện tỷ lệ nhận diện một cách hiệu quả.
Từ khóa
#nhận diện cảm xúc #hàm phân biệt bậc hai #chuẩn hóa #đặc trưng giọng nói #phân tích thành phần chínhTài liệu tham khảo
Rosalind W. Picard. Affective Computing. Cambridge, MA, MIT Press, 1997, 47–85.
K. Alter, E. Tank, and S. Kotz. Accentuation and emotions-two different systems. ISCA Workshop (ITRW) on Speech and Emotion, Newcastle, Northern Ireland, 2000, 138–142.
S. Chennoukh, A. Gerrits, G. Miet, and P. Sluijter. Speech enhancement via frequency bandwidth extension using line spectral frequencies. ICASSP’01, Salt Lake City, UT, USA, May 1, 2001, 665–668.
C. E. Osgood, J. G. Suci, and P. H. Tannenbaum. The Measurement of Meaning. Urbana, University of Illinois Press, 1957, 31–76.
Wang Zhiping, Zhao Li, and Zou Cairong. Emotional speech recognition based on modified parameter and distance of statistical model of pitch. Acta Acustica, 31(2006)1, 29–34 (in Chinese). 王治平, 赵力, 邹采荣. 基于基音参数规整及统计分布模型距离的语音情感识别. 声学学报, 31(2006)1, 29–34.
Xie Bo, Chen Ling, Chen Gencai, and Chen Chun. Feature selection for emotion recognition of mandarin speech. Journal of Zhejiang University, 41(2007)11, 1816–1822 (in Chinese). 킻늨, 돂쇫, 돂룹닅, 돂뒿. 웕춨뮰폯틴쟩룐쪶뇰뗄쳘 헷톡퓱벼쫵. 헣붭듳톧톧놨(릤톧 냦), 41(2007)11, 1816–1822.
Christer Gobl and Ailbhe Ni Chasaide. The role of voice quality in communicating emotion, mood and attitude. Speech Communication, 40(2003)1–2, 189–212.
Jin Xuecheng and Wang Zengfu. An emotion space model for recognition of emotions in spoken Chinese. ACII2005, Beijing, 2005, 397–402.
Jin Xuecheng. A study on recognition of emotions in speech. [Ph.D. dissertation], Hefei, University of Science and Technology of China, 2007 (in Chinese). 뷰톧돉. 믹폚폯틴탅뫅뗄쟩룐쪶뇰퇐뺿. [늩쪿톧캻싛 컄], 뫏럊, 훐맺뿆톧벼쫵듳톧, 2007.
P. M. Sakia. The Box-Cox transformation technique: a review. The Statistician, 42(1992)2, 169–178.
J. W. Tukey. The comparative anatomy of transformations. Annals of Mathematical Statistics, 28 (1957)3, 602–632.
Tian Jun-feng and Liu Xian-yue. Data classify model of intrusion detection-PCANN. Microelectronics & Computer, 24(2007)09, 126–133 (in Chinese). 田俊峰, 刘仙跃. 入侵检测数据分类模型-PCANN. 微电子学与计算机, 24(2007)09, 126–133.