Các phát âm không ngôn ngữ từ video nghiệp dư trực tuyến cho nghiên cứu cảm xúc: Một tập hợp dữ liệu đã được xác nhận

Springer Science and Business Media LLC - Tập 49 - Trang 758-771 - 2016
Andrey Anikin1, Tomas Persson1
1Division of Cognitive Science, Department of Philosophy, Lund University, Lund, Sweden

Tóm tắt

Nghiên cứu này giới thiệu một tập hợp dữ liệu gồm 260 phát âm không ngôn ngữ tự nhiên của con người, đại diện cho chín cảm xúc: vui vẻ, tức giận, ghê tởm, cố gắng, sợ hãi, niềm vui, đau đớn, thích thú và buồn rầu. Độ chính xác trong một nhiệm vụ đánh giá thay đổi lớn theo cảm xúc, từ <40% đối với vui vẻ và đau đớn, đến >70% đối với vui vẻ, thích thú, sợ hãi và buồn rầu. Ngược lại, nhóm ngôn ngữ-văn hóa của người đánh giá không ảnh hưởng đến độ chính xác nhận diện: Tập hợp dữ liệu chủ yếu bằng tiếng Anh được phân loại với độ chính xác tương tự bởi những người tham gia từ Brazil, Nga, Thụy Điển và Vương quốc Anh/Mỹ. Các mô hình rừng ngẫu nhiên có giám sát phân loại âm thanh chính xác như những người đánh giá con người. Các yếu tố dự đoán âm thanh tốt nhất về cảm xúc là cao độ, tính hài hòa và sự phân bố cũng như độ đều đặn của âm tiết. Tập hợp dữ liệu phát âm cảm xúc hợp sinh này có thể được lọc để chỉ bao gồm những âm thanh có tỷ lệ nhận diện cao, nhằm nghiên cứu phản ứng đối với các kích thích cảm xúc thuộc các loại cảm nhận đã biết (bên tiếp nhận), hoặc có thể được sử dụng toàn bộ để nghiên cứu mối liên hệ giữa trạng thái cảm xúc và biểu hiện giọng nói (bên sản xuất).

Từ khóa

#Tâm lý học nhận thức

Tài liệu tham khảo

Arriaga, G. (2014). Why the caged mouse sings: Studies of the mouse ultrasonic song system and vocal behavior. In G. Witzany (Ed.), Biocommunication of animals (pp. 81–101). Germany: Springer. doi:10.1007/978-94-007-7414-8_6 Bachorowski, J. A., Smoski, M. J., & Owren, M. J. (2001). The acoustic features of human laughter. Journal of the Acoustical Society of America, 110, 1581–1597. Banse, R., & Scherer, K. R. (1996). Acoustic profiles in vocal emotion expression. Journal of Personality and Social Psychology, 70, 614–636. Bänziger, T., Mortillaro, M., & Scherer, K. R. (2012). Introducing the Geneva Multimodal Expression Corpus for experimental research on emotion perception. Emotion, 12, 1161–1179. doi:10.1037/a0025827 Batliner, A., Fischer, K., Huber, R., Spilker, J., & Nöth, E. (2000). Desperately seeking emotions or: Actors, wizards, and human beings. In R. Cowie, E. Douglas-Cowie, & M. Schröder (Eds.), ISCA Tutorial and Research Workshop (ITRW) on Speech and Emotion (pp. 195–200). Belfast: ISCA. Belin, P., Fillion-Bilodeau, S., & Gosselin, F. (2008). The Montreal Affective Voices: A validated set of nonverbal affect bursts for research on auditory affective processing. Behavior Research Methods, 40, 531–539. doi:10.3758/BRM.40.2.531 Bohn, K. M., Schmidt-French, B., Ma, S. T., & Pollak, G. D. (2008). Syllable acoustics, temporal patterns, and call composition vary with behavioral context in Mexican free-tailed bats. Journal of the Acoustical Society of America, 124, 1838–1848. Breazeal, C., & Aryananda, L. (2002). Recognition of affective communicative intent in robot-directed speech. Autonomous Robots, 12, 83–104. Breiman, L. (2001). Random forests. Machine Learning, 45, 5–32. Brudzynski, S. (2014). Social origin of vocal communication in rodents. In G. Witzany (Ed.), Biocommunication of animals (pp. 63–80). Berlin: Springer. Bryant, G. A., & Aktipis, C. A. (2014). The animal nature of spontaneous human laughter. Evolution and Human Behavior, 35, 327–335. Bryant, G. A., & Barrett, H. C. (2008). Vocal emotion recognition across disparate cultures. Journal of Cognition and Culture, 8, 135–148. doi:10.1163/156770908X289242 Crockford, C., Herbinger, I., Vigilant, L., & Boesch, C. (2004). Wild chimpanzees produce group-specific calls: A case for vocal learning? Ethology, 110, 221–243. Douglas-Cowie, E., Campbell, N., Cowie, R., & Roach, P. (2003). Emotional speech: Towards a new generation of databases. Speech Communication, 40, 33–60. Ekman, P. (1992). An argument for basic emotions. Cognition and Emotion, 6, 169–200. doi:10.1080/02699939208411068 Ekman, P., & Friesen, W. V. (1969). The repertoire of nonverbal behavior: Categories, origins, usage, and coding. Semiotica, 1, 49–98. Ekman, P., Davidson, R. J., & Friesen, W. V. (1990). The Duchenne smile: Emotional expression and brain physiology: II. Journal of Personality and Social Psychology, 58, 342–353. Elfenbein, H. A., & Ambady, N. (2002). On the universality and cultural specificity of emotion recognition: A meta-analysis. Psychological Bulletin, 128, 203–235. doi:10.1037/0033-2909.128.2.203 Gendron, M., Roberson, D., van der Vyver, J. M., & Barrett, L. F. (2014). Cultural relativity in perceiving emotion from vocalizations. Psychological Science, 25, 911–920. Hage, S. R., Gavrilov, N., & Nieder, A. (2013). Cognitive control of distinct vocalizations in rhesus monkeys. Journal of Cognitive Neuroscience, 25, 1692–1701. doi:10.1162/jocn_a_00428 Hawk, S. T., Van Kleef, G. A., Fischer, A. H., & Van der Schalk, J. (2009). “Worth a thousand words”: Absolute and relative decoding of non-linguistic affect vocalizations. Emotion, 9, 293–305. Jürgens, U. (2009). The neural control of vocalization in mammals: A review. Journal of Voice, 23, 1–10. Jürgens, R., Drolet, M., Pirow, R., Scheiner, E., & Fischer, J. (2013). Encoding conditions affect recognition of vocally expressed emotions across cultures. Frontiers in Psychology, 4, 111. doi:10.3389/fpsyg.2013.00111 Koeda, M., Belin, P., Hama, T., Masuda, T., Matsuura, M., & Okubo, Y. (2013). Cross-cultural differences in the processing of non-verbal affective vocalizations by Japanese and Canadian listeners. Frontiers in Psychology, 4, 105. doi:10.3389/fpsyg.2013.00105 Laukka, P., Elfenbein, H. A., Söder, N., Nordström, H., Althoff, J., Chui, W., . . . Thingujam, N. S. (2013). Cross-cultural decoding of positive and negative non-linguistic emotion vocalizations. Frontiers in Psychology, 4, 353. doi:10.3389/fpsyg.2013.00353 Lavan, N., Scott, S. K., & McGettigan, C. (2015). Laugh like you mean it: Authenticity modulates acoustic, physiological and perceptual properties of laughter. Journal of Nonverbal Behavior, 1–17. doi:10.1007/s10919-015-0222-8 Leinonen, L., Linnankoski, I., Laakso, M. L., & Aulanko, R. (1991). Vocal communication between species: Man and macaque. Language and Communication, 11, 241–262. Lima, C. F., Castro, S. L., & Scott, S. K. (2013). When voices get emotional: A corpus of nonverbal vocalizations for research on emotion processing. Behavior Research Methods, 45, 1234–1245. doi:10.3758/s13428-013-0324-3 Mampe, B., Friederici, A. D., Christophe, A., & Wermke, K. (2009). Newborns’ cry melody is shaped by their native language. Current Biology, 19, 1994–1997. Neiberg, D., Laukka, P., & Elfenbein, H. A. (2011). Intra-, inter-, and cross-cultural classification of vocal affect. In Proceedings of Interspeech 2011 (pp. 1581–1584). Florence: ISCA. Newman, J. D. (2007). Neural circuits underlying crying and cry responding in mammals. Behavioural Brain Research, 182, 155–165. Owren, M. J., Amoss, R. T., & Rendall, D. (2011). Two organizing principles of vocal production: Implications for nonhuman and human primates. American Journal of Primatology, 73, 530–544. Parsons, C., Young, K., Stein, A., Craske, M., & Kringelbach, M. L. (2014). Introducing the Oxford Vocal (OxVoc) Sounds database: A validated set of non-acted affective sounds from human infants, adults, and domestic animals. Frontiers in Psychology, 5, 562. doi:10.3389/fpsyg.2014.00562 Pell, M. D., Paulmann, S., Dara, C., Alasseri, A., & Kotz, S. A. (2009). Factors in the recognition of vocally expressed emotions: A comparison of four languages. Journal of Phonetics, 37, 417–435. Petkov, C. I., & Jarvis, E. D. (2012). Birds, primates, and spoken language origins: Behavioral phenotypes and neurobiological substrates. Frontiers in Evolutionary Neuroscience, 4, 12. doi:10.3389/fnevo.2012.00012 R Development Core Team. (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Retrieved from www.R-project.org Ross, M., Owren, M. J., & Zimmermann, E. (2009). Reconstructing the evolution of laughter in great apes and humans. Current Biology, 19, 1106–1111. doi:10.1016/j.cub.2009.05.028 Sauter, D. A., & Scott, S. K. (2007). More than one kind of happiness: Can we recognize vocal expressions of different positive states? Motivation and Emotion, 31, 192–199. Sauter, D. A., Eisner, F., Calder, A. J., & Scott, S. K. (2010). Perceptual cues in nonverbal vocal expressions of emotion. Quarterly Journal of Experimental Psychology, 63, 2251–2272. Sauter, D. A., Eisner, F., Ekman, P., & Scott, S. K. (2010). Cross-cultural recognition of basic emotions through nonverbal emotional vocalizations. Proceedings of the National Academy of Sciences, 107, 2408–2412. Scheiner, E., Hammerschmidt, K., Jürgens, U., & Zwirner, P. (2006). Vocal expression of emotions in normally hearing and hearing-impaired infants. Journal of Voice, 20, 585–604. Scherer, K. R. (2013). Vocal markers of emotion: Comparing induction and acting elicitation. Computer Speech and Language, 27, 40–58. Scherer, K. R., & Bänziger, T. (2010). On the use of actor portrayals in research on emotional expression. In K. R. Scherer, T. Bänziger, & E. Roesch (Eds.), A blueprint for affective computing: A sourcebook and manual (pp. 166–176). Oxford: Oxford University Press. Scherer, K. R., Banse, R., & Wallbott, H. G. (2001). Emotion inferences from vocal expression correlate across languages and cultures. Journal of Cross-Cultural Psychology, 32, 76–92. Schröder, M. (2003). Experimental study of affect bursts. Speech Communication, 40, 99–116. Schusterman, R. J. (2008). Vocal learning in mammals with special emphasis on pinnipeds. In D. Oller & U. Gribel (Eds.), The evolution of communicative flexibility: Complexity, creativity, and adaptability in human and animal communication (pp. 41–70). Cambridge: MIT Press. Scott, S., Sauter, D., & McGettigan, C. (2009). Brain mechanisms for processing perceived emotional vocalizations in humans. In S. M. Brudzynski (Ed.), Handbook of mammalian vocalization: An integrative neuroscience approach (pp. 187–197). San Diego: Academic Press. Searcy, W. A., & Nowicki, S. (2005). The evolution of animal communication: Reliability and deception in signaling systems. Princeton: Princeton University Press. Simon-Thomas, E. R., Keltner, D. J., Sauter, D., Sinicropi-Yao, L., & Abramson, A. (2009). The voice conveys specific emotions: Evidence from vocal burst displays. Emotion, 9, 838–846. doi:10.1037/a0017810 Simonyan, K., & Horwitz, B. (2011). Laryngeal motor cortex and control of speech in humans. The Neuroscientist, 17, 197–208. Stan Development Team. (2014). Stan: A C++ library for probability and sampling, Version 2.5.0. Retrieved from mc-stan.org. Wadewitz, P., Hammerschmidt, K., Battaglia, D., Witt, A., Wolf, F., & Fischer, J. (2015). Characterizing vocal repertoires—Hard vs. soft classification approaches. PLoS ONE, 10, e125785. doi:10.1371/journal.pone.0125785 Wagner, H. L. (1993). On measuring performance in category judgment studies of nonverbal behavior. Journal of Nonverbal Behavior, 17, 3–28.