Sử Dụng Hệ Thống Almeida-Braun Trong Đo Lường Khoảng Cách Giữa Các Giọng Địa Phương Hà Lan

Wilbert Heeringa1,2, Angelika Braun2,1
1Faculty of Arts, Humanities Computing, University of Groningen, the Netherlands
2Institute of Germanic Linguistics, Phonetics, Philips-University of Marburg, Germany

Tóm tắt

Việc đo lường khoảng cách giữa các giọng địa phương có thể dựa trên việc so sánh các từ, và việc so sánh này nên dựa trên việc so sánh các âm thanh. Trong nghiên cứu này, chúng tôi đã sử dụng một phiên bản điều chỉnh của hệ thống dựa trên phát âm, được phát triển bởi Almeida và Braun (1986) để tìm khoảng cách âm thanh, sử dụng hệ thống IPA. Để so sánh hai cách phát âm của một từ tương ứng với hai biến thể khác nhau, chúng tôi đã sử dụng thuật toán Levenshtein, thuật toán này tìm ra cách dễ nhất để biến đổi một từ thành từ kia thông qua việc chèn, xóa hoặc thay thế âm thanh. Làm trọng số cho các phép toán này, chúng tôi đã sử dụng khoảng cách mà hệ thống Almeida & Braun tìm thấy. Khoảng cách giữa các giọng địa phương bây giờ được tính bằng trung bình của một loạt khoảng cách từ. Chúng tôi đã áp dụng kỹ thuật này cho 360 giọng địa phương Hà Lan. Các bản phiên âm của 125 từ cho mỗi giọng địa phương được lấy từ bộ Reeks Nederlandse Dialectatlassen (Blancquaert và Peé, 1925–1982). Chúng tôi nhận được một sự phân chia với những điểm tương đồng rõ ràng so với các bản đồ giọng địa phương truyền thống khi phân loại các giọng địa phương. Việc sử dụng khoảng cách âm thanh logarithmic cải thiện kết quả so với các kết quả dựa trên khoảng cách âm thanh không đổi.

Từ khóa

#giọng địa phương #khoảng cách âm thanh #thuật toán Levenshtein #phát âm #hệ thống Almeida-Braun

Tài liệu tham khảo

Almeida A. (1984) ZurMethodik der Datenaufbereitung in der Linguistik: Das Beispiel phonetischer Transkription. In Berger, L. (ed.), Sprechausdruck, Scriptor, Frankfurt am Main, pp. 111–122.

Almeida A., Braun A. (1985) What is Transcription? In Kürschner, W. and Vogt, R. (eds.), Grammatik, Semantik, Textlinguistik. Akten des 19. Linguistischen Kolloquiums Vechta 1984, Vol. 1, Tübingen, pp. 37–48.

Almeida A., Braun A. (1986) “De Richtig” und “falsch” in phonetischer Transkription; Vorschläge zum Vergleich von Transkriptionen mit Beispielen aus deutschen Dialekten. Zeitschrift für Dialektologie und Linguistik, LIII(2), pp. 158–172.

Bürkle (1986) Zur Validität eines Maßes zur Reliabilitätsbestimmung Phonetisch-segmenteller Transkriptionen. Zeitschrift für Dialektologie und Linguistik, pp. 173–181.

Cucchiarini C. (1993) Phonetic Transcription: A Methodological and Emperical Study. Ph.D. thesis, Katholieke Universiteit Nijmegen, Nijmegen.

Daan J., Blok D. P. (1969) Van Randstad tot Landrand; toelichting bij de kaart: Dialecten en Naamkunde. Noord-Hollandsche Uitgevers Maatschappij, Amsterdam.

Goossens J. (1965) Die niederländische Strukturgeographie und die “Reeks Nederlandse Dialectatlassen”. Bijdragen en mededelingen der Dialectencommissie van de Koninklijke Nederlandse Akademie van Wetenschappen te Amsterdam. N.V. Noord-Hollandsche Uitgevers Maatschappij, Amsterdam.

Heeringa W. (2001) De selectie en digitalisatie van dialecten en woorden uit de Reeks Nederlandse Dialectatlassen. TABU: Bulletin voor taalwetenschap, 31(1/2), pp. 61–103.

Hoppenbrouwers C., Hoppenbrouwers G. (2001) De indeling van de Nederlandse streektalen. Dialecten van 156 steden en dorpen geklasseerd volgens de FFM. Koninklijke Van Gorcum B.V., Assen.

IPA (1999) Handbook of the International Phonetic Association: A Guide to the Use of the International Phonetic Alphabet. Cambrige University Press, Cambrige.

Jain A. K., Dubes R. C. (1988) Algorithms for Clustering Data. Englewood Cliffs, Prentice Hall, New Yersey.

Kessler B. (1995) Computational Dialectology in Irish Gaelic. In Proceedings of the 7th Conference of the European Chapter of the Association for Computational Linguistics, EACL, Dublin, pp. 60–67.

Ladefoged P., Maddieson I. (1996) The Sounds of the World's Languages. Blackwell, Oxford etc.

Nerbonne J., Heeringa W. (1997) Measuring Dialect Distance Phonetically. In Coleman, J. (ed.), Workshop on Computational Phonology, Special Interest Group of the Association for Computational Linguistics, Madrid, pp. 11–18.

Nerbonne J., Heeringa W. (1998) Computationele vergelijking en classificatie van dialecten. Taal en Tongval, Tijdschrift voor Dialectologie, 50(2), pp. 164–193.

Nerbonne J., Heeringa W. (2001) Computational Comparison and Classification of Dialects. Dialectologia et Geolinguistica. Journal of the International Society for Dialectology and Geolinguistics, 2001(9), pp. 69–83.

Nerbonne J., Heeringa W., Kleiweg P. (1999a) Comparison and Classifications of Dialects. In Proceedings of the 9th Meeting of the European Chapter of the Association for Computational Linguistics, Bergen, pp. 281–282.

Nerbonne J., Heeringa W., Kleiweg P. (1999b) Edit Distance and Dialect Proximity. In Sankoff, D. and Kruskal, J. (eds.), Time Warps, String Edits, and Macro Molecules; The Theory and Practice of Sequence Comparison, 2nd edition, CSLI, Stanford, pp. v–xv.

Nerbonne J., Heeringa W., van den Hout E., van der Kooi P., Otten S., van de Vis W. (1996) Phonetic Distance between Dutch Dialects. In Durieux, G., Daelemans, W., and Gillis, S. (eds.), CLIN VI, Papers from the Sixth CLIN Meeting, University of Antwerp, Center for Dutch Language and Speech (UIA), Antwerp, pp. 185–202.

Te Winkel J. (1901) Geschiedenis der Nederlandsche taal. Blom & Olivierse, Culemborg, naar de tweede Hoogduitsche uitgave met toestemming van den schrijver vertaald door Dr. F. C.Wieder. Met eene Kaart.

Vieregge W. H., Rietveld A. C. M., Jansen C. I. E. (1984) A Distinctive Feature Based System for the Evaluation of Segmental Transcription in Dutch. In van den Broecke, M. P. R. and Cohen, A. (eds.), Proceedings of the 10th International Congress of Phonetic Sciences, Foris Publications, Dordrecht and Cinnaminson, pp. 654–659.