Giải thích các trò chơi tiến hành suy diễn sử dụng hình thức trình bày như "tự động hóa tế bào"

Yuji Aruka1
1Chuo University, Tokyo, Japan

Tóm tắt

Tối ưu hóa theo cách thiển cận quanh các nguồn lực khan hiếm khiến việc sử dụng thông tin hiện có trở nên ít hiệu quả. Chiến lược tối ưu này từng là chiến lược chiến thắng trong giai đoạn mà dữ liệu lớn chưa phổ biến nhưng không còn hiệu quả nữa. Thực tế, việc chiến thắng trong trò chơi khác với việc tối đa hóa lợi nhuận. Trong bài viết này, chúng tôi tập trung vào ý nghĩa bản thể luận của trò chơi và sự phát triển theo thời gian của trò chơi dillemma. Cụ thể, chúng tôi quan tâm đến sự phát triển theo thời gian của trò chơi dillemma. Sau khi xem xét cấu trúc của trò chơi lặp lại, chúng tôi giới thiệu trình mô phỏng Wolfram của Seth Chandler (2011) cho hình thức ban đầu. Đây là một trình bày giống như “tự động hóa tế bào” (phương trình giống CA) của trò chơi lặp lại. Chúng tôi cũng mở rộng chương trình gốc của ông để thảo luận về TFT, ESS, trò chơi Avatamsaka, và cơ chế gán nhãn. Việc sử dụng hình thức trình bày giống như CA có thể đổi mới các hệ quả truyền thống của giải pháp trò chơi.

Từ khóa

#tối ưu hóa #trò chơi dillemma #tự động hóa tế bào #mô phỏng Wolfram #chiến lược TFT #cơ chế gán nhãn

Tài liệu tham khảo

Akiyama E, Aruka Y (2006) Evolution of reciprocal cooperation in the avatamsaka game. In: Namatame A, Kaizoji T, Aruka Y (eds) The complex networks of economic interactions: essays in agent-based economics and econophysics. Springer, Heidelberg, pp 307–329 Aruka Y (2001) Avatamsaka game structure and experiment on the web. In: Aruka Y (ed) Evolutionary controversies in economics. Springer, Tokyo, pp 115–132 Aruka Y (2001b) Avatamsaka game experiment as a nonlinear Polya urn process. In: Terano T, Namatame A et al (eds) New frontiers on artificial intelligence. Springer, Berlin, pp 153–161 Aruka Y, Akiyama E (2009) Non-self-averaging of a two-person game with only positive spillover: a new formulation of avatamsakas dilemma. J Econ Interact Coord 4(2):135–161 Axelrod R (1984) The evolution of cooperation. Basic Books, New York Axelrod R, Hamilton WD (1981) The evolution of cooperation. Science 211:1390–1396 Chandler S (2011) Iterated games. Wolfram Demonstrations Project. http://demonstrations.wolfram.com/IteratedGames/. Accessed 7 Mar 2011 Holland JH (1995) Hidden order: how adaptation builds complexity. Basic Books, New York Iwasa Y, Lee JH (2013) Graduated punishment is efficient in resource management if people are heterogeneous. J. Theor. Biol. 333(21):117–125 Kandori M (1992) Social norms and community enforcement. Rev. Econ. Stud. 59:63–80 Mainzer K (2007) Der kreative Zufall: Wie das Neue in die Welt kommt. C.H. Beck, München Nowak MA, Sigmund K (1993) A strategy of win-stay, lose-shift that outperforms tit for tat in prisoners dilemma. Nature 364(6432):56–58 Ohtuski H, Iwasa Y (2004) How should we define goodness?: Reputation dynamics in indirect reciprocity. J. Theor. Biol. 231:107–120 Ohtuski H, Iwasa Y (2006) The leading eight: social norms that can maintain cooperation by indirect reciprocity. J. Theor. Biol. 239:435–444 Pacheco JM, Santos FC, Chalub FC (2006) A simple, successful norm which promotes cooperation under indirect reciprocity. PLOS Comput. Biol. 2(12):e178 Poundstone W (1992) Prisoner’s dilemma: John von Neumann, game theory, and the puzzle of the bomb. Anchor, NY Rubinstein A (1979) Equilibrium in supergames with the overtaking criterion. J. Econ. Theory 21(1):1–9 Sugden R (1986) The economics of rights, cooperation and welfare. Basil Blackwell, Oxford von Stackelberg H (2011) Market structure and equilibrium/Heinrich von Stackelberg: translated by Damien Bazin, Lynn Urch and Rowland Hill, Berlin, Springer; Original 1934