Đội Bóng Robot AGILO - Học Hỏi Dựa Trên Kinh Nghiệm và Lập Luận Xác Suất trong Kiểm Soát Robot Tự Động

Autonomous Robots - Tập 17 - Trang 55-77 - 2004
Michael Beetz, Thorsten Schmitt, Robert Hanek, Sebastian Buck, Freek Stulp, Derik Schröter, Bernd Radig

Tóm tắt

Bài báo này mô tả mô hình tính toán cơ sở cho đội bóng robot tự động AGILO, việc triển khai của nó và những trải nghiệm của chúng tôi với nó. Theo mô hình của chúng tôi, hệ thống điều khiển của một robot bóng đá tự động bao gồm một bộ ước lượng trạng thái trò chơi xác suất và một mô-đun lựa chọn hành động theo tình huống. Bộ ước lượng trạng thái trò chơi tính toán trạng thái niềm tin của robot liên quan đến tình huống trò chơi hiện tại bằng cách sử dụng một hệ thống camera đơn giản. Trạng thái trò chơi được ước lượng bao gồm vị trí và trạng thái động của chính robot và các đồng đội cũng như vị trí của bóng và các cầu thủ đối phương. Bằng cách áp dụng các kỹ thuật lập luận xác suất tinh vi và khai thác sự hợp tác giữa các đồng đội, robot có thể ước lượng các trạng thái trò chơi phức tạp một cách đáng tin cậy và chính xác mặc dù thông tin cảm biến không đầy đủ và không chính xác. Mô-đun lựa chọn hành động chọn các hành động dựa trên các tiêu chí lựa chọn đã được chỉ định cũng như kinh nghiệm đã học. Các kỹ thuật học tự động đã cho phép phát triển các thói quen nhanh chóng và khéo léo trong việc tiếp cận bóng, phân công vai trò và thực hiện các pha chơi phối hợp. Bài báo thảo luận về các kỹ thuật tính toán dựa trên dữ liệu thực nghiệm từ giải vô địch bóng đá robot năm 2001.

Từ khóa

#robot tự động #bóng đá robot #học hỏi dựa trên kinh nghiệm #lập luận xác suất #kiểm soát robot

Tài liệu tham khảo

Adorni, G., Cagnoni, S., Enderle, S., Kraetzschmar, G.K., Mordonini, M., Plagge, M., Ritter, M., Sablatnög, S., and Zell, A. 2001. Vision-based localization for mobile robots. Robotics and Autonomous Systems, 36(2/3):103–118. Aström, K.J. 1965. Optimal control of markov decision processes with incomplete state estimation. Journal of Mathematical Analysis and Applications, 10:174–205. Bar-Shalom, Y. and Fortmann, T. 1988. Tracking and Data Association. Academic Press. Beetz, M. 2001. Structured reactive controllers. Journal of Autonomous Agents and Multi-Agent Systems, 4:25–55. Beetz, M. 2002. Plan Representation for Robotic Agents. AAAI Press. Beetz, M., Arbuckle, T., Bennewitz, M., Burgard, W., Cremers, A., Fox, D., Grosskreutz, H., Hähnel, D., and Schulz, D. 2001. Integrated plan-based control of autonomous service robots in human environments. IEEE Intelligent Systems, 16(5):56–65. Beetz, M., Buck, S., Hanek, R., Schmitt, T., and Radig, B., 2002. The AGILO autonomous robot soccer team: Computational principles, experiences, and perspectives. In Procs. of the First International Conference on Autonomous Agents and Multi-agent Systems, Bologna, Italy, pp. 805-812. Beetz, M. and Hofhauser, A. 2002. Plan-based control for autonomous robot soccer. In Advances in Plan-based Control of Autonomous Robots. Selected Contributions of the Dagstuhl Seminar Plan-Based Control of Robotic Agents, Lecture Notes in Artificial Intelligence (LNAI). Springer-Verlag. Beetz, M., Stulp, M., Kirsch, A., Müller, A., and Buck, S. 2003. Autonomous robot controllers capable of acquiring repertoires of complex skills. In RoboCup International Symposium. Padova, July. Blake, A. and Isard, M. 1998. Active Contours. Springer-Verlag, Berlin, Heidelberg, New York. Buck, S., Weber, U., Beetz, M., and Schmitt, T. 2001. Multi robot path planning for dynamic evironments: A case study. In Proc. of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Cox, I.J. and Hingorani, S.L. 1996. An efficient implementation of Reid's multiple hypothesis tracking algorithm and its evaluation for the purpose of visual tracking. IEEE Trans. on Pattern Analysis and Machine Intelligence, 18(2):138–150. Cox, I.J. and Leonard, J. 1994. Modeling a dynamic environment using a bayesian multiple hypothesis approach. Artificial Intelligence, 66:311–344. Dean, T. and Wellmann, M. 1991. Planning and Control. Morgan Kaufmann Publishers, San Mateo, CA. Dellaert, F., Fox, D., Burgard, W., and Thrun, S. 1999. Monte Carlo localization for mobile robots. In IEEE International Conference on Robotics and Automation (ICRA). Detroit, Michigan, USA, pp. 1322-1328. Dietl, M., Gutmann, J.-S., and Nebel, B. 2001. Cooperative sensing in dynamic environments. In IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Maui, Hawaii, pp. 1706-1713. Enderle, S., Ritter, M., Fox, D., Sablatnög, S., Kraetzschmar, G., and Palm, G. 2000. Soccer-robot localization using sporadic visual features. In IAS-6 International Conference on Intelligent Autonomous Systems. Faugeras, O.D. 1993. Three-Dimensional Computer Vision: A Geometric Viewpoint. MIT Press, p. 302. Fox, D., Burgard,W., Kruppa, H., and Thrun, S. 2000. Aprobabilistic approach to collaborative multi-robot localization. Autonomous Robots, 8(3):325–344. Fox, D., Burgard, W., and Thrun, S. 1999. Markov localization for mobile robots in dynamic environments. Journal of Artificial Intelligence Research, 11:391–427. Gutmann, J.-S., Weigel, T., and Nebel, B. 2001. A fast, accurate, and robust method for self-localization in polygonal environments using laser-range-finders. Advanced Robotics Journal, 14(8):651–668. Hanek, R. and Beetz, M. 2004. The contraction curve density algorithm: Fitting parametric curve models to images using local self-adapting separation criteria. International Journal of Computer Vision (to be published). Hanek, R. and Schmitt, T. 2000. Vision-based localization and data fusion in a system of cooperating mobile robots. In IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Takamatsu, Japan, pp. 1199-1204. Hanek, R., Schmitt, T., Buck, S., and Beetz, M. 2002. Fast imagebased object localization in natural scenes. In IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Lausanne, Switzerland. Hanek, R., Schmitt, T., Buck, S., and Beetz, M. 2002. Towards robocup without color labeling. In 6th International RoboCup Symposium (Robot World Cup Soccer Games and Conferences), vol. 6 of Lecture Notes in Computer Science. Springer-Verlag. Hue, C., Le Cadre, J.-P., and Perez, P. 2000. Tracking multiple objects with particle filtering. Technical Report 1361, IRISA. Iocchi, L. and Nardi, D. 1999. Self-localization in the RoboCup environment. In Third International RoboCup Symposium (Robot World Cup Soccer Games and Conferences), Lecture Notes in Computer Science. Springer-Verlag. Jensfelt, P. and Kristensen, S. 1999. Active global localisation for a mobile robot using multiple hypothesis tracking. In Workshop on Reasoning with Uncertainty in Robot Navigation (IJCAI'99), Stockholm, pp. 13-22. Jensfelt, P. and Kristensen, S. 2001. Active global localisation for a mobile robot using multiple hypothesis tracking. IEEE Transactions on Robotics and Automation, 17(5):748–760. Jonker, P., Caarls, J., and Bokhove,W. 2000. Fast and accurate robot vision for vision based motion. In 4th International RoboCup Symposium (Robot World Cup Soccer Games and Conferences), P. Stone, T. Balch, and G. Kraetzschmar (Eds.), Lecture Notes in Computer Science. Springer-Verlag, pp. 72-82. Kurazume, R. and Hirose, S. 1998. Study on cooperative positioning system: Optimum moving strategies for CPS-III. In IEEE International Conference on Robotics and Automation (ICRA), pp. 2896-2903. Latombe, J.-C. 1991. Robot Motion Planning. Kluwer Academic Publishers, Boston, MA. Maksarov, D. and Durrant-Whyte, H. 1995. Mobile vehicle navigation in unknown environments: a multiple hypothesis approach. IEE Proceedings: Control Theory & Applications, 142(4):385–400. Marques, C. and Lima, P. 2000. Vision-based self-localization for soccer robots. In IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Takamatsu, Japan, pp. 1193-1198. Nebel, B. and Weigel, T. 2000. The CS freiburg 2000 team. In 4th International RoboCup Symposium (Robot World Cup Soccer Games and Conferences), Lecture Notes in Computer Science. Springer-Verlag. Neumann, D. 2003. Bayes pose estimation by modeling colour distributions. Masterthesis, Munich University of Technology, Department of Computer Science. Passino, K. and Antsaklis, P. 1989. A system and control-theoretic perspective on artificial intelligence planning systems. Applied Artificial Intelligence, 3:1–32. Quinlan, R. 1986. Induction of decision trees. In Machine Learning, 1(1). Reid, D. 1979. An algorithm for tracking multiple targets. IEEE Transactions on Automatic Control, 24(6):843–854. Rekleitis, I.M., Dudek, G., and Milios, E.E. 2000. Multi-robot collaboration for robust exploration. In IEEE International Conference on Robotics and Automation (ICRA), pp. 3164-3169. Riedmiller, M. and Braun, H. 1993. A direct adaptive method for faster backpropagation learining: The rprop algorithm. In ICCN, San Francisco. Riedmiller, M., Merke, A., Meier, D., Hoffmann, A., Sinner, A., Thate, O., Kill, Ch., and Ehrmann, R. 2000. Karlsruhe brainstormers 2000-A reinforcement learning approach to robotic soccer. In 4th International RoboCup Symposium (Robot World Cup Soccer Games and Conferences), Lecture Notes in Computer Science. Springer-Verlag. Roumeliotis, S.I. and Bekey, G.A. 2000. Collective localization: A distributed Kalman filter approach to localization of groups of mobile robots. In IEEE International Conference on Robotics and Automation (ICRA), pp. 2958-2965. Schmitt, T., Beetz, M., Hanek, R., and Buck, S. 2002. Watch their moves: Applying probabilistic multiple object tracking to autonomous robot soccer. In AAAI National Conference on Artificial Intelligence, Edmonton, Canada, pp. 599-604. Schmitt, T., Hanek, R., Beetz, M., Buck, S., and Radig, B. 2002. Cooperative probabilistic state estimation for vision-based autonomous mobile robots. IEEE Trans. on Robotics and Automation, 18(5):670–684. Schulz, D., Burgard, W., Fox, D., and Cremers, A.B. 2001. Multiple object tracking with a mobile robot. In Computer Vision and Pattern Recognition (CVPR), Kauai, Hawaii, vol. 1, pp. 371-377. Talluri, R. and Aggarwal, J.K. 1996. Mobile robot self-location using model-image feature correspondence. IEEE Transactions on Robotics and Automation, 12(1):63–77. Thrun, S. 2000. Probabilistic algorithms in robotics. AI Magazine, 21(4):93–109.