Đào tạo thích ứng các bộ video cho nhận diện hình ảnh trên điện thoại di động

Personal Technologies - Tập 13 - Trang 165-178 - 2008
Erich Bruns1, Oliver Bimber1
1Bauhaus-University Weimar, Weimar, Germany

Tóm tắt

Chúng tôi trình bày một cải tiến hướng tới đào tạo video thích ứng cho PhoneGuide, một hệ thống hướng dẫn bảo tàng số cho các điện thoại di động trang bị camera thông thường. Hệ thống cho phép du khách bảo tàng nhận diện các hiện vật bằng cách chụp ảnh chúng. Trong bài viết này, một giải pháp kết hợp giữa nhận diện đối tượng và theo dõi phổ biến được mở rộng thành một hệ thống máy khách - máy chủ nhằm cải thiện việc thu thập dữ liệu và hỗ trợ nhận diện đối tượng không phụ thuộc vào kích thước. Một kỹ thuật đào tạo tĩnh cũng như động được trình bày, trong đó tiền xử lý dữ liệu đối tượng thu thập được khác nhau và áp dụng hai loại mạng nơ-ron (NN) cho phân loại. Hơn nữa, hệ thống cho phép thích ứng theo thời gian để đảm bảo việc thu thập dữ liệu liên tục nhằm cải thiện tỷ lệ nhận diện theo thời gian. Một thí nghiệm thực địa chính thức cho thấy tỷ lệ nhận diện hiện tại và chỉ ra tính khả thi của cả hai phương pháp dưới các điều kiện thực tế trong một bảo tàng.

Từ khóa

#đào tạo thích ứng #nhận diện đối tượng #theo dõi phổ biến #hệ thống máy khách - máy chủ #mạng nơ-ron #bảo tàng số

Tài liệu tham khảo

Föckler P, Zeidler T, Brombach B, Bruns E, Bimber O (2005) Phoneguide: museum guidance supported by on-device object recognition on mobile phones. International conference on mobile and ubiquitous computing Bruns E, Brombach B, Zeidler T, Bimber O (2007) Enabling mobile phones to support large-scale museum guidance. IEEE multimedia 14(2):16–25 Luley PM, Paletta L, Almer A (2005) Visual object detection from mobile phone imagery for context awareness. Proceedings of the 7th international conference on Human computer interaction with mobile devices & services, pp 385–386 Hare JS, Lewis PH (2004) Content-based image retrieval using a mobile device as a novel interface. Proceedings of the first international workshop on mobile vision, pp 64–75 Marchand-Maillet S (2000) Content-based video retrieval: an overview. http://viper.unige.ch/marchand/CBVR/ Zobel J, Hoad T (2006) Detection of video sequences using compact signatures. ACM Trans Inf Syst 24(1):1–50 Adjeroh DA, Lee MC, King I (1999) A distance measure for video sequences. Comput Vis Image Underst 75(1–2):25–45 Pickering MJ, Rüger S (2003) Evaluation of key frame-based retrieval techniques for video. CComput Vis Image Underst 92(2–3):217–235 Feng H, Fang W, Liu S, Fang Y (2005) A new general framework for shot boundary detection and key-frame extraction. Proceedings of the 7th ACM SIGMM international workshop on Multimedia information retrieval, pp 121–126 Miene A, Hermes Th, Ioannidis G, Fathi R, Herzog O (2002) Automatic shot boundary detection and classification of indoor and outdoor scenes. Text REtrieval Conference (TREC) O’Toole C, Smeaton A, Murphy N, Marlow S (1999) Evaluation of automatic shot boundary detection on a large video test suite. The challenge of image retrieval (CIR99)—2nd UK conference on image retrieval Browne P, Smeaton A, Murphy N, N O’Connor, Marlow S, Berrut C (1999) Evaluating and combining digital video shot boundary detection algorithms. In: Proceedings of the fourth Irish machine vision and information processing conference Nguyen DT, Gillespie W (2003) A video retrieval system based on compressed data from mpeg files. In Conference on convergent technologies for Asia–Pacific region, vol 2, pp 555– 560 Zhou XS, Huang TS (2003) Relevance feedback in image retrieval: a comprehensive review. Multimed Syst 8:536–544 MacArthur S, Brodley C, Shyu C (2000) Relevance feedback decision trees in content-based image retrieval. IEEE workshop on content-based access of image and video libraries, pp 68–72 Draper BA, Bins J, Baek K (1999) ADORE: adaptive object recognition, pp 522–537 Abowd GD, Atkeson CG, Hong J, Long S, Kooper R, Pinkerton M (1997) Cyberguide: a mobile context-aware tour guide. Wirel Netw 3(5):421–433 Cheverst K, Davies N, Mitchell K, Friday A, Christos Efstratiou (2000) Developing a context-aware electronic tourist guide: some issues and experiences. CHI, pp 17–24 Pospischil G, Umlauft M, Michlmayr E (2002) Designing lol@, a mobile tourist guide for umts. Mobile HCI, pp 140–154 Baus J, Cheverst K, Kray C (2005) A survey of map-based mobile guides map-based mobile services—theories, methods and implementations, chap. 13. Meng/Zipf, Springer Lowe DG (1999) Object recognition from local scale-invariant features, pp 1150 Bay H, Fasel B, Van Gool L (2006) Interactive museum guide: fast and robust recognition of museum objects. Proceedings of the first international workshop on mobile vision Bay H, Fasel B, Van Gool L (2005) Interactive museum guide. The seventh international conference on ubiquitous computing UBICOMP Takacs G, Chandrasekhar V, Gelfand N, Xiong Y, Chen W-C, Bismpigiannis T, Grzeszczuk R, Pulli K, Girod B (2008) Outdoors augmented reality on mobile phone using loxel-based visual feature organization. To appear in: IEEE Transactions on pattern analysis and machine intelligence Davies N, Cheverst K, Dix A, Hesse A (2005) Understanding the role of image recognition in mobile tour guides. Proceedings of the 7th international conference on Human computer interaction with mobile devices & services, pp 191–198