Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Đào tạo thích ứng các bộ video cho nhận diện hình ảnh trên điện thoại di động
Tóm tắt
Chúng tôi trình bày một cải tiến hướng tới đào tạo video thích ứng cho PhoneGuide, một hệ thống hướng dẫn bảo tàng số cho các điện thoại di động trang bị camera thông thường. Hệ thống cho phép du khách bảo tàng nhận diện các hiện vật bằng cách chụp ảnh chúng. Trong bài viết này, một giải pháp kết hợp giữa nhận diện đối tượng và theo dõi phổ biến được mở rộng thành một hệ thống máy khách - máy chủ nhằm cải thiện việc thu thập dữ liệu và hỗ trợ nhận diện đối tượng không phụ thuộc vào kích thước. Một kỹ thuật đào tạo tĩnh cũng như động được trình bày, trong đó tiền xử lý dữ liệu đối tượng thu thập được khác nhau và áp dụng hai loại mạng nơ-ron (NN) cho phân loại. Hơn nữa, hệ thống cho phép thích ứng theo thời gian để đảm bảo việc thu thập dữ liệu liên tục nhằm cải thiện tỷ lệ nhận diện theo thời gian. Một thí nghiệm thực địa chính thức cho thấy tỷ lệ nhận diện hiện tại và chỉ ra tính khả thi của cả hai phương pháp dưới các điều kiện thực tế trong một bảo tàng.
Từ khóa
#đào tạo thích ứng #nhận diện đối tượng #theo dõi phổ biến #hệ thống máy khách - máy chủ #mạng nơ-ron #bảo tàng sốTài liệu tham khảo
Föckler P, Zeidler T, Brombach B, Bruns E, Bimber O (2005) Phoneguide: museum guidance supported by on-device object recognition on mobile phones. International conference on mobile and ubiquitous computing
Bruns E, Brombach B, Zeidler T, Bimber O (2007) Enabling mobile phones to support large-scale museum guidance. IEEE multimedia 14(2):16–25
Luley PM, Paletta L, Almer A (2005) Visual object detection from mobile phone imagery for context awareness. Proceedings of the 7th international conference on Human computer interaction with mobile devices & services, pp 385–386
Hare JS, Lewis PH (2004) Content-based image retrieval using a mobile device as a novel interface. Proceedings of the first international workshop on mobile vision, pp 64–75
Marchand-Maillet S (2000) Content-based video retrieval: an overview. http://viper.unige.ch/marchand/CBVR/
Zobel J, Hoad T (2006) Detection of video sequences using compact signatures. ACM Trans Inf Syst 24(1):1–50
Adjeroh DA, Lee MC, King I (1999) A distance measure for video sequences. Comput Vis Image Underst 75(1–2):25–45
Pickering MJ, Rüger S (2003) Evaluation of key frame-based retrieval techniques for video. CComput Vis Image Underst 92(2–3):217–235
Feng H, Fang W, Liu S, Fang Y (2005) A new general framework for shot boundary detection and key-frame extraction. Proceedings of the 7th ACM SIGMM international workshop on Multimedia information retrieval, pp 121–126
Miene A, Hermes Th, Ioannidis G, Fathi R, Herzog O (2002) Automatic shot boundary detection and classification of indoor and outdoor scenes. Text REtrieval Conference (TREC)
O’Toole C, Smeaton A, Murphy N, Marlow S (1999) Evaluation of automatic shot boundary detection on a large video test suite. The challenge of image retrieval (CIR99)—2nd UK conference on image retrieval
Browne P, Smeaton A, Murphy N, N O’Connor, Marlow S, Berrut C (1999) Evaluating and combining digital video shot boundary detection algorithms. In: Proceedings of the fourth Irish machine vision and information processing conference
Nguyen DT, Gillespie W (2003) A video retrieval system based on compressed data from mpeg files. In Conference on convergent technologies for Asia–Pacific region, vol 2, pp 555– 560
Zhou XS, Huang TS (2003) Relevance feedback in image retrieval: a comprehensive review. Multimed Syst 8:536–544
MacArthur S, Brodley C, Shyu C (2000) Relevance feedback decision trees in content-based image retrieval. IEEE workshop on content-based access of image and video libraries, pp 68–72
Draper BA, Bins J, Baek K (1999) ADORE: adaptive object recognition, pp 522–537
Abowd GD, Atkeson CG, Hong J, Long S, Kooper R, Pinkerton M (1997) Cyberguide: a mobile context-aware tour guide. Wirel Netw 3(5):421–433
Cheverst K, Davies N, Mitchell K, Friday A, Christos Efstratiou (2000) Developing a context-aware electronic tourist guide: some issues and experiences. CHI, pp 17–24
Pospischil G, Umlauft M, Michlmayr E (2002) Designing lol@, a mobile tourist guide for umts. Mobile HCI, pp 140–154
Baus J, Cheverst K, Kray C (2005) A survey of map-based mobile guides map-based mobile services—theories, methods and implementations, chap. 13. Meng/Zipf, Springer
Lowe DG (1999) Object recognition from local scale-invariant features, pp 1150
Bay H, Fasel B, Van Gool L (2006) Interactive museum guide: fast and robust recognition of museum objects. Proceedings of the first international workshop on mobile vision
Bay H, Fasel B, Van Gool L (2005) Interactive museum guide. The seventh international conference on ubiquitous computing UBICOMP
Takacs G, Chandrasekhar V, Gelfand N, Xiong Y, Chen W-C, Bismpigiannis T, Grzeszczuk R, Pulli K, Girod B (2008) Outdoors augmented reality on mobile phone using loxel-based visual feature organization. To appear in: IEEE Transactions on pattern analysis and machine intelligence
Davies N, Cheverst K, Dix A, Hesse A (2005) Understanding the role of image recognition in mobile tour guides. Proceedings of the 7th international conference on Human computer interaction with mobile devices & services, pp 191–198