Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Nâng cao tuổi thọ của mạng cảm biến hình ảnh với phương pháp phát hiện đa khuôn mặt dựa trên tiền xử lý
Tóm tắt
Gần đây, những tiến bộ trong phần cứng như các nút camera CMOS đã dẫn đến sự phát triển của Mạng Cảm Biến Hình Ảnh (VSNs) có khả năng xử lý dữ liệu cảm nhận được và truyền tải thông tin hữu ích đến trạm gốc để hoàn thành các nhiệm vụ tiếp theo. Ngày nay, việc phát hiện đối tượng và gửi thông tin hữu ích đến trạm gốc để nhận diện đối tượng đã nổi lên như một vấn đề thách thức quan trọng trong VSNs. Các nghiên cứu của chúng tôi cho thấy rằng thông tin khuôn mặt là đủ để hoàn thành việc nhận diện đối tượng. Theo tài liệu, đã có nhiều phương pháp được đề xuất cho việc phát hiện đối tượng và gửi thông tin hữu ích đến trạm gốc để hoàn thành các nhiệm vụ tiếp theo như nhận diện đối tượng. Tuy nhiên, trong hầu hết các phương pháp này, việc thiếu các phương pháp tiền xử lý tại các nút camera gây ra tình trạng mạng phải đối mặt với một khối lượng dữ liệu lớn. Ví dụ, khi có nhiều hơn một đối tượng trong trường nhìn của mỗi nút camera, các công việc thông thường gửi các khoảng trống giữa các đối tượng đến trạm gốc. Thêm vào đó, hầu hết trong số họ gửi toàn bộ thông tin về từng đối tượng đến trạm gốc, trong khi thực tế, chỉ cần gửi thông tin về khuôn mặt của mỗi đối tượng là đủ để hoàn thành việc nhận diện đối tượng. Do đó, trong bài báo này, chúng tôi đề xuất một phương pháp tiền xử lý tại các nút camera có tên là Phát hiện Đa Khuôn Mặt Dựa Trên Tiền Xử Lý (PMFD). Phương pháp của chúng tôi hoạt động dựa trên việc trích xuất hộp giới hạn của từng khuôn mặt đối tượng, sử dụng thuật toán phát hiện khuôn mặt dựa trên Boosting, và chỉ gửi thông tin về khuôn mặt đến trạm gốc. Kết quả mô phỏng cho thấy phương pháp PMFD có độ phức tạp thời gian tiền xử lý chấp nhận được và tiêm vào mạng một khối lượng lưu lượng thấp. Do đó, phương pháp PMFD kéo dài tuổi thọ của mạng so với các thuật toán hiện đại.
Từ khóa
Tài liệu tham khảo
Yick, J., Biswanath, M., & Dipak, G. (2008). Wireless sensor network survey. Computer Networks, 52(12), 2292–2330.
Satyajayant, M., Reisslein, M., & Xue, G. (2008). A survey of multimedia streaming in wireless sensor networks. IEEE Communications Surveys & Tutorials, 10(4), 18–39.
Akyildiz, I. F., Tommaso, M., & Kaushik, R. C. (2007). A survey on wireless multimedia sensor networks. Computer Networks, 51(4), 921–960.
Gürses, E., & Özgür, B. A. (2005). Multimedia communication in wireless sensor networks. Annales des Télécommunications, 60(7–8), 872–900.
Stanislava, S., & Heinzelman, W. (2009). A survey of visual sensor networks. Advances in Multimedia, 2009, 1–21.
Feller, S. D., Zheng, Y., Cull, E., & Brady, D. J. (2002). Tracking and imaging humans on heterogeneous infrared sensor arrays for law enforcement applications. In AeroSens, 2002, international society for optics and photonics, pp. 212–221.
Werner-Allen, G., Lorincz, K., Ruiz, M., Marcillo, O., Johnson, J., Lees, J., et al. (2006). Deploying a wireless sensor network on an active volcano. IEEE Internet Computing, 10(2), 18–25.
Gao, T., Greenspan, D., Welsh, M., Juang, R. R., & Alm, A. (2006). Vital signs monitoring and patient tracking over a wireless network. In 27th annual international conference of the engineering in medicine and biology society, pp. 102–105.
Lorincz, K., Malan, D. J., Fulford-Jones, T. R., Nawoj, A., Clavel, A., Shnayder, V., et al. (2004). Sensor networks for emergency response: Challenges and opportunities. IEEE Pervasive Computing, 3(4), 16–23.
Akyildiz, I. F., Melodia, T., & Chowdhury, K. R. (2008). Wireless multimedia sensor networks: Applications and testbeds. Proceedings of the IEEE, 96(10), 1588–1605.
Charfi, Y., Wakamiya, N., & Murata, M. (2009). Challenging issues in visual sensor networks. IEEE Wireless Communications, 16(2), 44–49.
Piccardi, M. (2004). Background subtraction techniques: A review. In IEEE international conference on systems, man and cybernetics, pp. 3099–3104.
Kenchannavar, H. H., Kudtarkar, S. S., & Kulkarni, U. P. (2010). Energy efficient data processing in visual sensor network. International Journal of CS & IT, 2(5), 151–160.
Vaidehi, V., Ramanathan, S., Sameer, N., & Sagar, S. (2011). Multiclass object detection system in imaging sensor network using haar-like features and joint-boosting algorithm. In International conference on recent trends in information technology (ICRTIT), pp. 1011–1015.
Canclini, A., Baroffio, L., Cesana, M., Redondi, A., & Tagliasacchi, M. (2015). Object recognition in visual sensor networks based on compression and transmission of binary local features. In IEEE international conference on communication (ICC2015), pp. 1–3.
Pham, D. M., & Aziz, S. M. (2013). Object extraction scheme and protocol for energy efficient image communication over wireless sensor networks. Computer Networks, 57(15), 2949–2960.
Eriksson, E., Dán, G., & Fodor, V. (2014). Prediction-based load control and balancing for feature extraction in visual sensor networks. In IEEE international conference on acoustics, speech and signal processing (ICASSP), pp. 674–678.
Redondi, A., Baroffio, L., Canclini, A., Cesana, M., & Tagliasacchi, M. (2013). A visual sensor network for object recognition: Testbed realization. In Proceedings of international conference on digital signal processing (DSP), pp. 1–6.
Freund, Y., & Schapire, R. E. (1997). A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, 55(1), 119–139.
Theocharides, T., Vijaykrishnan, N., & Irwin, M. J. (2006). A parallel architecture for hardware face detection. In IEEE computer society annual symposium on emerging VLSI technologies and architectures, pp. 452–453.
Lienhart, R., & Maydt, J. (2002). An extended set of haar-like features for rapid object detection. In International conference on image processing, pp. 1–900.
Mita, T., Kaneko, T., & Hori, O. (2005). Joint haar-like features for face detection. In Tenth IEEE international conference on computer vision, pp. 1619–1626.
Wang, Y., Wang, D., & Fang, W. (2014). Automatic node selection and target tracking in wireless camera sensor networks. Computers & Electrical Engineering, 40(2), 484–493.
Wang, Y., Tian, J., & Tan, Y. (2007). Effective Gaussian mixture learning and shadow suppression for video foreground segmentation. In International symposium on multispectral image processing and pattern recognition, international society for optics and photonics, pp. 67861D.
Papa, G., Braca, P., Horn, S., Marano, S., Matta, V., & Willett, P. (2015, April). Adaptive Bayesian tracking with unknown time-varying sensor network performance. In IEEE international conference on acoustics, speech and signal processing (ICASSP), pp. 2534–2538.
Vasuhi, S., & Vaidehi, V. (2016). Target tracking using interactive multiple model for wireless sensor network. Information Fusion, 27, 41–53.
Khursheed, K., Imran, M., O’Nils, M., & Lawal, N. (2010). Exploration of local and central processing for a wireless camera based sensor node. In IEEE international conference on signals and electronic systems, pp. 147–150.
Leutenegger, S., Chli, M., & Siegwart, R.Y. (2011). BRISK: Binary robust invariant scalable keypoints. In IEEE international conference on computer vision (ICCV), pp. 2548–2555.
Redondi, A., Cesana, M., Tagliasacchi, M., Filippini, I., Dán, G., & Fodor, V. (2015). Cooperative image analysis in visual sensor networks. Ad Hoc Networks, 28, 38–51.
Zhang, S., Wang, C., Chan, S. C., Wei, X., & Ho, C. H. (2015). New object detection, tracking, and recognition approaches for video surveillance over camera network. Sensors Journal, IEEE, 15(5), 2679–2691.
Xu, D., Yi, R., Caron, F., & Doucet, A. (2016). Bayesian nonparametric image segmentation using a generalized Swendsen-Wang algorithm. arXiv:1602.03048, pp. 1–12.
Wang, L., Ip, W. H., & Ting, J. S. (2016). Design of a radio frequency identification (RFID)-based monitoring and vehicle management system. In Wireless communications, networking and applications, pp. 537–551.
Lee, J. S., Oh, J., Jun, J., & Jang, J. (2015). Wireless hydrogen smart sensor based on Pt/graphene-immobilized radio-frequency identification tag. ACS Nano, 9(8), 7783–7790.
Viola, P., & Jones, M. (2001). Rapid object detection using a boosted cascade of simple features. In IEEE computer society conference on computer vision and pattern recognition, pp. I-511–I-518.
He, K., Sun, J., & Tang, X. (2013). Guided image filtering. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(6), 1397–1409.
Papageorgiou, C.P., Oren, M., & Poggio, T. (1998). A general framework for object detection. In Sixth IEEE international conference on computer vision, pp. 555–562.
Schapire, R. E., Freund, Y., Bartlett, P., & Lee, W. S. (1998). Boosting the margin: A new explanation for the effectiveness of voting methods. Annals of Statistics, 26, 1651–1686.
Tieu, K., & Viola, P. (2004). Boosting image retrieval. International Journal of Computer Vision, 56(1–2), 17–36.
Wu, J., Brubaker, S. C., Mullin, M. D., & Rehg, J. M. (2008). Fast asymmetric learning for cascade face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 30(3), 369–382.
Rowe, A., Goode, A., & Nourbakhsh, I. (2012). Cmucam3 datasheet. http://www.cmucam.org/documents/1.
Heinzelman, W. R., Chandrakasan, A., & Balakrishnan, H. (2000). Energy-efficient communication protocol for wireless microsensor networks. In 33rd IEEE international conference on system sciences, pp. 1–10.
Thorstensson, A., & Roberthson, H. (1987). Adaptations to changing speed in human locomotion: Speed of transition between walking and running. Acta Physiologica Scandinavica, 131(2), 211–214.