Hiểu về Chính sách và Các Khía cạnh Kỹ thuật của Hệ thống Giám sát Video Thông minh Có Sử dụng AI để Giải quyết An toàn Công cộng

Computational Urban Science - Tập 3 - Trang 1-17 - 2023
Babak Rahimi Ardabili1, Armin Danesh Pazho2, Ghazal Alinezhad Noghre2, Christopher Neff2, Sai Datta Bhaskararayuni2, Arun Ravindran2, Shannon Reid3, Hamed Tabkhi2
1Public Policy Program, University of North Carolina at Charlotte, Charlotte, US
2Electrical Engineering and Computer Systems, University of North Carolina at Charlotte, Charlotte, US
3Criminal Justice, University of North Carolina at Charlotte, Charlotte, US

Tóm tắt

Những tiến bộ gần đây trong trí tuệ nhân tạo (AI) đã chứng kiến sự xuất hiện của hệ thống giám sát video thông minh (SVS) trong nhiều ứng dụng thực tế, đặc biệt là trong việc xây dựng các cộng đồng an toàn và bảo mật hơn trong môi trường đô thị của chúng ta. Các nhiệm vụ nhận thức, chẳng hạn như xác định đối tượng, nhận diện hành động và phát hiện hành vi bất thường, có thể tạo ra dữ liệu cung cấp những hiểu biết quý giá cho cộng đồng thông qua các công cụ thống kê và phân tích. Tuy nhiên, việc thiết kế các hệ thống giám sát có trí tuệ nhân tạo đòi hỏi phải xem xét kỹ lưỡng các thách thức và mối quan ngại về đạo đức. Việc sử dụng và lưu trữ thông tin cá nhân có thể xác định (PII) thường làm tăng rủi ro đối với quyền riêng tư cá nhân. Để giải quyết các vấn đề này, bài báo này xác định các mối quan ngại và yêu cầu về quyền riêng tư cần được giải quyết khi thiết kế hệ thống giám sát video thông minh được hỗ trợ bởi AI. Hơn nữa, chúng tôi đề xuất hệ thống giám sát video thông minh đầu cuối đầu tiên có khả năng bảo vệ quyền riêng tư nhờ AI, kết hợp một cách toàn diện các phân tích thị giác máy tính, phân tích dữ liệu thống kê, dịch vụ gốc đám mây và các ứng dụng cho người dùng cuối. Cuối cùng, chúng tôi đề xuất các chỉ số định lượng và định tính để đánh giá các hệ thống giám sát video thông minh. Hệ thống cho thấy khả năng xử lý 17.8 khung hình mỗi giây (FPS) trong các cảnh video cực đoan. Tuy nhiên, việc xem xét quyền riêng tư trong việc thiết kế một hệ thống như vậy dẫn đến việc ưu tiên thuật toán dựa trên tư thế thay vì thuật toán dựa trên pixel. Lựa chọn này đã dẫn đến việc giảm độ chính xác trong cả hai nhiệm vụ phát hiện hành động và bất thường. Kết quả giảm từ 97.48% xuống 73.72% trong phát hiện bất thường và từ 96% xuống 83.07% trong nhiệm vụ phát hiện hành động. Trung bình, độ trễ của hệ thống đầu cuối là 36.1 giây.

Từ khóa

#Giám sát video thông minh #trí tuệ nhân tạo #bảo mật cá nhân #phân tích dữ liệu #quyền riêng tư

Tài liệu tham khảo

Acquisti, A., Brandimarte, L., & Loewenstein, G. (2015). Privacy and human behavior in the age of information. Science, 347(6221), 509–514 Almeida, D., Shmarko, K., & Lomas, E. (2022). The ethics of facial recognition technologies, surveillance, and accountability in an age of artificial intelligence: a comparative analysis of US, EU, and UK regulatory frameworks. AI and Ethics, 2(3), 377–387 Ardabili, B. R., Pazho, A. D., Noghre, G. A., Neff, C., Ravindran, A., & Tabkhi, H. (2022). Understanding ethics, privacy, and regulations in smart video surveillance for public safety. arXiv preprint arXiv:2212.12936 Arroyo, R., Yebes, J. J., Bergasa, L. M., Daza, I. G., & Almazán, J. (2015). Expert video-surveillance system for real-time detection of suspicious behaviors in shopping malls. Expert Systems with Applications, 42(21), 7991–8005 Aslania, A., Jafarib, H., & Rahimib, B. (2016). Modeling of diffusion of geothermal energy technologies in Iran: System dynamics approach. Computational Research Progress in Applied Science and Engineering, 2(1), 1–4 Bruce, X., Liu, Y., Zhang, X., Zhong, S.-h., & Chan, K. C. (2022). Mmnet: A model-based multimodal network for human action recognition in rgb-d videos. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(3), 3522-3538. https://doi.org/10.1109/TPAMI.2022.3177813 Bukaty, P. (2019). The California Consumer Privacy Act (CCPA): An implementation guide. Ely, Cambridgeshire, IT Governance Publishing. http://www.jstor.org/stable/j.ctvjghvnn Accessed 29 Nov 2022 Cangialosi, F., Agarwal, N., Arun, V., Narayana, S., Sarwate, A., & Netravali, R. (2022). Privid: Practical, {Privacy-Preserving} Video Analytics Queries. 19th USENIX Symposium on Networked Systems Design and Implementation (NSDI 22). Renton, WA: USENIX Association; pp. 209–228. https://www.usenix.org/conference/nsdi22/presentation/cangialosi Centers for Medicare & Medicaid Services (1996). The Health Insurance Portability and Accountability Act of 1996 (HIPAA). http://www.cms.hhs.gov/hipaa/ Chen, Y., Zhang, Z., Yuan, C., Li, B., Deng, Y., & Hu, W. (2021). Channel-wise topology refinement graph convolution for skeleton-based action recognition. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 13359–13368) Dahunsi, F. M., Idogun, J., & Olawumi, A. (2021). Commercial cloud services for a robust mobile application backend data storage. Indonesian Journal of Computing, Engineering and Design (IJoCED), 3(1),31–45 Das, S., Sharma, S., Dai, R., Bremond, F., & Thonnat, M. (2020). Vpn: Learning video-pose embedding for activities of daily living. In European Conference on Computer Vision (pp. 72–90). Springer Dendorfer, P., Rezatofighi, H., Milan, A., Shi, J., Cremers, D., Reid, I., Roth, S., Schindler, K., & Leal-Taixé, L. (2020). Mot20: A benchmark for multi object tracking in crowded scenes. arXiv preprint arXiv:2003.09003 Dineva, K., & Atanasova, T. (2021). Design of scalable iot architecture based on aws for smart livestock. Animals, 11(9), 2697 Duan, H., Zhao, Y., Chen, K., Lin, D., & Dai, B. (2022). Revisiting skeleton-based action recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 2969–2978) Fathy, C., & Saleh, S. N. (2022). Integrating deep learning-based iot and fog computing with software-defined networking for detecting weapons in video surveillance systems. Sensors, 22(14), 5075 Fraser, D. M. (2018). Goals for Minneapolis–a city for the 21st century. In Strategic Planning in Local Government (pp. 83–103). Oxfordshire, England, Routledge Gaikwad, B. & Karmakar, A. (2021). Smart surveillance system for real-time multi-person multi-camera tracking at the edge. In Journal of Real-Time Image Processing (vol. 18) Gupta, A. & Prabhat, P. (2022). Towards a resource efficient and privacy-preserving framework for campus-wide video analytics-based applications. Complex & Intelligent Systems, 9(1), 161–176 Hartzog, W. (2018). Privacy’s Blueprint: The Battle to Control the Design of New Technologies. Cambridge: Harvard University Press Huang, S., Yang, J., Fong, S., & Zhao, Q. (2020). Artificial intelligence in cancer diagnosis and prognosis: Opportunities and challenges. Cancer letters, 471, 61–71 Jocher, G., Chaurasia, A., Stoken, A., Borovec, J., NanoCode012, Kwon, Y., Michael, K., TaoXie, Fang, J., imyhxy, Lorna, Yifu, Z., Wong, C., V, A., Montes, D., Wang, Z., Fati, C., Nadar, J., Laughing, UnglvKitDe, Sonck, V., tkianai, yxNONG, Skalski, P., Hogan, A., Nair, D., Strobel, M., & Jain, M. (2022). ultralytics/yolov5: v7.0 - YOLOv5 SOTA Realtime Instance Segmentation. Zenodo. (2022). https://doi.org/10.5281/zenodo.7347926 Leenes, R. (2019). Regulating new technologies in times of change. In Regulating new technologies in uncertain times (pp. 3–17). The Hague, Netherlands, Springer Liang, J., Jiang, L., Niebles, J. C., Hauptmann, A. G., & Fei-Fei, L. (2019). Peeking into the future: Predicting future person activities and locations in videos. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Lin, T.-Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D., Dollár, P., & Zitnick, C. L. (2014). Microsoft coco: Common objects in context. In European conference on computer vision (pp. 740–755). Springer Markovitz, A., Sharir, G., Friedman, I., Zelnik-Manor, L., & Avidan, S. (2020). Graph embedded pose clustering for anomaly detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10539–10547) Martin, K. D., Borah, A., & Palmatier, R. W. (2017). Data privacy: Effects on customer and firm performance. Journal of Marketing, 81(1), 36–58 Miller, S., & Blackler, J. (2017). Ethical issues in policing. Abingdon-on-Thames, Oxfordshire, England, Routledge: Milton Park Moore, R. S., Moore, M. L., Shanahan, K. J., Horky, A., & Mack, B. (2015). Creepy marketing: Three dimensions of perceived excessive online privacy violation. Marketing Management, 25(1), 42–53 Morais, R., Le, V., Tran, T., Saha, B., Mansour, M., & Venkatesh, S. (2019). Learning regularity in skeleton trajectories for anomaly detection in videos. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (pp. 11996–12004) Narkhede, S. (2018). Understanding auc-roc curve. Towards Data. Science, 26(1), 220–227 Neff, C., Mendieta, M., Mohan, S., Baharani, M., Rogers, S., & Tabkhi, H. (2020). Revamp2t: Real-time edge video analytics for multicamera privacy-aware pedestrian tracking. IEEE Internet of Things Journal, 7(4), 2591–2602 Nissenbaum, H. (2004). Privacy as contextual integrity. Wash. L. Rev., 79, 119 Noghre, G. A., Pazho, A. D., Katariya, V., & Tabkhi, H. (2023). Understanding the challenges and opportunities of pose-based anomaly detection. arXiv preprint arXiv:2303.05463 Olson, D. L. & Delen, D. (2008). Advanced data mining techniques. Berlin Heidelberg, Springer Science & Business Media Padilla-López, J. R., Chaaraoui, A. A., & Flórez-Revuelta, F. (2015). Visual privacy protection methods: A survey. Expert Systems with Applications, 42(9), 4177–4195 Pazho, A. D., Neff, C., Noghre, G. A., Ardabili, B. R., Yao, S., Baharani, M., & Tabkhi, H. (2023). Ancilia: Scalable intelligent video surveillance for the artificial intelligence of things. arXiv preprint arXiv:2301.03561 Radenović, F., Tolias, G., & Chum, O. (2018). Fine-tuning cnn image retrieval with no human annotation. IEEE transactions on pattern analysis and machine intelligence, 41(7), 1655–1668 Ristani, E., Solera, F., Zou, R., Cucchiara, R., & Tomasi, C. (2016). Performance measures and a data set for multi-target, multi-camera tracking. In Computer Vision–ECCV 2016 Workshops: Amsterdam, The Netherlands, October 8-10 and 15-16, 2016, Proceedings, Part II (pp. 17–35). Springer Sun, K., Xiao, B., Liu, D., & Wang, J. (2019). Deep high-resolution representation learning for human pose estimation. In CVPR Tian, Y., Pang, G., Chen, Y., Singh, R., Verjans, J. W., & Carneiro, G. (2021). Weakly-supervised video anomaly detection with robust temporal feature magnitude learning. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 4975–4986) Viola, P. & Jones, M. (2001). Fast and robust classification using asymmetric adaboost and a detector cascade. Advances in neural information processing systems, 14, pp. 1311-1318 Viorescu, R. (2017). 2018 reform of EU data protection rules. Eur. JL & Pub. Admin., 4, 27 Wu, H., Tian, X., Li, M., Liu, Y., Ananthanarayanan, G., Xu, F., & Zhong, S. (2021). Pecam: privacy-enhanced video streaming and analytics via securely-reversible transformation. In Proceedings of the 27thAnnual International Conference on Mobile Computing and Networking (pp. 229–241) Wu, J.-C., Hsieh, H.-Y., Chen, D.-J., Fuh, C.-S., & Liu, T.-L. (2022). Self-supervised sparse representation for video anomaly detection. In European Conference on Computer Vision (pp. 729–745). Springer Ye, M., Shen, J., Lin, G., Xiang, T., Shao, L., & Hoi, S. C. (2021). Deep learning for person re-identification: A survey and outlook. IEEE transactions on pattern analysis and machine intelligence, 44(6), 2872–2893 Zhang, L., Kalashnikov, D. V., Mehrotra, S., & Vaisenberg, R. (2014). Context-based person identification framework for smart video surveillance. Machine Vision and Applications, 25(7), 1711–1725 Zhang, Y., Sun, P., Jiang, Y., Yu, D., Weng, F., Yuan, Z., Luo, P., Liu, W., & Wang, X. (2022). Bytetrack: Multi-object tracking by associating every detection box. Computer Vision--ECCV 2022: 17th European Conference, Tel Aviv, Israel, October 23--27, 2022,Proceedings, Part XXII. Springer. pp. 1-21 Zhou, K., Yang, Y., Cavallaro, A., & Xiang, T. (2019). Omni-scale feature learning for person re-identification. In ICCV