Mạng nơ-ron tích chập sâu với độ phức tạp thấp cho phát hiện biên trong hình ảnh

Springer Science and Business Media LLC - Tập 53 - Trang 11282-11299 - 2022
Abdullah Al-Amaren1, M. Omair Ahmad1, M.N.S. Swamy1
1Department of Electrical and Computer Engineering, Concordia University, Montreal, Canada

Tóm tắt

Trong nhiều ứng dụng thị giác máy tính và xử lý hình ảnh, phát hiện biên là một bước quan trọng. Tuy nhiên, trong các ứng dụng thời gian thực, cả độ chính xác và độ phức tạp về thời gian của việc phát hiện biên đều rất quan trọng. Mặc dù hiệu suất của các kỹ thuật phát hiện biên hình ảnh có thể được cải thiện rất nhiều thông qua việc sử dụng mạng nơ-ron tích chập sâu (DCNN), nhưng các mạng này thường dẫn đến sự gia tăng đáng kể về độ phức tạp tính toán. Nhiều kỹ thuật đã được phát triển cho việc phát hiện biên dựa trên mạng VGG16, vì các lớp tích chập của các mạng trong các sơ đồ này có số tham số ít hơn so với các mạng dư hiện có như ResNet50. Tuy nhiên, hiệu suất của chúng vẫn kém hơn so với các kỹ thuật dư và độ phức tạp tính toán của chúng vẫn rất lớn. Trong bài viết này, một DCNN dựa trên kiến trúc VGG-16, với trọng tâm là độ phức tạp được giảm đáng kể nhưng với hiệu suất so sánh hoặc vượt trội hơn so với tất cả các kỹ thuật phát hiện biên hiện có, được đề xuất. Mục tiêu của việc giảm độ phức tạp của mạng được đạt được thông qua việc sử dụng các mô-đun lửa đến mức mà nó có thể tăng độ sâu của mạng trong khi vẫn giữ được đặc tính độ phức tạp thấp. Điều này, cùng với việc sử dụng học dư, cho phép duy trì hoặc thậm chí cải thiện hiệu suất của mạng. Các mục tiêu của sơ đồ đề xuất được xác thực bằng cách thực hiện các thí nghiệm sử dụng hai tập dữ liệu khác nhau.

Từ khóa

#Phát hiện biên #mạng nơ-ron tích chập sâu #VGG16 #độ phức tạp tính toán #học dư

Tài liệu tham khảo

Liao B, Hu J, Gilmore RO (2021) Optical flow estimation combining with illumination adjustment and edge refinement in livestock uav videos. Comput Electron Agric 180:105910 Huang Z, Yang S, Zhou MC, Li Z, Gong Z, Chen Y (2022) Feature map distillation of thin nets for low-resolution object recognition. IEEE Trans Image Process Bansal M, Kumar M (2021) Kumar, m.: 2d object recognition techniques: state-of-the-art work. Arch Computat Methods Eng 28(3):1147–1161 Yang Y, Zhao X, Huang M, Wang X, Zhu Q (2021) Multispectral image based germination detection of potato by using supervised multiple threshold segmentation model and canny edge detector. Comput Electron Agric 1827:106041 Gandhi M, Kamdar J, Shah M (2020) Preprocessing of non-symmetrical images for edge detection. Augmented Human Res 5(1):1–10 Gao F, Li Y, Lu S (2021) Extracting moving objects more accurately: a cda contour optimizer. IEEE Trans Circuits Syst Video Technol Manno-Kovacs A (2018) Direction selective contour detection for salient objects. IEEE Trans Circuits Syst Video Technol 29(2):375–389 Tu Z, Ma Y, Li C, Tang J, Luo B (2020) Edge-guided non-local fully convolutional network for salient object detection. IEEE Trans Circuits Syst Video Technol 31(2):582–593 Wu R, Feng M, Guan W, Wang D, Lu H, Ding E (2019) A mutual learning method for salient object detection with intertwined multi-supervision. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, pp 8150– 8159 Zeelan Basha C, Sai Teja T, Ravi Teja T, Harshita C, Rohith Sri Sai M (2021) Advancement in classification of x-ray images using radial basis function with support of canny edge detection model. In: Computational vision and bio-inspired computing, pp 29–40 Dhruv B, Mittal N, Modi M (2021) Early and precise detection of pancreatic tumor by hybrid approach with edge detection and artificial intelligence techniques. EAI Endorsed Trans Pervasive Health Technol:1 Al-Amaren A, Ahmad MO, Swamy MNS (2021) A very fast edge map-based algorithm for accurate motion estimation. SIViP:1–8 Sobel I, Feldman G (1968) A 3x3 isotropic gradient operator for image processing. In: Presented at the stanford artificial intelligence project Prewitt JM (1970) Object enhancement and extraction. Picture Processing and Psychopictorics 10(1):15–19 Roberts L (1965) Machine perception of 3-D solids-series. Optical and electro-optical information processing. MIT Press Canny J (1986) A computational approach to edge detection. IEEE Trans Pattern Anal Scharcanski J, Venetsanopoulos AN (1997) Edge detection of color images using directional operators. IEEE Trans Circuits Syst Video Technol 7(2):397–401 Haralick RM (1987) Digital step edges from zero crossing of second directional derivatives. In: Readings in computer vision, pp 216–226 Huertas A, Medioni G (1986) Detection of intensity changes with subpixel accuracy using laplacian-gaussian masks. IEEE Trans Pattern Anal Mach Intell, (5), pp 651–664 Nie Y, Cao X, Li P, Zhang Q, Zhang Z, Li G, Sun H (2019) Interactive contour extraction via sketch-alike dense-validation optimization. IEEE Trans Circuits Syst Video Technol 30(4):903–916 Krizhevsky A, Sutskever I, Hinton GE (2012) Imagenet classification with deep convolutional neural networks. In: Advances in neural information processing systems, pp 1097–1105 Ganin Y, Lempitsky V (2014) N4-fields: neural network nearest neighbor fields for image transforms. In: Asian conference on computer vision. Springer, pp 536–551 Bertasius G, Shi J, Torresani L (2015) Deepedge: a multi-scale bifurcated deep network for top-down contour detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4380–4389 Shen W, Wang X, Wang Y, Bai X, Zhang Z (2015) Deepcontour: a deep convolutional feature learned by positive-sharing loss for contour detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3982– 3991 Hwang J-J, Liu T-L (2015) Pixel-wise deep learning for contour detection. arXiv:1504.01989 Simonyan K, Zisserman A (2014) Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556 Xie S, Tu Z (2015) Holistically-nested edge detection. In: Proceedings of The IEEE international conference on computer vision, pp 1395–1403 Liu Y, Lew MS (2016) Learning relaxed deep supervision for better edge detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 231–240 Wang Y, Zhao X, Li Y, Huang K (2018) Deep crisp boundaries: from boundaries to higher-level tasks. IEEE Trans Image Process 28(3):1285–1298 Liu Y, Cheng M-M, Hu X, Bian J-W, Zhang L, Bai X, Tang J (2019) Richer convolutional features for edge detection. IEEE Trans Pattern Anal Mach Intell 41(8):1939–1946 He J, Zhang S, Yang M, Shan Y, Huang T (2020) Bdcn: bi-directional cascade network for perceptual edge detection. IEEE Trans Pattern Anal Mach Intell Lin C, Zhang Z, Hu Y (2022) Bio-inspired feature enhancement network for edge detection. Appl Intell:1–16 He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 770–778 Poma XS, Riba E, Sappa A (2020) Dense extreme inception network: towards a robust cnn model for edge detection. In: Proceedings of the IEEE/CVF winter conference on applications of computer vision, pp 1923–1932 Hu Y, Belkhir N, Angulo J, Yao A, Franchi G (2021) Learning deep morphological networks with neural architecture search. arXiv:2106.07714 Su Z, Liu W, Yu Z, Hu D, Liao Q, Tian Q, Pietikäinen M, Liu L (2021) Pixel difference networks for efficient edge detection. In: Proceedings of the IEEE/CVF international conference on computer vision, pp 5117–5127 Al-Amaren A, Ahmad MO, Swamy MNS (2021) RHN: a residual holistic neural network for edge detection. IEEE Access 9:74646–74658 Iandola FN, Han S, Moskewicz MW, Ashraf K, Dally WJ, Keutzer K (2016) Squeezenet: alexnet-level accuracy with 50x fewer parameters and < 0.5 mb model size. arXiv:1602.07360 Qassim H, Verma A, Feinzimer D (2018) Compressed residual-vgg16 cnn model for big data places image recognition. In: 2018 IEEE 8th annual computing and communication workshop and conference (CCWC). IEEE, pp 169–175 Peng C, Zhang X, Yu G, Luo G, Sun J (2017) Large kernel matters–improve semantic segmentation by global convolutional network. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4353–4361 Isola P, Zoran D, Krishnan D, Adelson EH (2014) Crisp boundary detection using pointwise mutual information. In: European conference on computer vision. Springer, pp 799–814 Arbelaez P, Maire M, Fowlkes C, Malik J (2010) Contour detection and hierarchical image segmentation. IEEE Trans Pattern Anal Mach Intell 33(5):898–916 Martin DR, Fowlkes CC, Malik J (2004) Learning to detect natural image boundaries using local brightness, color, and texture cues. IEEE Trans Pattern Anal Mach Intell 26(5):530– 549 Isola P, Zoran D, Krishnan D, Adelson EH (2014) Crisp boundary detection using pointwise mutual information. In: European conference on computer vision. Springer, pp 799–814 Silberman N, Hoiem D, Kohli P, Fergus R (2012) Indoor segmentation and support inference from rgbd images. In: European conference on computer vision. Springer, pp 746– 760 Mottaghi R, Chen X, Liu X, Cho N-G, Lee S-W, Fidler S, Urtasun R, Yuille A (2014) The role of context for object detection and semantic segmentation in the wild. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 891–898 Kingma DP, Ba J (2014) Adam: a method for stochastic optimization. arXiv:1412.6980 Ioffe S, Szegedy C (2015) Batch normalization: accelerating deep network training by reducing internal covariate shift. In: International conference on machine learning. PMLR, pp 448–456 Jaron C (2017) Glossary of deep learning: batch normalisation, Accessed 16 June 2022. [Online]. Available: https://medium.com/deeper-learning/glossary-of-deep-learning-batch-normalisation-8266dcd2fa82 Shashank R (2017) A guide to an efficient way to build neural network architectures- Part II: hyper-parameter selection and tuning for convolutional neural networks using hyperas on fashion-MNIST, Accessed 16 June 2022. [Online]. Available: https://towardsdatascience.com/a-guide-to-an-efficient-way-to-build-neural-network-architectures-part-ii-hyper-parameter-42efca01e5d7 Chollet F et al (2015) GitHub, Accessed 13 Jan 2022. [Online]. Available: https://keras.io Abadi M, Agarwal A, Barham P, Brevdo E, Chen Z, Citro C, Corrado GS, Davis A, Dean J, Devin M et al (2019) Tensorflow: large-scale machine learning on heterogeneous systems. 2015. software available from tensorflow. org. https://www.tensorflow.org. Accessed 19 Aug 2022 Dollár P, Zitnick CL (2014) Fast edge detection using structured forests. IEEE Trans Pattern Anal Mach Intell 37(8):1558–1570 Pu M, Huang Y, Guan Q, Ling H (2021) Rindnet: Edge detection for discontinuity in reflectance, illumination, normal and depth. In: Proceedings of the IEEE/CVF international conference on computer vision, pp 6879–6888