Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Mạng nơ-ron tích chập sâu với độ phức tạp thấp cho phát hiện biên trong hình ảnh
Tóm tắt
Trong nhiều ứng dụng thị giác máy tính và xử lý hình ảnh, phát hiện biên là một bước quan trọng. Tuy nhiên, trong các ứng dụng thời gian thực, cả độ chính xác và độ phức tạp về thời gian của việc phát hiện biên đều rất quan trọng. Mặc dù hiệu suất của các kỹ thuật phát hiện biên hình ảnh có thể được cải thiện rất nhiều thông qua việc sử dụng mạng nơ-ron tích chập sâu (DCNN), nhưng các mạng này thường dẫn đến sự gia tăng đáng kể về độ phức tạp tính toán. Nhiều kỹ thuật đã được phát triển cho việc phát hiện biên dựa trên mạng VGG16, vì các lớp tích chập của các mạng trong các sơ đồ này có số tham số ít hơn so với các mạng dư hiện có như ResNet50. Tuy nhiên, hiệu suất của chúng vẫn kém hơn so với các kỹ thuật dư và độ phức tạp tính toán của chúng vẫn rất lớn. Trong bài viết này, một DCNN dựa trên kiến trúc VGG-16, với trọng tâm là độ phức tạp được giảm đáng kể nhưng với hiệu suất so sánh hoặc vượt trội hơn so với tất cả các kỹ thuật phát hiện biên hiện có, được đề xuất. Mục tiêu của việc giảm độ phức tạp của mạng được đạt được thông qua việc sử dụng các mô-đun lửa đến mức mà nó có thể tăng độ sâu của mạng trong khi vẫn giữ được đặc tính độ phức tạp thấp. Điều này, cùng với việc sử dụng học dư, cho phép duy trì hoặc thậm chí cải thiện hiệu suất của mạng. Các mục tiêu của sơ đồ đề xuất được xác thực bằng cách thực hiện các thí nghiệm sử dụng hai tập dữ liệu khác nhau.
Từ khóa
#Phát hiện biên #mạng nơ-ron tích chập sâu #VGG16 #độ phức tạp tính toán #học dưTài liệu tham khảo
Liao B, Hu J, Gilmore RO (2021) Optical flow estimation combining with illumination adjustment and edge refinement in livestock uav videos. Comput Electron Agric 180:105910
Huang Z, Yang S, Zhou MC, Li Z, Gong Z, Chen Y (2022) Feature map distillation of thin nets for low-resolution object recognition. IEEE Trans Image Process
Bansal M, Kumar M (2021) Kumar, m.: 2d object recognition techniques: state-of-the-art work. Arch Computat Methods Eng 28(3):1147–1161
Yang Y, Zhao X, Huang M, Wang X, Zhu Q (2021) Multispectral image based germination detection of potato by using supervised multiple threshold segmentation model and canny edge detector. Comput Electron Agric 1827:106041
Gandhi M, Kamdar J, Shah M (2020) Preprocessing of non-symmetrical images for edge detection. Augmented Human Res 5(1):1–10
Gao F, Li Y, Lu S (2021) Extracting moving objects more accurately: a cda contour optimizer. IEEE Trans Circuits Syst Video Technol
Manno-Kovacs A (2018) Direction selective contour detection for salient objects. IEEE Trans Circuits Syst Video Technol 29(2):375–389
Tu Z, Ma Y, Li C, Tang J, Luo B (2020) Edge-guided non-local fully convolutional network for salient object detection. IEEE Trans Circuits Syst Video Technol 31(2):582–593
Wu R, Feng M, Guan W, Wang D, Lu H, Ding E (2019) A mutual learning method for salient object detection with intertwined multi-supervision. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, pp 8150– 8159
Zeelan Basha C, Sai Teja T, Ravi Teja T, Harshita C, Rohith Sri Sai M (2021) Advancement in classification of x-ray images using radial basis function with support of canny edge detection model. In: Computational vision and bio-inspired computing, pp 29–40
Dhruv B, Mittal N, Modi M (2021) Early and precise detection of pancreatic tumor by hybrid approach with edge detection and artificial intelligence techniques. EAI Endorsed Trans Pervasive Health Technol:1
Al-Amaren A, Ahmad MO, Swamy MNS (2021) A very fast edge map-based algorithm for accurate motion estimation. SIViP:1–8
Sobel I, Feldman G (1968) A 3x3 isotropic gradient operator for image processing. In: Presented at the stanford artificial intelligence project
Prewitt JM (1970) Object enhancement and extraction. Picture Processing and Psychopictorics 10(1):15–19
Roberts L (1965) Machine perception of 3-D solids-series. Optical and electro-optical information processing. MIT Press
Canny J (1986) A computational approach to edge detection. IEEE Trans Pattern Anal
Scharcanski J, Venetsanopoulos AN (1997) Edge detection of color images using directional operators. IEEE Trans Circuits Syst Video Technol 7(2):397–401
Haralick RM (1987) Digital step edges from zero crossing of second directional derivatives. In: Readings in computer vision, pp 216–226
Huertas A, Medioni G (1986) Detection of intensity changes with subpixel accuracy using laplacian-gaussian masks. IEEE Trans Pattern Anal Mach Intell, (5), pp 651–664
Nie Y, Cao X, Li P, Zhang Q, Zhang Z, Li G, Sun H (2019) Interactive contour extraction via sketch-alike dense-validation optimization. IEEE Trans Circuits Syst Video Technol 30(4):903–916
Krizhevsky A, Sutskever I, Hinton GE (2012) Imagenet classification with deep convolutional neural networks. In: Advances in neural information processing systems, pp 1097–1105
Ganin Y, Lempitsky V (2014) N4-fields: neural network nearest neighbor fields for image transforms. In: Asian conference on computer vision. Springer, pp 536–551
Bertasius G, Shi J, Torresani L (2015) Deepedge: a multi-scale bifurcated deep network for top-down contour detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4380–4389
Shen W, Wang X, Wang Y, Bai X, Zhang Z (2015) Deepcontour: a deep convolutional feature learned by positive-sharing loss for contour detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3982– 3991
Hwang J-J, Liu T-L (2015) Pixel-wise deep learning for contour detection. arXiv:1504.01989
Simonyan K, Zisserman A (2014) Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556
Xie S, Tu Z (2015) Holistically-nested edge detection. In: Proceedings of The IEEE international conference on computer vision, pp 1395–1403
Liu Y, Lew MS (2016) Learning relaxed deep supervision for better edge detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 231–240
Wang Y, Zhao X, Li Y, Huang K (2018) Deep crisp boundaries: from boundaries to higher-level tasks. IEEE Trans Image Process 28(3):1285–1298
Liu Y, Cheng M-M, Hu X, Bian J-W, Zhang L, Bai X, Tang J (2019) Richer convolutional features for edge detection. IEEE Trans Pattern Anal Mach Intell 41(8):1939–1946
He J, Zhang S, Yang M, Shan Y, Huang T (2020) Bdcn: bi-directional cascade network for perceptual edge detection. IEEE Trans Pattern Anal Mach Intell
Lin C, Zhang Z, Hu Y (2022) Bio-inspired feature enhancement network for edge detection. Appl Intell:1–16
He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 770–778
Poma XS, Riba E, Sappa A (2020) Dense extreme inception network: towards a robust cnn model for edge detection. In: Proceedings of the IEEE/CVF winter conference on applications of computer vision, pp 1923–1932
Hu Y, Belkhir N, Angulo J, Yao A, Franchi G (2021) Learning deep morphological networks with neural architecture search. arXiv:2106.07714
Su Z, Liu W, Yu Z, Hu D, Liao Q, Tian Q, Pietikäinen M, Liu L (2021) Pixel difference networks for efficient edge detection. In: Proceedings of the IEEE/CVF international conference on computer vision, pp 5117–5127
Al-Amaren A, Ahmad MO, Swamy MNS (2021) RHN: a residual holistic neural network for edge detection. IEEE Access 9:74646–74658
Iandola FN, Han S, Moskewicz MW, Ashraf K, Dally WJ, Keutzer K (2016) Squeezenet: alexnet-level accuracy with 50x fewer parameters and < 0.5 mb model size. arXiv:1602.07360
Qassim H, Verma A, Feinzimer D (2018) Compressed residual-vgg16 cnn model for big data places image recognition. In: 2018 IEEE 8th annual computing and communication workshop and conference (CCWC). IEEE, pp 169–175
Peng C, Zhang X, Yu G, Luo G, Sun J (2017) Large kernel matters–improve semantic segmentation by global convolutional network. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4353–4361
Isola P, Zoran D, Krishnan D, Adelson EH (2014) Crisp boundary detection using pointwise mutual information. In: European conference on computer vision. Springer, pp 799–814
Arbelaez P, Maire M, Fowlkes C, Malik J (2010) Contour detection and hierarchical image segmentation. IEEE Trans Pattern Anal Mach Intell 33(5):898–916
Martin DR, Fowlkes CC, Malik J (2004) Learning to detect natural image boundaries using local brightness, color, and texture cues. IEEE Trans Pattern Anal Mach Intell 26(5):530– 549
Isola P, Zoran D, Krishnan D, Adelson EH (2014) Crisp boundary detection using pointwise mutual information. In: European conference on computer vision. Springer, pp 799–814
Silberman N, Hoiem D, Kohli P, Fergus R (2012) Indoor segmentation and support inference from rgbd images. In: European conference on computer vision. Springer, pp 746– 760
Mottaghi R, Chen X, Liu X, Cho N-G, Lee S-W, Fidler S, Urtasun R, Yuille A (2014) The role of context for object detection and semantic segmentation in the wild. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 891–898
Kingma DP, Ba J (2014) Adam: a method for stochastic optimization. arXiv:1412.6980
Ioffe S, Szegedy C (2015) Batch normalization: accelerating deep network training by reducing internal covariate shift. In: International conference on machine learning. PMLR, pp 448–456
Jaron C (2017) Glossary of deep learning: batch normalisation, Accessed 16 June 2022. [Online]. Available: https://medium.com/deeper-learning/glossary-of-deep-learning-batch-normalisation-8266dcd2fa82
Shashank R (2017) A guide to an efficient way to build neural network architectures- Part II: hyper-parameter selection and tuning for convolutional neural networks using hyperas on fashion-MNIST, Accessed 16 June 2022. [Online]. Available: https://towardsdatascience.com/a-guide-to-an-efficient-way-to-build-neural-network-architectures-part-ii-hyper-parameter-42efca01e5d7
Chollet F et al (2015) GitHub, Accessed 13 Jan 2022. [Online]. Available: https://keras.io
Abadi M, Agarwal A, Barham P, Brevdo E, Chen Z, Citro C, Corrado GS, Davis A, Dean J, Devin M et al (2019) Tensorflow: large-scale machine learning on heterogeneous systems. 2015. software available from tensorflow. org. https://www.tensorflow.org. Accessed 19 Aug 2022
Dollár P, Zitnick CL (2014) Fast edge detection using structured forests. IEEE Trans Pattern Anal Mach Intell 37(8):1558–1570
Pu M, Huang Y, Guan Q, Ling H (2021) Rindnet: Edge detection for discontinuity in reflectance, illumination, normal and depth. In: Proceedings of the IEEE/CVF international conference on computer vision, pp 6879–6888