Phân đoạn Thông tin Đường biên Mờ của Ảnh Dựa trên Thị giác Máy tính và Học Máy

Springer Science and Business Media LLC - Tập 21 - Trang 1-15 - 2023
Tianye Luo1, Shijun Li2,3, Ji Li1, Jie Guo1, Ruilong Feng1, Ye Mu1,4,5,6, Tianli Hu1,4,5,6, Yu Sun1,4,5,6, Ying Guo1,4,5,6, He Gong1,4,5,6
1College of Information Technology, Jilin Agricultural University, Changchun, China
2Guangxi Key Laboratory of Machine Vision and Intelligent Control, WuZhou University, Wuzhou, China
3Guangxi Colleges and Universities Key Laboratory of Image Processing and Intelligent Information System, Wuzhou University, Wuzhou, China
4Jilin Province Agricultural Internet of Things Technology Collaborative Innovation Center, Jilin Agricultural University, Changchun, China
5Jilin Province Intelligent Environmental Engineering Research Center, Jilin Agricultural University, Changchun, China
6Jilin Province Information Technology and Intelligent Agricultural Engineering Research Center, Jilin Agricultural University, Changchun, China

Tóm tắt

Phân đoạn hình ảnh là một vấn đề then chốt trong lĩnh vực thị giác máy. Mục tiêu cốt lõi của nó là tách biệt mục tiêu và nền trong khu vực quan tâm từ hình ảnh, và ảnh hưởng trực tiếp đến độ chính xác của các phép toán tiếp theo như nhận diện mục tiêu và hiểu hình ảnh. Trong vài thập kỷ qua, đã có nhiều thuật toán phân đoạn hình ảnh tốt. Trong những năm gần đây, phương pháp học sâu đại diện cho học máy đã đạt được nhiều tiến bộ vượt bậc trong lĩnh vực phân đoạn hình ảnh. Bài báo này đã xem xét một số thuật toán phân đoạn hình ảnh thường được sử dụng dựa trên học máy, và thực hiện các nghiên cứu lý thuyết cũng như thực nghiệm. Bài báo cũng dự báo triển vọng ứng dụng của học máy trong phân đoạn hình ảnh. Các phương pháp phân đoạn hình ảnh hiện có chủ yếu được chia thành các loại sau: phương pháp phân đoạn dựa trên ngưỡng, phương pháp phân đoạn dựa trên vùng, phương pháp phân đoạn dựa trên cạnh, và các phương pháp phân đoạn dựa trên lý thuyết cụ thể. Trong những năm gần đây, với sự tiến bộ nhanh chóng của công nghệ thị giác máy tính, các yêu cầu về độ chính xác của việc phân đoạn thông tin đường biên hình ảnh đã ngày càng trở nên cao. Lý do chính cho việc phân đoạn hình ảnh là để có được thông tin mục tiêu tốt hơn. Tuy nhiên, do các điều kiện nhiễu như ánh sáng và tiếng ồn, phân đoạn thông tin đường biên mờ trong hình ảnh đã trở thành điểm khó khăn nhất trong sự phát triển của công nghệ thị giác máy tính. Trong thí nghiệm so sánh các thuật toán, kết quả cho thấy trong tập huấn luyện, thời gian phản hồi của thuật toán Mạng Nơ-ron Sâu (DNN), thuật toán Phân tích Cụm (CA) và thuật toán Máy Vector Hỗ trợ (SVM) lần lượt là 13,72 giây, 16,88 giây và 17,29 giây khi số lượng mẫu là 150. Trong tập kiểm tra, khi số lượng mẫu là 50, tỷ lệ nhận diện của thuật toán DNN đạt 93,7%; tỷ lệ nhận diện của thuật toán CA đạt 87,9%; tỷ lệ nhận diện của thuật toán SVM đạt 84,3%. Do đó, nghiên cứu về phân đoạn thông tin đường biên mờ của hình ảnh dựa trên thị giác máy tính và học máy là rất cần thiết.

Từ khóa

#Thị giác máy #phân đoạn hình ảnh #học máy #mạng nơ-ron sâu #phân tích cụm #máy vector hỗ trợ.

Tài liệu tham khảo

Parul, S., Berwal, Y.P.S., Ghai, W.: Performance analysis of deep learning DNN models for disease detection in plants using image segmentation. Inf. Process. Agric. 7(4), 566–574 (2020) Fabian, I.: nnU-Net: a self-configuring method for deep learning-based biomedical image segmentation. Nat. Methods 18(2), 203–211 (2021) Yang, L.: Efficient image segmentation based on deep learning for mineral image classification. Adv. Powder Technol. 32(10), 3885–3903 (2021) Renard, F.: Variability and reproducibility in deep learning for medical image segmentation. Sci. Rep. 10(1), 1–16 (2020) Hyunseok, S.: Machine learning techniques for biomedical image segmentation: an overview of technical aspects and introduction to state-of-art applications. Med. Phys. 47(5), e148–e167 (2020) Samuel, M.: Performance analysis of clustering based image segmentation techniques. J. Innov. Image Process. (JIIP) 2(01), 14–24 (2020) Kavita, U.: Visual Intelligent Recognition System based on Visual Thinking. Kinet. Mech. Eng. 2(1), 46–54 (2021) Shan, P.F.: Image segmentation method based on K-mean algorithm. EURASIP J. Image Video Process. 81, 81 (2018) Han, Yu.: Trajectory Tracking Control Method for Flexible Robot of Construction Machinery Based on Computer Vision. Kinet. Mech. Eng. 4(1), 20–29 (2023) XiaoQing, Z., Zhao, S.-G.: Cervical image classification based on image segmentation preprocessing and a CapsNet network model. Int. J. Imaging Syst. Technol. 29(1), 19–28 (2019) Singh, K.N., Singh, A.K.: Towards Integrating Image Encryption with Compression: A Survey. ACM Trans. Multim. Comput. Commun. Appl. 18(3), 1–21 (2022) Flannery Sean, W.: Automated magnetic resonance image segmentation of the anterior cruciate ligament. J. Orthop. Res. 39(4), 831–840 (2021) Kh, F.S., Yusupov, O.R., Abdiyeva, Kh.S.: Mammography image segmentation in breast cancer identification using the otsu method. Web Sci.: Int. Sci. Res. J. 3(8), 196–205 (2022) Liu, Z., Yang, D., Wang, Y., Lu, M., Li, R.: EGNN: Graph structure learning based on evolutionary computation helps more in graph neural networks. Appl. Soft Comput. 2023, 110040 (2023) Tan, Y., Liu, M., Chen, W., Wang, X., Peng, H., Wang, Y.: DeepBranch: Deep Neural Networks for Branch Point Detection in Biomedical Images. IEEE Trans. Med. Imaging 39(4), 1195–1205 (2020) Singh, P.N., Agarwal, S.: Modality specific U-Net variants for biomedical image segmentation: a survey. Artif. Intell. Rev. 55(7), 5845–5889 (2022) Minaee, S.: Image segmentation using deep learning: A survey. IEEE Trans. Pattern Anal. Mach. Intell. 44(7), 3523–3542 (2021) Zhou, Z.: Unet++: Redesigning skip connections to exploit multiscale features in image segmentation. IEEE Trans. Med. Imaging 39(6), 1856–1867 (2019) Zahangir, A.M.: Recurrent residual U-Net for medical image segmentation. J. Med. Imaging 6(1), 014006–014006 (2019)