Hướng tới phân đoạn ngữ nghĩa của hình ảnh ảnh chính tả sử dụng xác định cộng đồng dựa trên đồ thị

Neural Computing and Applications - Tập 31 - Trang 1155-1163 - 2017
Abdelmalik Moujahid1, Fadi Dornaika2, Yassine Ruichek3, Karim Hammoudi4
1Signal Theory and Communications Department (DTSC), Carlos III University of Madrid (UC3M), Getafe, Spain
2University of the Basque Country (UPV/EHU) and Ikerbasque Foundation, San Sebastian, Spain
3University of Technology of Belfort-Montbeliard (UTBM), Sevenans, France
4University Haute Alsace, UHA, Mulhouse, France

Tóm tắt

Chúng tôi trình bày một khuôn khổ không giám sát tự động phát hiện các đối tượng quan tâm trong hình ảnh bằng cách mô hình hóa vấn đề phân đoạn ngữ nghĩa chung như một vấn đề phát hiện cộng đồng trong các đồ thị. Khuôn khổ này chủ yếu tuân theo một quy trình bốn bước. Đầu tiên, chúng tôi thực hiện phân đoạn quá mức của hình ảnh gốc bằng cách sử dụng thuật toán hợp nhất khu vực thống kê nổi tiếng, có ưu điểm là không yêu cầu bất kỳ quá trình định lượng hay biến đổi không gian màu nào. Thứ hai, chúng tôi tính toán các mô tả đặc trưng của các khu vực đã được phân đoạn. Để mã hóa thông tin màu sắc và kết cấu khác, mỗi khu vực được mô tả bằng một mô tả lai dựa trên lịch sử màu sắc và mô tả ma trận hiệp phương sai. Thứ ba, từ tập hợp các mô tả, chúng tôi xây dựng các đồ thị có trọng số khác nhau bằng cách sử dụng các thuật toán xây dựng đồ thị khác nhau. Cuối cùng, các đồ thị kết quả sau đó được chia thành các nhóm hoặc cộng đồng bằng cách sử dụng thuật toán phát hiện cộng đồng dựa trên tối đa hóa mô-đun phổ. Thuật toán này sử dụng phổ riêng của các ma trận như ma trận Laplacian đồ thị và ma trận mô-đun, có khả năng tiết lộ cấu trúc cộng đồng của đồ thị. Các thí nghiệm được thực hiện trên các ảnh chính tả lớn thể hiện nhiều khu vực trong vùng thành phố Belfort nằm ở phía đông bắc nước Pháp cho thấy kết quả đầy hứa hẹn. Khuôn khổ được đề xuất có thể được sử dụng bởi các phương pháp bán tự động để giải quyết các vấn đề thách thức của việc phân tích cảnh.

Từ khóa

#phân đoạn ngữ nghĩa #phát hiện cộng đồng #đồ thị #phân khúc hình ảnh #khuôn khổ không giám sát

Tài liệu tham khảo

Farabet C, Couprie C, Najman L, LeCun Y (2013) Learning hierarchical features for scene labeling. IEEE Trans Pattern Anal Mach Intell 35(8):1915–1929 Socher R, Lin CC, Ng AY, Manning CD (2011) Parsing natural scenes and natural language with recursive neural networks. In: International conference on machine learning Sharma P, Suji J (2016) A review on image segmentation with its clustering techniques. Int J Signal Process Image Process Pattern Recognit 9(5):209–218 Newman MEJ (2006) Modularity and community structure in networks. Proc Natl Acad Sci 103(23):8577–8582 Sousa C, Rezende S, Batista G (2013) Influence of graph construction on semi-supervised learning. In: European conference on machine learning, pp 160–175 Zhang L, Chen S, Qiao L (2012) Graph optimization for dimensionality reduction with sparsity constraints. Pattern Recognit 45:1205–1210 Zhang L, Qiao L, Chen S (2010) Graph-optimized locality preserving projections. Pattern Recognit 43:1993–2002 Belkin M, Niyogi P (2003) Laplacian eigenmaps for dimensionality reduction and data representation. Neural Comput 15(6):1373–1396 Roweis ST, Saul LK (2000) Nonlinear dimensionality reduction by locally linear embedding. Science 290(5500):2323–2326 Schaeffer SE (2007) Graph clustering. Comput Sci Rev 1(1):2007 Fortunato S (2010) Community detection in graphs. Phys Rep 486(3–5):75–174 Bandyopadhyay S, Chowdhary G, Sengupta D (2015) Focs: fast overlapped community search. IEEE Trans Knowl Data Eng 27(11):2974–2985 Xu D, Tian Y (2015) A comprehensive survey of clustering algorithms. Ann Data Sci 2(2):165–193 Hu H (2015) Graph based models for unsupervised high dimensional data clustering and network analysis. Ph.D. thesis, University of California Sajana T, Rani CMS, Narayana KV (2016) A survey on clustering techniques for big data mining. Indian J Sci Technol 9(3):1–12 Garima, Gulati H, Singh PK (2015) Clustering techniques in data mining: a comparison. In: 2015 2nd international conference on computing for sustainable global development (INDIACom), pp 410–415 Kernighan BW, Lin S (1970) An efficient heuristic procedure for partitioning graphs. Bell Syst Tech J 49(2):291–307 Guo C, Zheng S, Xie Y, Hao W (2012) A survey on spectral clustering. In: World Automation Congress 2012, Puerto Vallarta, Mexico, pp 53–56 Yang P, Zhu Q, Huang B (2011) Spectral clustering with density sensitive similarity function. Knowl Based Syst 24:621–628 Wacquet G, Caillault EP, Hamad D, Hebert PA (2013) Constrained spectral embedding for k-way data clustering. Pattern Recognit Lett 34(9):1009–1017 Wang X, Qian B, Davidson I (2014) On constrained spectral clustering and its applications. Data Min Knowl Discov 28(1):1–30 Newman MEJ (2006) Finding community structure in networks using the eigenvectors of matrices. Phys Rev E 74:036104 Nock R, Nielsen F (2004) Statistical region merging. IEEE Trans Pattern Anal Mach 26(11):1452–1458 Dornaika F, Moujahid A, Merabet YE, Ruichek Y (2016) Building detection from orthophotos using a machine learning approach: an empirical study on image segmentation and descriptors. Expert Syst Appl 58:130–142 Tuzel O, Porikli F, Meer P (2006) A fast descriptor for detection and classification. In: European conference on computer vision, pp 589–600 Ojala T, Pietikainen M, Maenpaa T (2002) Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. Trans Pattern Anal Mach Intell 24:971–987 Takala V, Ahonen T, Pietikainen M (2005) Block-based methods for image retrieval using local binary patterns. In: Image analysis, SCIA, vol LNCS, p 3540 Ahonen T, Hadid A, Pietikainen M (2006) Face description with local binary patterns: application to face recognition. IEEE Trans Pattern Anal Mach Intell 28(12):2037–2041 Bereta M, Karczmarek P, Pedrycz W, Reformat M (2013) Local descriptors in application to the aging problem in face recognition. Pattern Recognit 46:2634–2646 Huang D, Shan C, Ardabilian M, Wang Y (2011) Adaptive particle sampling and adaptive appearance for multiple video object tracking. IEEE Trans Syst Man Cybern Part C Appl Rev 41(6):765–781 Wolf L, Hassner T, Taigman Y (2008) Descriptor based methods in the wild. In: Faces in real-life images workshop in ECCV