SemQuery: phân cụm và truy vấn ngữ nghĩa trên các đặc trưng không đồng nhất cho dữ liệu hình ảnh

IEEE Transactions on Knowledge and Data Engineering - Tập 14 Số 5 - Trang 988-1002 - 2002
G. Sheikholeslami1, W. Chang2, Aidong Zhang3
1Cisco Systems, Inc., San Jose, CA, USA
2Indiana University East, Richmond, IN, USA
3Department of Computer Science and Engineering, State University of New York, University at Buffalo, Buffalo, NY, USA

Tóm tắt

Hiệu quả của việc truy xuất hình ảnh dựa trên nội dung có thể được nâng cao bằng cách sử dụng các đặc trưng không đồng nhất được nhúng trong các hình ảnh. Tuy nhiên, vì các đặc trưng về kết cấu, màu sắc và hình dạng được tạo ra bằng các phương pháp tính toán khác nhau và do đó có thể yêu cầu các phép đo độ tương đồng khác nhau, việc tích hợp các kết quả truy xuất dựa trên các đặc trưng không đồng nhất là một nhiệm vụ không đơn giản. Chúng tôi giới thiệu một phương pháp phân cụm và lập chỉ mục dựa trên ngữ nghĩa, được gọi là SemQuery, để hỗ trợ các truy vấn trực quan trên các đặc trưng không đồng nhất của hình ảnh. Sử dụng phương pháp này, các hình ảnh trong cơ sở dữ liệu được phân loại dựa trên các đặc trưng không đồng nhất của chúng. Mỗi cụm hình ảnh ngữ nghĩa chứa một tập hợp các tiểu cụm được đại diện bởi các đặc trưng không đồng nhất mà các hình ảnh chứa. Một hình ảnh được đưa vào một cụm ngữ nghĩa nếu nó nằm trong phạm vi của tất cả các cụm không đồng nhất của cụm ngữ nghĩa. Chúng tôi cũng thiết kế một mô hình mạng nơ-ron để gộp các kết quả của các truy vấn cơ bản trên các đặc trưng riêng lẻ. Một chiến lược xử lý truy vấn sau đó được trình bày để hỗ trợ các truy vấn trực quan trên các đặc trưng không đồng nhất. Một phân tích thực nghiệm được thực hiện và trình bày để chứng minh hiệu quả và hiệu suất của phương pháp được đề xuất.

Từ khóa

#Truy xuất hình ảnh #Dữ liệu hình ảnh #Cơ sở dữ liệu không gian #Cơ sở dữ liệu trực quan #Đo lường hình dạng #Truy xuất dựa trên nội dung #Lập chỉ mục #Truy xuất thông tin #Lịch sử phân phối #Vectơ

Tài liệu tham khảo

10.1145/290747.290749 sheikholeslami, 1998, : A Multi-Resolution Clustering Approach for Very Large Spatial Databases, Proc 24th VLDB Conf, 428 10.1109/MMCS.1999.779270 sheikholeslami, 1997, An Approach to Clustering Large Visual Databases Using Wavelet Transform, Proc SPIE Conf Visual Data Exploration and Analysis IV, 322 10.1145/267825.267841 sheikholeslami, 1998, : An Approach for Merging Heterogeneous Features in Content-Based Image Retrieval Systems, Multi-Media Database Management Systems 1998 Proceedings International Workshop on, 106, 10.1109/MMDBMS.1998.709516 sheikholeslami, 2000, : A Wavelet-Based Clustering Approach for Multidimensional Data in Very Large Databases, The VLDB J, 8, 289, 10.1007/s007780050009 10.1145/244130.244151 sheikholeslami, 1999, A Multi-Resolution Content-Based Retrieval System for Geographic Images, GoeInformatica An Int'l J Advances of Computer Science for Geographic Information Systems, 3, 109 10.1109/ICIP.1994.413817 bach, 1996, The Virage Image Search Engine: An Open Framework for Image Management, Proc SPIE Storage and Retrieval for Still Image and Video Databases IV, 76, 10.1117/12.234785 10.1109/TPAMI.1981.4767045 10.1145/93597.98741 10.1109/69.234774 cybenko, 1988, Continous Valued Neural Netwrks with Two Hidden Layers are Sufficient 10.1109/TPAMI.1983.4767341 dougherty, 1989, Texture-Based Segmentation by Morphological Granulometrics, Advanced Printing of Paper Summaries Electronic Imaging '89, 1, 408 10.1007/BF02551274 ester, 1996, A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise, Proc Second Int'l Conf KDD, 226 minka, 1995, Interactive Learning Using a 'Society of Models minka, 1996, An Image Database Browser that Learns from User Interaction mokhtarian, 1996, Efficient and Robust Retrieval by Shape Content through Curvature Scale Space, Proc Int'l Workshop Image DataBases and MultiMedia Search, 35 10.5244/C.10.33 10.1109/TKDE.2002.1033770 10.1145/244130.244148 pauwels, 1997, DOG-Based Unsupervized Clustering for CBIR, Proc Second Int'l Conf Visual Information Systems, 13 pentland, 1994, Photobook: Tools for Content-Based Manipulation of Image Databases, Proc SPIE Conf Storage and Retrieval of Image and Video Databases II, 34, 10.1117/12.171786 10.1147/sj.353.0292 safar, 2000, Image Retrieval by Shape: A Comparative Study, Proc IEEE Int'l Conf Multimedia and Exposition (ICME), 10.1109/ICME.2000.869564 10.1109/2.410154 10.1109/34.531803 mandelbrot, 1977, FractalsForm Chance Dimension 10.1109/ICIP.1997.647976 lowe, 1985, Perceptual Organization and Visual Recognition, 10.1007/978-1-4613-2551-2 10.1109/34.506794 korn, 1996, Fast Nearest-Neighbor Search in Medical Image Databases, Proc Conf Very Large Data Bases (VLDB '96) zurada, 1992, Introduction to Artificial Neural Systems kaufman, 1990, Finding Groups in Data An Introduction to Cluster Analysis fries, 1981, Texture Discrimination Based upon an Assumed Stochastic Texture Model, IEEE Trans Pattern Analysis and Machine Intelligence, 3, 557 10.1016/0893-6080(89)90020-8 hirata, 1993, Rough Sketch-Based Image Information Retrieval, NEC Research & Development, 34, 263 klaus, 1988, Robot Vision gordon, 1981, Classification Methods for the Exploratory Analysis of Multivariate Data 10.1145/244130.244151 furht, 1996, Video and Image Processing in Multimedia Systems 10.1109/TGRS.1986.289620 10.1007/BF00130487 10.1145/971697.602266 tao, 1999, Delaunay Triangulation for Image Object Indexing: A Novel Method for Shape Representation, Proc Seventh SPIE Symp Storage and Retrieval for Image and Video Databases, 631 1995, Computer 10.1006/jcss.1998.1600 10.1145/275487.275488 10.1109/2.410146 10.1007/BF00962238 white, 1996, Algorithms and Strategies for Similarity Retrieval zhang, 1996, BIRCH: An Efficient Data Clustering Method for Very Large Databases, Proc 1996 ACM SIGMOD Int'l Conf Management of Data, 103 10.1109/MMCS.1997.609755 10.1109/IVL.1998.694497 10.1145/330560.330912 wang, 1997, STING: A Statistical Information Grid Approach to Spatial Data Mining, Proc 23rd VLDB Conf, 186