Chuẩn hóa và tối ưu hóa ánh xạ lược đồ

The VLDB Journal - Tập 20 - Trang 277-302 - 2011
Georg Gottlob1, Reinhard Pichler2, Vadim Savenkov2
1Computing Laboratory, Oxford University, Oxford, United Kingdom
2Database and Artificial Intelligence Group, Institute of Information Systems, Vienna University of Technology, Vienna, Austria

Tóm tắt

Ánh xạ lược đồ là các đặc tả cấp cao mô tả mối quan hệ giữa các lược đồ cơ sở dữ liệu. Chúng là công cụ quan trọng trong một số lĩnh vực nghiên cứu cơ sở dữ liệu, đặc biệt là trong tích hợp dữ liệu và trao đổi dữ liệu. Tuy nhiên, cho đến nay vẫn hoàn toàn thiếu một lý thuyết cụ thể về tối ưu hóa ánh xạ lược đồ, bao gồm việc hình thành các tiêu chí tối ưu và xây dựng các thuật toán để tính toán các ánh xạ lược đồ tối ưu. Mục tiêu của công trình này là lấp đầy khoảng trống này. Chúng tôi bắt đầu bằng cách trình bày một hệ thống quy tắc sửa đổi nhằm giảm thiểu các tập phụ thuộc sinh tuple từ nguồn đến đích. Hơn nữa, chúng tôi chỉ ra rằng kết quả của việc giảm thiểu này là duy nhất với việc đổi tên biến. Do đó, tối ưu hóa của chúng tôi cũng dẫn đến việc chuẩn hóa ánh xạ lược đồ. Bằng cách mở rộng thích hợp hệ thống quy tắc sửa đổi của chúng tôi, chúng tôi cũng cung cấp một chuẩn hóa cho các ánh xạ lược đồ chứa các phụ thuộc sinh ra sự bằng nhau ở mục tiêu. Một ứng dụng quan trọng của việc chuẩn hóa này là trong lĩnh vực xác định ngữ nghĩa của việc trả lời truy vấn trong trao đổi dữ liệu, vì một số định nghĩa trong lĩnh vực này phụ thuộc vào biểu diễn cú pháp cụ thể của các ánh xạ. Điều này đặc biệt đúng với các truy vấn có các nguyên tố bị phủ định và đối với các truy vấn tổng hợp. Việc chuẩn hóa các ánh xạ lược đồ cho phép chúng tôi loại bỏ tác động của biểu diễn cú pháp cụ thể của các ánh xạ khỏi ngữ nghĩa của việc trả lời truy vấn. Chúng tôi thảo luận chi tiết về cách mà các kết quả của chúng tôi có thể được áp dụng hiệu quả cho các truy vấn tổng hợp.

Từ khóa


Tài liệu tham khảo

Afrati, F.N., Kolaitis, P.G.: Answering aggregate queries in data exchange. In: Proceedings PODS’08, pp. 129–138. ACM (2008) Arenas, M., Barceló, P., Fagin, R., Libkin, L.: Locally consistent transformations and query answering in data exchange. In: Proceedings PODS’04, pp. 229–240. ACM (2004) Arenas M., Bertossi L.E., Chomicki J., He X., Raghavan V., Spinrad J.: Scalar aggregation in inconsistent databases. Theor. Comput. Sci. 3(296), 405–434 (2003) Beeri C., Vardi M.Y.: A proof procedure for data dependencies. J. ACM 31(4), 718–741 (1984) Bernstein P.A., Green T.J., Melnik S., Nash A.: Implementing mapping composition. VLDB J. 17(2), 333–353 (2008) Bernstein, P.A., Melnik, S.: Model management 2.0: manipulating richer mappings. In: Proceedings SIGMOD’07, pp. 1–12. ACM (2007) Chandra, A.K., Merlin, P.M.: Optimal implementation of conjunctive queries in relational data bases. In: Proceedings STOC’77, pp. 77–90. ACM Press (1977) Fagin R.: Horn clauses and database dependencies. J. ACM 29(4), 952–985 (1982) Fagin R., Kolaitis P.G., Miller R.J., Popa L.: Data exchange: semantics and query answering. Theor. Comput. Sci. 336(1), 89–124 (2005) Fagin, R., Kolaitis, P.G., Nash A., Popa L.: Towards a theory of schema-mapping optimization. In: Proceedings PODS’08, pp. 33–42. ACM (2008) Fagin R., Kolaitis P.G., Popa L.: Data exchange: getting to the core. ACM Trans. Database Syst. 30(1), 174–210 (2005) Fagin, R., Kolaitis, P.G., Popa, L., Tan, W.-C.: Reverse data exchange: coping with nulls. In: Proceedings PODS ’09, pp. 23–32. ACM (2009) Gottlob, G., Pichler, R., Savenkov, V.: Optimization and normalization of schema mappings. Technical Report DBAI-TR-2011-69, Vienna University of Technology (2011) Halevy, A.Y., Rajaraman, A., Ordille, J. J.: Data integration: the teenage years. In: Proceedings VLDB’06, pp. 9–16. ACM (2006) Hernich, A., Schweikardt, N.: Cwa-solutions for data exchange settings with target dependencies. In: Proceedings PODS’07, pp. 113–122. ACM (2007) Imielinski T., Lipski W. Jr: Incomplete information in relational databases. J. ACM 31(4), 761–791 (1984) Johnson D.S., Klug A.C.: Testing containment of conjunctive queries under functional and inclusion dependencies. J. Comput. Syst. Sci. 28(1), 167–189 (1984) Kolaitis, P.G.: Schema mappings, data exchange, and metadata management. In: Proceedings PODS’05, pp. 61–75. ACM (2005) Lenzerini, M.: Data integration: a theoretical perspective. In: Proceedings PODS’02, pp. 233–246. ACM (2002) Libkin, L.: Data exchange and incomplete information. In: Proceedings PODS’06, pp. 60–69. ACM Press (2006) Libkin, L., Sirangelo, C.: Data exchange and schema mappings in open and closed worlds. In: Proceedings PODS’08, pp. 139–148. ACM (2008) Marnette B., Mecca G., Papotti P.: Scalable data exchange with functional dependencies. PVLDB 3(1), 105–116 (2010) Mecca, G., Papotti, P., Raunich, S.: Core schema mappings. In: Proceedings SIGMOD’09, pp. 655–668 (2009) Pichler, R., Sallinger, E., Savenkov, V.: Relaxed notions of schema mapping equivalence revisited. In: Proceedings ICDT’11, pp. 90–101. ACM (2011) Sagiv Y., Yannakakis M.: Equivalences among relational expressions with the union and difference operators. J. ACM 27(4), 633–655 (1980) ten Cate B., Chiticariu L., Kolaitis P.G., Tan W.C.: Laconic schema mappings: computing the core with sql queries. PVLDB 2(1), 1006–1017 (2009)