Thiết kế và triển khai ngôn ngữ truy vấn dữ liệu dựa trên nghĩa

E. Kapetanios1, D. Baer1, P. Groenewoud1, P. Mueller1
1Department of Computer Science, Swiss Federal Institute of Technology, Zurich, Switzerland

Tóm tắt

Chúng tôi trình bày thiết kế và triển khai một ngôn ngữ truy vấn dữ liệu dựa trên nghĩa - MDDQL - nhằm mục đích xây dựng các truy vấn thông qua những gợi ý từ hệ thống về các thuật ngữ truy vấn dựa trên ngôn ngữ tự nhiên cho cả lĩnh vực ứng dụng khoa học và các thuật ngữ toán tử/hoạt động. Một bảng đen xây dựng truy vấn được sử dụng, nơi các thuật ngữ ngôn ngữ truy vấn được gợi ý cho người dùng bằng ngôn ngữ tự nhiên mà họ ưa thích và theo cách tập trung vào tên gọi, kèm theo ý nghĩa của chúng. Điều này giúp hiểu rõ hơn về nghĩa của các thuật ngữ và/hoặc các toán tử hoặc hoạt động sẽ được đưa vào truy vấn. Hơn nữa, việc xây dựng truy vấn dường như là một quá trình tinh chỉnh gia tăng của truy vấn đang được xây dựng thông qua các ràng buộc ngữ nghĩa, nơi chỉ những thuật ngữ ngôn ngữ lĩnh vực và/hoặc các toán tử/hoạt động mang lại các kết hợp có nghĩa của các thuật ngữ truy vấn liên quan đến ngữ nghĩa của lĩnh vực ứng dụng khoa học được gợi ý. Do đó, có thể ngăn chặn các truy vấn không có nghĩa về mặt ngữ nghĩa trong quá trình xây dựng truy vấn. Cơ chế nhận thức ngữ nghĩa như vậy không có trong các ngôn ngữ truy vấn cơ sở dữ liệu thông thường như SQL, nơi cho phép thực hiện một truy vấn tính toán, ví dụ như tính trung bình của các giá trị số liệu trong khi chúng đại diện cho các mã của các giá trị phân loại. Hơn nữa, người dùng cuối không cần phải quen thuộc với ngữ nghĩa của các sơ đồ cơ sở dữ liệu phức tạp hoặc diễn giải các ký hiệu (tên của các lớp/bảng/thuộc tính, mã giá trị) cơ bản trong mô hình lưu trữ, cũng như không cần quen thuộc với cú pháp của một ngôn ngữ truy vấn cơ sở dữ liệu cụ thể.

Từ khóa

#Database languages #Natural languages #Vocabulary #Ontologies #Engines #Computer science #Application software #Data models #Software packages #Database systems

Tài liệu tham khảo

10.1109/SSDM.1999.787629 10.1093/bioinformatics/16.2.184 10.1016/S0169-023X(97)00056-6 10.1017/S0269888900007797 zhang, 1998, Interactive Query Formulation Techniques for Databases 10.1109/UIDIS.1999.791463 10.1109/69.317704 10.1006/jvlc.1997.0037 10.1016/S1045-926X(05)80025-4 10.1007/BF00122129 10.1145/223784.223890 10.1006/jvlc.1995.1005 10.1142/S0218843097000082 10.1109/UIDIS.1999.791472 10.1109/2.211893