Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Gán nhãn ngữ nghĩa mờ và truy vấn linh hoạt các tài liệu XML được trích xuất từ Web
Tóm tắt
Mô hình cơ sở dữ liệu quan hệ được sử dụng rộng rãi trong các ứng dụng thực tế. Chúng tôi đề xuất một cách kết hợp cơ sở dữ liệu như vậy với một kho dữ liệu XML. Phương pháp mà chúng tôi đề xuất là tổng quát và được điều khiển bởi một ngữ nghĩa miền. Kho dữ liệu XML được xây dựng từ dữ liệu trích xuất từ Web, những dữ liệu này được gán nhãn ngữ nghĩa bằng các thuật ngữ thuộc về ngữ nghĩa miền. Việc gán nhãn ngữ nghĩa là mờ, vì thay vì gán nhãn các giá trị của tài liệu Web bằng một giá trị của ngữ nghĩa miền, chúng tôi đề xuất sử dụng các nhãn được diễn đạt theo một phân bố khả năng đại diện cho một tập hợp các thuật ngữ có thể, mỗi thuật ngữ được cân nặng bởi một mức độ khả năng. Việc truy vấn kho dữ liệu XML cũng là mờ: người dùng cuối có thể bày tỏ sở thích của họ thông qua các tiêu chí lựa chọn mờ. Chúng tôi trình bày phương pháp của mình trên một miền ứng dụng đầu tiên: vi sinh học dự đoán.
Từ khóa
#cơ sở dữ liệu quan hệ #kho dữ liệu XML #gán nhãn ngữ nghĩa #truy vấn linh hoạt #vi sinh học dự đoánTài liệu tham khảo
Aguilé ra, V., Cluet, S., Vetri, P., Vodislav, D., & Wattez, F. (2000). Querying the XML documents on the Web. In Proceedings of the ACMSIGIR Workshop on XML and I.R., Athens, July 2000.
Bosc, P., Lietard, L., & Pivert, O. (1994). Soft querying, a new feature for database management system. In Proceedings DEXA'94 (Database and EXpert system Application), Lecture Notes in Computer Science #856 (pp. 631–640). Springer-Verlag.
Bosc, P., Lietard, L., & Pivert, O. (1999). Fuzziness in D atabase M anagement S ystems, chapter Fuzzy theory techniques and applications in data-base management systems, (pp. 666–671). Academic Press.
citation_title=Measurement in information science; citation_publication_date=1995; citation_id=CR4; citation_author=B. R. Boyce; citation_author=C. T. Meadow; citation_author=D. H. Kraft; citation_publisher=Academic Press
citation_journal_title=IEEE Transactions on Fuzzy Systems; citation_title=SQL f: A relational database language for fuzzy querying; citation_author=P. Bosc, O. Pivert; citation_volume=3; citation_issue=1; citation_publication_date=1995; citation_pages=1-17; citation_doi=10.1109/91.366566; citation_id=CR5
citation_journal_title=International Journal of Intelligent Systems; citation_title=A fuzzy object oriented data model managing vague and uncertain information; citation_author=G. Bordogna, G. Pasi; citation_volume=14; citation_issue=6; citation_publication_date=1999; citation_pages=3495; citation_id=CR6
Bordogna, G. & Pasi, G. (2001). Modeling vagueness in information retrieval. In Proceedings of ESSIR 2000, Lecture Notes in Computer Science #1980, (pp. 207–241).
Bordogna, G., & Pasi, G, (2002). Flexible querying of web documents. In Proceedings of the ACM Symposium Applied Computing, (pp. 675–680). Madrid, Spain, 2002.
citation_journal_title=IEEE Transactions on Fuzzy Systems; citation_title=Fuzzy querying of incomplete, imprecise and heterogeneously structured data in the relational model using ontologies and rules; citation_author=P. Buche, C. Dervin, O. Haemmerlé, R. Thomopoulos; citation_volume=13; citation_issue=3; citation_publication_date=2005; citation_pages=373-383; citation_doi=10.1109/TFUZZ.2004.841736; citation_id=CR9
De Cock, M., Guadarrama, S., & Nikravesh, M. (2004). Fuzzy thesauri for and from the www. In M. Nikravesh, L. Zadeh, J. Kacprzyk (Eds.), soft computing for information processing and Analysis, (pp. 275–284).
citation_title=Possibility theory—An approach to computerized processing of uncertainty; citation_publication_date=1988; citation_id=CR11; citation_author=D. Dubois; citation_author=H. Prade; citation_publisher=Plenum Press
citation_journal_title=Information Processing and Management; citation_title=Strong similarity measures for ordered sets of documents in information retrieval; citation_author=L. Egghe, C. Michel; citation_volume=38; citation_publication_date=2002; citation_pages=823-848; citation_doi=10.1016/S0306-4573(01)00051-6; citation_id=CR12
Hignette, G., Buche, P., Dibie-Barthélemy, J., & Haemmerlé, O. (2005). Fuzzy semantic annotation of xml documents. In E. T. J. Castro (Ed.), In Proceedings of CAiSE'05 Workshops. The 17th conference on advanced information systems engineering, DisWeb'05, (pp. 319–332). Porto, Portugal, 2005. FEUP edicoes.
Lin, Dekang, (1998). An information-theoretic definition of similarity. In ICML '98: Proceedings of the Fifteenth International Conference on Machine Learning (pp. 296–304). San Francisco, CA, USA, 1998. Morgan Kaufmann Publishers Inc.
citation_journal_title=Fuzzy Sets and Systems; citation_title=Information retrieval based on fuzzy associations; citation_author=S. Miyamoto; citation_volume=38; citation_publication_date=1990; citation_pages=191-205; citation_doi=10.1016/0165-0114(90)90149-Z; citation_id=CR15
citation_journal_title=Information Systems; citation_title=Lipski's approach to incomplete information data bases restated and generalized in the setting of Z adeh's possibility theory; citation_author=H. Prade; citation_volume=9; citation_issue=1; citation_publication_date=1984; citation_pages=27-42; citation_doi=10.1016/0306-4379(84)90014-0; citation_id=CR16
citation_journal_title=Information Processing and Management; citation_title=Term weighting approaches in automatic text retrieval; citation_author=G. Salton, C. Buckley; citation_volume=24; citation_issue=5; citation_publication_date=1988; citation_pages=513-523; citation_doi=10.1016/0306-4573(88)90021-0; citation_id=CR17
citation_title=Introduction to modern information retrieval; citation_publication_date=1987; citation_id=CR18; citation_author=G. Salton; citation_author=M.J.Mc. Gill; citation_publisher=Mc Graw-Hill
Saïs, F., Gagliardi, H., Haemmerlé, O., & Pernelle, N., janvier (2005). Enrichissement sémantique de documents SML représentant des tableaux. In Actes des 5émes journÈes Extraction et Gestion des Connaissances, EGC'2005, Revue des Nouvelles Technologies de l'Information—RNTI, (pp. 407–419), Paris, France, Janvier 2005.
citation_journal_title=Journal of Documentation; citation_title=A statistical interpretation of term specificity and its application in retrieval; citation_author=K. A. Spark Jones; citation_volume=28; citation_issue=1; citation_publication_date=1972; citation_pages=11-20; citation_id=CR20
Xyleme, Lucie, (2001). A dynamic warehouse for xml data of the web. IEEE Data Engineering Bulletin.
citation_journal_title=IEEE Transactions on Systems, Man and Cybernetics; citation_title=On ordered weighted averaging aggregation operators in multi-criteria decision making; citation_author=R. Yager; citation_volume=18; citation_issue=1; citation_publication_date=1988; citation_pages=183-190; citation_doi=10.1109/21.87068; citation_id=CR22
citation_journal_title=Information and Control; citation_title=Fuzzy sets; citation_author=L. Zadeh; citation_volume=8; citation_publication_date=1965; citation_pages=338-353; citation_doi=10.1016/S0019-9958(65)90241-X; citation_id=CR23
citation_journal_title=Fuzzy Sets and Systems; citation_title=Fuzzy sets as a basis for a theory of possibility; citation_author=L. Zadeh; citation_volume=1; citation_publication_date=1978; citation_pages=3-28; citation_doi=10.1016/0165-0114(78)90029-5; citation_id=CR24
citation_journal_title=Computing and Mathematics with Applications; citation_title=A computational approach to fuzzy quantifiers in natural languages; citation_author=L. A. Zadeh; citation_volume=9; citation_publication_date=1983; citation_pages=149-184; citation_id=CR25