Một phương pháp để phát hiện và đề xuất các từ khóa cầu nối xuyên miền trong kho tài liệu

Emerald - Tập 28 Số 5 - Trang 669-687 - 2010
Yu‐Min Su1, Ping‐Yu Hsu2, Ning‐Yao Pai3
1Department of Computer Science, National Chengchi University, Taipei, Taiwan
2Department of Business Administration, National Central University, Taoyuan, Taiwan
3Institute of Information Management, National Chiao Tung University, Hsinchu, Taiwan

Tóm tắt

Mục đíchPhương pháp phân tích đồng từ thường được sử dụng để nhóm các từ khóa liên quan vào cùng một miền từ khóa. Nói cách khác, phân tích đồng từ truyền thống không thể nhóm cùng một từ khóa vào nhiều miền từ khóa khác nhau và bỏ qua tính chất đa miền của các từ khóa. Mục đích của bài báo này là đề xuất một phương pháp đồng trích dẫn từ khóa sáng tạo gọi là "Phương pháp Cặp Từ Khóa Hoàn Chỉnh (CKP)", nhóm các tập hợp từ khóa hoàn chỉnh từ các tài liệu tham khảo thành các cụm, từ đó tìm ra các từ khóa thuộc về nhiều miền từ khóa khác nhau, được gọi là từ khóa cầu nối.Thiết kế/phương pháp tiếp cậnPhương pháp này xem các từ khóa của tác giả hoàn chỉnh của một bài báo như một tập hợp từ khóa hoàn chỉnh để tính toán các mối quan hệ giữa các từ khóa. Bất kỳ hai tập hợp từ khóa hoàn chỉnh nào mà các bài báo tương ứng được đồng tham chiếu bởi cùng một bài báo sẽ được ghi nhận là một CKP. Một phương pháp phân nhóm được thực hiện với ma trận tương quan được tính toán từ các tần suất của các CKP, nhằm phân nhóm các tập hợp từ khóa hoàn chỉnh. Do các từ khóa có thể liên quan đến hơn một tập hợp từ khóa hoàn chỉnh, nên các từ khóa giống nhau có thể xuất hiện trong nhiều cụm khác nhau.

Từ khóa


Tài liệu tham khảo

Association for Computing Machinery (2009a), “ACM computing classification system toc”, ACM, available at: www.acm.org/about/class. Association for Computing Machinery (2009b), “The ACM portal”, ACM, available at: http://portal.acm.org. Chen, H. and Lynch, K.J. (1992), “Automatic construction of networks of concepts characterizing document databases”, IEEE Transactional on Systems, Man, and Cybermetics, Vol. 22 No. 5, pp. 885‐902. Chen, H., Ng, T.D., Martinez, J. and Schatz, B.R. (1997), “A concept space approach to addressing the vocabulary problem in scientific information retrieval: an experiment on the worm community system”, Journal of the American Society for Information Science, Vol. 48 No. 1, pp. 17‐31. Ding, Y., Chowdhury, G. and Foo, S. (2000), “Organising keywords in a web search environment: a methodology based on co‐word analysis”, Proceedings of the 6th International Society for Knowledge Organization (ISKO 6) Conference, Toronto, Canada, pp. 28‐34. He, Y. and Hui, S.C. (2000), “Mining a web citation database for author co‐citation analysis”, Information Processing & Management, Vol. 38 No. 4, pp. 491‐508. Johnson, A.G. (1988), Statistics, Harcourt Brace Jovanovich, Orlando, FL. Kitamura, Y., Nanbu, T. and Tatsumi, S. (1999), “A keyword recommendation system for GenBank”, Genome Informatics, Vol. 10, pp. 206‐7. Lorence, D. and Abraham, J. (2006), “Analysis of semantic search within the domains of uncertainty: using keyword effectiveness indexing as an evaluation tool”, International Journal of Electronic Healthcare, Vol. 2 No. 3, pp. 263‐76. McCain, K.W. (1990), “Mapping authors in intellectual space: a technical overview”, Journal of the American Society for Information Science, Vol. 41 No. 6, pp. 433‐43. Schatz, B.R., Johnson, E.H., Cochrane, P.A. and Chen, H. (1996), “Interactive term suggestion for users of digital libraries: using subject thesauri and co‐occurrence lists for information retrieval”, Proceedings of the 1st ACM International Conference on Digital libraries (Bethesda, MD, March), ACM Press, New York, NY, pp. 126‐33. Whittaker, J., Courtial, J.P. and Law, J. (1989), “Creativity and conformity in science: titles, keywords and co‐word analysis”, Social Studies of Science, Vol. 19 No. 3, pp. 473‐96. Ahlgren, P., Jarneving, B. and Rousseau, R. (2003), “Requirements for a cocitation similarity measure, with special reference to Pearson's correlation coefficient”, Journal of the American Society for Information Science and Technology, Vol. 54 No. 6, pp. 550‐60. Avancini, H. and Straccia, U. (2004), “Personalization, collaboration, and recommendation in the digital library environment CYCLADES”, Proceedings of the IADIS Conference on Applied Computing, Lisbon, Portugal, pp. 67‐74. Chang, C.C. and Chen, R.S. (2006), “Using data mining technology to solve classification problems: a case study of campus digital library”, The Electronic Library, Vol. 24 No. 3, pp. 307‐21. Egghe, L. and Rousseau, R. (1990), Introduction to Informetrics: Quantitative Methods in Library, Documentation and Information Science, Elsevier Science, Amsterdam. Eom, S.B. (1996), “Mapping the intellectual structure of research in decision support systems through author cocitation analysis (1971‐1993)”, Decision Support Systems, Vol. 16 No. 4, pp. 315‐38. Fuhr, N., Gövert, N. and Klas, C.P. (2001), “Recommendation in a collaborative digital library environment”, technical report, University of Dortmund, Dortmund. Gao, X., Murugesan, S. and Lo, B.W.N. (2006), “A simple method to extract key terms”, International Journal of Electronic Business, Vol. 4 Nos 3/4, pp. 221‐38. Haruechaiyasak, C., Shyu, M.L. and Chen, S.C. (2005), “A web‐page recommender system via a data mining framework and the semantic web concept”, International Journal of Computer Applications in Technology, Vol. 27 No. 4, pp. 298‐311. Liang, T.P., Yang, Y.F., Chen, D.N. and Ku, Y.C. (2007), “A semantic‐expansion approach to personalized knowledge recommendation”, Decision Support Systems, Vol. 45 No. 3, pp. 401‐12. Liao, S.H. and Wen, C.H. (2007), “Artificial neural networks classification and clustering of methodologies and applications – literature analysis from 1995 to 2005”, Expert Systems with Applications, Vol. 32 No. 1, pp. 1‐11. Matsuo, Y. and Ishizuka, M. (2004), “Keyword extraction from a single document using word co‐occurrence statistical information”, International Journal on Artificial Intelligence Tools, Vol. 13 No. 1, pp. 157‐69. Nichols, D.M., Twidale, M.B. and Paice, C.D. (1997), “Recommendation and usage in the digital library”, Technical Report CSEG/2/97, Computing Department, Lancaster University, Lancashire. Roussinov, D. and Zhao, J.L. (2003), “Automatic discovery of similarity relationships through web mining”, Decision Support Systems, Vol. 35 No. 1, pp. 149‐66. Shiri, A.A., Revie, C. and Chowdhury, G. (2002), “Thesaurus‐assisted search term selection and query expansion: a review of user‐centred studies”, Knowledge organization, Vol. 29 No. 1, pp. 1‐19. Tanaka, M., Nakazono, S., Matsuno, H., Tsujimoto, H., Kitamura, Y. and Miyano, S. (2000), “Intelligent system for topic survey in MEDLINE by keyword recommendation and learning text characteristics”, Genome Informatics, Vol. 11, pp. 73‐82. Villarroel, M., Fuente, P., Pedrero, A., Vegas, J. and Adiego, J. (2002), “Obtaining feedback for indexing from highlighted text”, The Electronic Library, Vol. 20 No. 4, pp. 306‐13. White, H.D. and Griffith, B.C. (1981), “Author cocitation: a literature measure of intellectual structure”, Journal of the American Society for Information Science, Vol. 32 No. 3, pp. 163‐71. White, H.D. and McCain, K.W. (1998), “Visualizing a discipline: an author co‐citation analysis of information science, 1972‐1995”, Journal of the American Society for Information Science, Vol. 49 No. 4, pp. 327‐55. Yang, Y. and Li, J.Z. (2005), “Interest‐based recommendation in digital library”, Journal of Computer Science, Vol. 1 No. 1, pp. 40‐6. Yang, C., Yang, K.C. and Yuan, H.C. (2007), “Improving the search process through ontology‐based adaptive semantic search”, The Electronic Library, Vol. 25 No. 2, pp. 234‐48.