Cân nhắc trọng số của các thuật ngữ tìm kiếm

Wiley - Tập 27 Số 3 - Trang 129-146 - 1976
Stephen Robertson1, Karen Spärck Jones2
1School of Library, Archive and Information Studies, University College London, London WC1E 6BT, England
2Computer Laboratory, University of Cambridge, Cambridge CB2 3QG, England

Tóm tắt

Tóm tắt

Bài báo này nghiên cứu các kỹ thuật thống kê nhằm khai thác thông tin liên quan để xác định trọng số cho các thuật ngữ tìm kiếm. Những kỹ thuật này được trình bày như một sự mở rộng tự nhiên của các phương pháp xác định trọng số sử dụng thông tin về phân bố của các thuật ngữ chỉ mục trong các tài liệu nói chung. Một loạt các hàm trọng số liên quan được rút ra và được biện luận bởi các cân nhắc lý thuyết. Đặc biệt, bài báo chỉ ra rằng các phương pháp tìm kiếm có trọng số cụ thể được suy ra từ một lý thuyết xác suất chung về việc truy xuất thông tin. Những ứng dụng khác nhau của trọng số liên quan được minh họa qua các kết quả thực nghiệm từ các tập hợp kiểm tra.

Từ khóa


Tài liệu tham khảo

Angione P. V.1975. “On the Equivalence of Boolean and Weighted Searching Based on the Convertibility of Query Forms.”Journal of the American Society for Information Science.1975March‐April; 26:112–124.

Salton G.1975.A Theory of Indexing Regional Conference Series in Applied Mathematics No. 18 Society for Industrial and Applied Mathematics Philadelphia PA.1975.

10.1108/eb026526

10.1016/0020-0271(73)90043-0

Robertson S. E., 1972, Letter, Journal of Documentation, 28, 164

Robertson S. E., 1974, Specificity and Weighted Retrieval, Journal of Documentation, 30, 41

Barkla J. K.1969. “Construction of Weighted Term Profiles by Measuring Frequency and Specificity in Relevant Items.” Presented at the Second International Cranfield Conference on Mechanized Information Storage and Retrieval Systems Cranfield Bedford:1969.

Miller W. L.1970.The Evaluation of Large Information Retrieval Systems with Application to Medlars.Ph.D. Thesis University of Newcastle.1970.

10.1108/eb026520

10.1108/eb026606

10.1108/eb026529

10.1145/321921.321930

10.1016/0306-4573(76)90026-1

Salton G., 1971, The SMART Retrieval System: Experiments in Automatic Document Processing

Robertson S. E.1976.A Theoretical Model of the Retrieval Characteristics of Information Retrieval Systems Ph.D. Thesis University of London 1976.

Nilsson N. J., 1965, Learning Machines

Cooper W. S.1973. “On Selecting a Measure of Retrieval Effectiveness.”Journal of the American Society for Information Science.1973March‐April; 24:87–100.

Cooper W. S.1973. “On Selecting a Measure of Retrieval Effectiveness. Part 2 Implementation of the Philosophy.”Journal of the American Society for Information Science.1973November‐December; 24:413–424.

10.1016/0020-0271(73)90063-6

Cox D. R., 1970, Analysis of Binary Data

10.1108/eb026582