
Wiley
0002-8231
1097-4571
Cơ quản chủ quản: N/A
Các bài báo tiêu biểu
Một hình thức độc đáo mới về liên kết tài liệu gọi là đồng trích dẫn được định nghĩa là tần suất mà hai tài liệu được trích dẫn cùng nhau. Tần suất đồng trích dẫn của hai bài báo khoa học có thể được xác định bằng cách so sánh danh sách tài liệu trích dẫn trong
Bài báo này nghiên cứu các kỹ thuật thống kê nhằm khai thác thông tin liên quan để xác định trọng số cho các thuật ngữ tìm kiếm. Những kỹ thuật này được trình bày như một sự mở rộng tự nhiên của các phương pháp xác định trọng số sử dụng thông tin về phân bố của các thuật ngữ chỉ mục trong các tài liệu nói chung. Một loạt các hàm trọng số liên quan được rút ra và được biện luận bởi các cân nhắc lý thuyết. Đặc biệt, bài báo chỉ ra rằng các phương pháp tìm kiếm có trọng số cụ thể được suy ra từ một lý thuyết xác suất chung về việc truy xuất thông tin. Những ứng dụng khác nhau của trọng số liên quan được minh họa qua các kết quả thực nghiệm từ các tập hợp kiểm tra.
Một Phân phối Ưu thế Tích lũy được đề xuất, mô hình hóa một cách thống kê tình huống trong đó thành công sinh ra thành công. Nó khác với Phân phối Nhị thức Âm tính ở chỗ sự thiếu thành công, là một sự kiện không xảy ra, không bị trừng phạt bằng cách tăng khả năng thất bại. Người ta đã chỉ ra rằng một quy luật ngẫu nhiên như vậy được điều khiển bởi Hàm Beta, chỉ chứa một tham số tự do, và điều này được xấp xỉ bởi một phân phối lệch hoặc siêu bội, loại phân phối phổ biến trong thư mục học và các hiện tượng xã hội học đa dạng. Cụ thể, điều này được chỉ ra là lý thuyết xác suất nền tảng thích hợp cho Luật Bradford, Luật Lotka, các phân phối Pareto và Zipf, cũng như cho tất cả các kết quả thực nghiệm của phân tích tần suất trích dẫn. Làm kết quả phụ, người ta cũng có thể suy ra hệ số lỗi thời cho việc sử dụng tài liệu. Hàm Beta đặc biệt tinh tế cho những mục đích đa dạng này vì nó cung cấp cả phân phối thực tế và phân phối tích lũy ở dạng đơn giản, và chứa một trường hợp giới hạn của một quy luật bình phương nghịch đảo, mà nhiều phân phối thực nghiệm tuân theo.
Bài báo cho thấy rằng việc xây dựng bản đồ cho một lĩnh vực khoa học cụ thể, trong trường hợp này là khoa học thông tin, có thể được thực hiện bằng cách sử dụng các tác giả làm đơn vị phân tích và việc đồng trích dẫn giữa các cặp tác giả như là biến số cho thấy "khoảng cách" giữa họ. Phân tích giả định rằng càng nhiều lần hai tác giả được trích dẫn cùng nhau thì mối quan hệ giữa họ càng gần gũi. Dữ liệu thô được lấy từ số liệu đồng trích dẫn trên Social Scisearch (
Có thể lập luận rằng đánh giá chủ quan của người dùng về giá trị cá nhân của kết quả do hệ thống truy hồi cung cấp, nếu có thể được định lượng một cách thích hợp, sẽ là một thước đo gần như lý tưởng về hiệu quả truy hồi. Một phương pháp giả định được trình bày để đo lường giá trị này thông qua quy trình kích thích. Do phương pháp giả định này không thực tiễn, các phương pháp thỏa hiệp được phác thảo và các giả định đơn giản hóa cơ bản của chúng được thảo luận. Càng hợp lý thì các giả định đơn giản hóa mà dựa trên đó thước đo hiệu suất được xây dựng, thì thước đo đó càng tốt. Điều này, cùng với các bằng chứng thu được từ “các thí nghiệm xác thực” loại nhất định, được đề xuất như một tiêu chí để chọn lựa hoặc phát triển thước đo hiệu quả tốt nhất để sử dụng trong các điều kiện thử nghiệm nhất định.
Trong Phần I (xem JASIS, tháng 3-4 năm 1973, trang 87), đã được lập luận rằng cách tốt nhất để đánh giá một hệ thống truy xuất là, ít nhất về nguyên tắc, thu thập những đánh giá chủ quan về tính hữu ích của hệ thống đối với người dùng của nó, được định lượng theo số lượng các món lợi (ví dụ: đô la) mà họ sẵn sàng từ bỏ để đổi lấy quyền sử dụng hệ thống; và một phương pháp đơn giản đã được phác thảo để đánh giá các hệ thống truy xuất dựa trên cơ sở này. Tuy nhiên, tính thiếu thực tiễn của quy trình đánh giá đơn giản như hiện tại đã đặt ra những câu hỏi: Làm thế nào để quyết định bất kỳ thước đo thực tiễn nào có khả năng cho ra kết quả giống như những kết quả của phương pháp đơn giản? Và làm thế nào để có thể xác định liệu sự tương đồng có đủ gần gũi để việc áp dụng thước đo đó là đáng giá? Trong bài báo này, hai loại giải pháp cho các vấn đề này đã được đề cập. Giải pháp đầu tiên trả lời các câu hỏi theo nghĩa hợp lý của các giả định đơn giản cần thiết trong việc chuyển từ thước đo đơn giản sang thước đo thay thế được đề xuất. Giải pháp thứ hai được đưa ra thông qua thí nghiệm.
Bài viết này tập trung vào các đặc điểm tương tác của con người trong một hệ thống truy xuất thông tin, đề xuất một số cân nhắc thiết kế nhằm cải thiện sự hợp tác giữa người và máy, và mô tả một hệ thống nghiên cứu tại Stanford đang khám phá một số kỹ thuật này.
Thủ thư chỉ có thể hỗ trợ hạn chế trong việc giúp người dùng thiếu kinh nghiệm hình thành cảm nhận không cấu trúc trong tâm trí thành một truy vấn tìm kiếm phù hợp mà có thể ánh xạ vào hệ thống truy xuất. Do đó, quá trình hình thành truy vấn của người dùng, tương tác với thông tin có sẵn trong hệ thống, vẫn là một trong những vấn đề chính trong truy xuất thông tin ngày nay.
Để giải quyết vấn đề này bằng cách cải thiện giao tiếp giao diện giữa con người và máy tính, chúng tôi đã theo đuổi mục tiêu hiển thị các cây chỉ mục có cấu trúc phân cấp trên màn hình CRT theo định dạng cây quyết định, cho phép người dùng chỉ cần chỉ vào (bằng bút ánh sáng) các tùy chọn phù hợp nhất với họ. Việc sử dụng từ vựng thụ động thay vì từ vựng chủ động của họ làm tăng vốn từ vựng tương tác của họ ít nhất gấp một thứ tự. Hơn nữa, một chỉ mục được hiển thị theo cấu trúc phân cấp là một từ điển sửa đổi, và có thể được mở rộng bằng cách thêm các liên kết ngang để cung cấp hỗ trợ ngữ nghĩa cho người dùng. Cấu trúc phân cấp được chọn vì nó dường như phản ánh cấu trúc của các quá trình tư duy nhận thức một cách gần gũi nhất, từ đó cho phép chuyển giao đơn giản và trực tiếp nhất vấn đề của con người vào cấu trúc và từ vựng của hệ thống.
Bài báo này trả lời William S. Cooper: “Về việc chọn một thước đo hiệu quả tìm kiếm.” Tạp chí của Hiệp hội Khoa học Thông tin Hoa Kỳ. 1973;24(2)87–100.
Như một cuộc khám phá về sự thất vọng của người dùng hệ thống tìm kiếm tương tác trực tuyến, sinh viên từ Trường Khoa học Thư viện của Đại học Syracuse đã tham gia vào một thí nghiệm sử dụng một hệ thống tìm kiếm tham chiếu thử nghiệm cho tài liệu thư viện trên hệ thống IBM 360/50. Việc tìm kiếm bao gồm các tìm kiếm mẫu sử dụng từ khóa. Cơ sở dữ liệu chứa các trích dẫn tài liệu thư viện cho năm 1970.
Trong nhóm đối chứng, sinh viên được hướng dẫn để tìm tài liệu liên quan đến quản lý thư viện và các hệ thống truy xuất thông tin. Các thuật ngữ cụ thể trong tìm kiếm và định dạng đã được trình bày trong một buổi hướng dẫn trước khi sinh viên sử dụng hệ thống.
Nhóm thí nghiệm không bị giới hạn trong việc tìm kiếm mẫu, hay các thuật ngữ tìm kiếm cụ thể, nhưng định dạng của các tìm kiếm phải giống như nhóm đối chứng.
Người ta dự đoán rằng sẽ có những biến động đáng kể trong hành vi của người dùng sẽ được hiển thị và xác định bằng cách so sánh các chỉ số hành vi khi quá trình tương tác giữa người và máy diễn ra qua quy trình tìm kiếm.