Communications of the ACM
Công bố khoa học tiêu biểu
* Dữ liệu chỉ mang tính chất tham khảo
Mặc dù việc sử dụng máy tính cá nhân tương đối phổ biến, nhưng trong các cuộc họp, chúng ta thường để chúng lại phía sau. Tại Xerox PARC, một phòng họp thử nghiệm có tên là Colab đã được tạo ra để nghiên cứu hỗ trợ máy tính trong việc giải quyết vấn đề hợp tác trong các cuộc họp trực tiếp. Mục tiêu lâu dài là hiểu cách xây dựng các công cụ máy tính nhằm làm cho các cuộc họp trở nên hiệu quả hơn.
Bài báo này phát triển cây tìm kiếm nhị phân đa chiều (hay còn gọi là cây
Trong một hệ thống truy xuất tài liệu, hoặc môi trường so khớp mẫu khác, nơi mà các thực thể lưu trữ (tài liệu) được so sánh với nhau hoặc với các mẫu đến (yêu cầu tìm kiếm), có vẻ như không gian lập chỉ mục (thuộc tính) tốt nhất là nơi mà mỗi thực thể cách xa nhau nhất có thể; trong những trường hợp này, giá trị của một hệ thống lập chỉ mục có thể được diễn đạt như một hàm của mật độ không gian của đối tượng; đặc biệt, hiệu suất truy xuất có thể tương quan nghịch với mật độ không gian. Một phương pháp dựa trên các phép toán mật độ không gian được sử dụng để chọn một từ vựng lập chỉ mục tối ưu cho một tập hợp các tài liệu. Các kết quả đánh giá điển hình được trình bày, cho thấy tính hữu ích của mô hình.
Xóa bỏ những mây mù khỏi tiềm năng thực sự và những trở ngại mà khả năng tính toán này gây ra.
Một phương pháp mã hóa được trình bày với đặc điểm mới là việc công khai một khóa mã hóa không tiết lộ khóa giải mã tương ứng. Điều này có hai hệ quả quan trọng: (1) Không cần đến những người chuyển phát hoặc các phương tiện bảo mật khác để truyền tải khóa, vì một thông điệp có thể được mã hóa bằng khóa mã hóa được công khai bởi người nhận mong muốn. Chỉ có người đó có thể giải mã được thông điệp, vì chỉ có họ biết khóa giải mã tương ứng. (2) Một thông điệp có thể được "ký" bằng khóa giải mã được giữ bí mật. Bất kỳ ai cũng có thể xác minh chữ ký này bằng cách sử dụng khóa mã hóa đã được công khai. Chữ ký không thể bị giả mạo và người ký không thể phủ nhận tính hợp lệ của chữ ký của mình. Điều này có áp dụng rõ ràng trong các hệ thống "thư điện tử" và "chuyển khoản điện tử". Một thông điệp được mã hóa bằng cách đại diện cho nó như một số M, nâng M lên một số mũ e được chỉ định công khai, và sau đó lấy phần dư khi kết quả được chia cho một tích số công khai được chỉ định,
Trong bài báo này, chúng tôi trình bày cách chia dữ liệu
Bởi vì câu có ý nghĩa được tạo thành từ các từ có nghĩa, bất kỳ hệ thống nào mong muốn xử lý ngôn ngữ tự nhiên như con người phải có thông tin về các từ và ý nghĩa của chúng. Thông tin này thường được cung cấp thông qua từ điển, và các từ điển có thể đọc được bằng máy hiện nay đã trở nên phổ biến. Nhưng các mục từ điển đã được phát triển vì mục đích thuận tiện cho người đọc, không phải cho máy móc. WordNet 1 cung cấp một sự kết hợp hiệu quả hơn giữa thông tin từ điển truyền thống và công nghệ máy tính hiện đại. WordNet là một cơ sở dữ liệu từ vựng trực tuyến được thiết kế để sử dụng dưới sự kiểm soát của chương trình. Các danh từ, động từ, tính từ và trạng từ tiếng Anh được tổ chức thành các tập hợp đồng nghĩa, mỗi tập hợp đại diện cho một khái niệm từ vựng. Các mối quan hệ ngữ nghĩa liên kết các tập hợp đồng nghĩa [4].
MapReduce là một mô hình lập trình và một cách triển khai liên quan để xử lý và sinh ra các tập dữ liệu lớn, phù hợp với nhiều nhiệm vụ trong thực tế. Người dùng xác định phép tính theo các hàm
Chúng tôi đã huấn luyện một mạng nơ-ron tích chập sâu lớn để phân loại 1,2 triệu hình ảnh độ phân giải cao trong cuộc thi ImageNet LSVRC-2010 thành 1000 lớp khác nhau. Trên dữ liệu kiểm tra, chúng tôi đạt được tỷ lệ lỗi top-1 và top-5 lần lượt là 37,5% và 17,0%, điều này tốt hơn nhiều so với công nghệ tiên tiến trước đó. Mạng nơ-ron có 60 triệu tham số và 650.000 nơ-ron, bao gồm năm lớp tích chập, một số lớp có kèm theo lớp max-pooling, và ba lớp liên kết hoàn toàn với softmax 1000 chiều cuối cùng. Để tăng tốc quá trình huấn luyện, chúng tôi đã sử dụng nơ-ron không bão hòa và một triển khai GPU rất hiệu quả của phép toán tích chập. Để giảm thiểu hiện tượng quá khớp trong các lớp liên kết hoàn toàn, chúng tôi đã áp dụng một phương pháp điều hòa được phát triển gần đây gọi là "dropout" và đã chứng tỏ rất hiệu quả. Chúng tôi cũng đã tham gia một biến thể của mô hình này trong cuộc thi ILSVRC-2012 và đạt được tỷ lệ lỗi kiểm tra top-5 chiến thắng là 15,3%, so với 26,2% đạt được bởi bài dự thi đứng thứ hai.
Privacy Integrated Queries (PINQ) is an extensible data analysis platform designed to provide unconditional privacy guarantees for the records of the underlying data sets. PINQ provides analysts with access to records through an SQL-like declarative language (LINQ) amidst otherwise arbitrary C# code. At the same time, the design of PINQ's analysis language and its careful implementation provide formal guarantees of
- 1
- 2
- 3
- 4
- 5
- 6
- 10