Data mining Tập 31 Số 1 - Trang 76-77 - 2002
Ian H. Witten, Eibe Frank
Khám phá các quy tắc liên kết giữa các tập hợp sản phẩm trong cơ sở dữ liệu lớn Dịch bởi AI Tập 22 Số 2 - Trang 207-216 - 1993
Rakesh Agrawal, Tomasz Imieliński, Arun Swami
Chúng tôi được cung cấp một cơ sở dữ liệu lớn về các giao dịch của khách hàng.
Mỗi giao dịch bao gồm các mặt hàng mà một khách hàng đã mua trong một lần ghé
thăm. Chúng tôi giới thiệu một thuật toán hiệu quả để sinh ra tất cả các quy tắc
liên kết đáng kể giữa các mặt hàng trong cơ sở dữ liệu. Thuật toán này tích hợp
quản lý bộ đệm và các kỹ thuật ước lượng và cắt tỉa mới. Chúng tôi cũng trình
bày ... hiện toàn bộ
The cougar approach to in-network query processing in sensor networks Tập 31 Số 3 - Trang 9-18 - 2002
Yong Yao, Johannes Gehrke
The widespread distribution and availability of small-scale sensors, actuators,
and embedded processors is transforming the physical world into a computing
platform. One such example is a sensor network consisting of a large number of
sensor nodes that combine physical sensing capabilities such as temperature,
light, or seismic sensors with networking and computation capabilities.
Applications ran... hiện toàn bộ
Information diffusion in online social networks Tập 42 Số 2 - Trang 17-28 - 2013
Adrien Guille, Hakim Hacid, Cécile Favre, Djamel A. Zighed
Online social networks play a major role in the spread of information at very
large scale. A lot of effort have been made in order to understand this
phenomenon, ranging from popular topic detection to information diffusion
modeling, including influential spreaders identification. In this article, we
present a survey of representative methods dealing with these issues and propose
a taxonomy that s... hiện toàn bộ
Cluster validity methods Tập 31 Số 2 - Trang 40-45 - 2002
Maria Halkidi, Yannis Batistakis, Michalis Vazirgiannis
Clustering is an unsupervised process since there are no predefined classes and
no examples that would indicate grouping properties in the data set. The
majority of the clustering algorithms behave differently depending on the
features of the data set and the initial assumptions for defining groups.
Therefore, in most applications the resulting clustering scheme requires some
sort of evaluation as... hiện toàn bộ
Các phương pháp kiểm tra tính hợp lệ của phân cụm Dịch bởi AI Tập 31 Số 3 - Trang 19-27 - 2002
Maria Halkidi, Yannis Batistakis, Michalis Vazirgiannis
Xác thực kết quả phân cụm là một chủ đề quan trọng trong bối cảnh nhận dạng mẫu.
Chúng tôi xem xét các phương pháp và hệ thống trong bối cảnh này. Trong phần đầu
của bài báo này, chúng tôi trình bày các phương pháp kiểm tra tính hợp lệ của
phân cụm dựa trên các tiêu chí nội tại và ngoại tại. Trong phần thứ hai, chúng
tôi trình bày một cái nhìn tổng quan về các phương pháp tính hợp lệ phân cụm dựa
... hiện toàn bộ
A case for intelligent disks (IDISKs) Tập 27 Số 3 - Trang 42-52 - 1998
Kimberly Keeton, David A. Patterson, Joseph M. Hellerstein
Decision support systems (DSS) and data warehousing workloads comprise an
increasing fraction of the database market today. I/O capacity and associated
processing requirements for DSS workloads are increasing at a rapid rate,
doubling roughly every nine to twelve months [38]. In response to this
increasing storage and computational demand, we present a computer architecture
for decision support da... hiện toàn bộ
Query languages for graph databases Tập 41 Số 1 - Trang 50-60 - 2012
Peter T. Wood
Query languages for graph databases started to be investigated some 25 years
ago. With much current data, such as linked data on the Web and social network
data, being graph-structured, there has been a recent resurgence in interest in
graph query languages. We provide a brief survey of many of the graph query
languages that have been proposed, focussing on the core functionality provided
in these... hiện toàn bộ
Cải tiến các biểu đồ cho ước lượng tính chọn lọc của các điều kiện phạm vi Dịch bởi AI Tập 25 Số 2 - Trang 294-305 - 1996
Viswanath Poosala, Peter J. Haas, Yannis Ioannidis, Eugene J. Shekita
Nhiều hệ thống cơ sở dữ liệu thương mại duy trì các biểu đồ để tóm tắt nội dung
của các quan hệ và cho phép ước lượng hiệu quả kích thước kết quả truy vấn và
chi phí kế hoạch truy cập. Mặc dù đã có nhiều loại biểu đồ được đề xuất trong
quá khứ, nhưng chưa có một nghiên cứu hệ thống nào về tất cả các khía cạnh của
biểu đồ, các lựa chọn có sẵn cho từng khía cạnh và tác động của những lựa chọn
đó đến... hiện toàn bộ
Tính toán trực tuyến hiệu quả không gian cho các tóm tắt phân vị Dịch bởi AI Tập 30 Số 2 - Trang 58-66 - 2001
Michael B. Greenwald, Sanjeev Khanna
Một tóm tắt phân vị xấp xỉ ∈ của một chuỗi N phần tử là một cấu trúc dữ liệu có
thể trả lời các truy vấn về phân vị đối với chuỗi với độ chính xác là ∈ N .
Chúng tôi trình bày một thuật toán trực tuyến mới để tính toán các tóm tắt phân
vị xấp xỉ ∈ của các chuỗi dữ liệu rất lớn. Thuật toán này có yêu cầu không gian
trong trường hợp tồi tệ nhất là Ο (1÷∈ log(∈ N )). Kết quả này tốt hơn so với
kết qu... hiện toàn bộ