Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer, Peter Reutemann, Ian H. Witten
Đã hơn mười hai năm trôi qua kể từ khi WEKA được phát hành công khai lần đầu
tiên. Trong thời gian đó, phần mềm đã được viết lại hoàn toàn từ đầu, phát triển
mạnh mẽ và hiện nay đi kèm với một tài liệu về khai thác dữ liệu [35]. Hiện tại,
WEKA được chấp nhận rộng rãi trong cả lĩnh vực học thuật và kinh doanh, có một
cộng đồng năng động, và đã được tải xuống hơn 1.4 triệu lần kể từ khi được đưa
lên... hiện toàn bộ
Gustavo E. A. P. A. Batista, Ronaldo C. Prati, Maria Carolina Monard
Có nhiều khía cạnh có thể ảnh hưởng đến hiệu suất đạt được bởi các hệ thống học
hiện tại. Đã có báo cáo rằng một trong những khía cạnh này liên quan đến sự mất
cân bằng lớp, trong đó các ví dụ trong dữ liệu huấn luyện thuộc về một lớp nào
đó vượt trội số lượng so với các ví dụ thuộc lớp khác. Trong tình huống này, xảy
ra trong dữ liệu thế giới thực mô tả một sự kiện hiếm nhưng quan trọng, hệ thống... hiện toàn bộ
Kernel methods in general and support vector machines in particular have been
successful in various learning tasks on data represented in a single table. Much
'real-world' data, however, is structured - it has no natural representation in
a single table. Usually, to apply kernel methods to 'real-world' data, extensive
pre-processing is performed to embed the data into areal vector space and thus
i... hiện toàn bộ
Ensemble analysis is a widely used meta-algorithm for many data mining problems
such as classification and clustering. Numerous ensemble-based algorithms have
been proposed in the literature for these problems. Compared to the clustering
and classification problems, ensemble analysis has been studied in a limited way
in the outlier detection literature. In some cases, ensemble analysis techniques
... hiện toàn bộ
The past few years have witnessed an significant interest in probabilistic logic
learning, i.e. in research lying at the intersection of probabilistic reasoning,
logical representations, and machine learning. A rich variety of different
formalisms and learning techniques have been developed. This paper provides an
introductory survey and overview of the state-of-the-art in probabilistic logic
lear... hiện toàn bộ
Tahora H. Nazer, Guoliang Xue, Yusheng Ji, Huan Liu
The success of a disaster relief and response process is largely dependent on
timely and accurate information regarding the status of the disaster, the
surrounding environment, and the a ected people. This information is primarily
provided by rst responders on-site and can be enhanced by the firsthand reports
posted in real-time on social media. Many tools and methods have been developed
to automa... hiện toàn bộ
The current tendency in the life sciences to spawn ever growing amounts of
high-throughput assays has led to a situation where the interpretation of data
and the formulation of hypotheses lag the pace at which information is produced.
Although the first generation of statistical algorithms scrutinizing single,
large-scale data sets found their way into the biological community, the great
challenge... hiện toàn bộ
Các tạp chí khác
Tạp chí Truyền nhiễm Việt Nam
Tạp chí Khoa học và Công nghệ nhiệt đới
Communications in Physics
Khoa học Kỹ thuật Mỏ Địa chất
Tạp chí Nghiên cứu Chính sách và Quản lý
Tạp chí Khoa học - Công nghệ trong lĩnh vực An toàn thông tin
Tạp chí Khoa học Trường Đại học Sư phạm Thành phố Hồ Chí Minh