International Journal of Multimedia Information Retrieval
Công bố khoa học tiêu biểu
* Dữ liệu chỉ mang tính chất tham khảo
Sắp xếp:
A new CNN-based semantic object segmentation for autonomous vehicles in urban traffic scenes
International Journal of Multimedia Information Retrieval - - 2024
Semantic segmentation is the most important stage of making sense of the visual traffic scene for autonomous driving. In recent years, convolutional neural networks (CNN)-based methods for semantic segmentation of urban traffic scenes are among the trending studies. However, the methods developed in the studies carried out so far are insufficient in terms of accuracy performance criteria. In this ...... hiện toàn bộ
Hybrid music information retrieval
International Journal of Multimedia Information Retrieval - Tập 2 - Trang 1-2 - 2013
State of the journal
International Journal of Multimedia Information Retrieval - Tập 9 - Trang 229-229 - 2020
Caption TLSTMs: combining transformer with LSTMs for image captioning
International Journal of Multimedia Information Retrieval - Tập 11 - Trang 111-121 - 2022
Image to captions has attracted widespread attention over the years. Recurrent neural networks (RNN) and their corresponding variants have been the mainstream when it comes to dealing with image captioning task for a long time. However, transformer-based models have shown powerful and promising performance on visual tasks contrary to classic neural networks. In order to extract richer and more rob...... hiện toàn bộ
Color-independent classification of animation video
International Journal of Multimedia Information Retrieval - Tập 7 - Trang 187-196 - 2018
This paper presents a method for the classification of animated video that does not rely on hue or saturation information, and aims to achieve a high level of performance in the context of automatic video categorization and encoder parameterization for low bit rate video processing. While existing animated and genre-based video classification approaches have achieved good results, they are highly ...... hiện toàn bộ
Statistical framework for content-based medical image retrieval based on wavelet orthogonal polynomial model with multiresolution structure
International Journal of Multimedia Information Retrieval - Tập 3 - Trang 53-66 - 2013
This paper proposes wavelet based orthogonal polynomial coefficients model for content based image retrieval (CBIR). The coefficients are categorized into low-frequency and high-frequency based on a criteria. The criteria is adaptively determined and fixed according to the nature and structure of the image, because the wavelet based orthogonal polynomial model spatially localizes the frequency inf...... hiện toàn bộ
Pedestrian detection using first- and second-order aggregate channel features
International Journal of Multimedia Information Retrieval - Tập 8 - Trang 127-133 - 2019
The content-based analysis of visual multimedia like images and videos are urgently needed to empower human society for the automation of difficult tasks. Pedestrian detection serves as a backbone for a multitude of image processing and machine learning algorithms and secures quite a lot of real-world applications. Keeping this fact in mind, here, we deal with the fabrication of suitable features ...... hiện toàn bộ
Optimization of information retrieval for cross media contents in a best practice network
International Journal of Multimedia Information Retrieval - Tập 3 Số 3 - Trang 147-159 - 2014
ConvST-LSTM-Net: mạng LSTM không gian - thời gian tích chập để nhận diện hành động của con người dựa trên bộ khung xương Dịch bởi AI
International Journal of Multimedia Information Retrieval - Tập 12 - Trang 1-17 - 2023
Nhận diện hành động của con người (HAR) nhấn mạnh việc nhận biết và xác định hành vi hành động của con người trong hình ảnh/video. Các hoạt động HAR bao gồm các mô hình chuyển động và các hoạt động bình thường hay bất thường như đứng, đi bộ, ngồi, chạy, chơi, ngã, đánh nhau, v.v. Gần đây, HAR đã thu hút sự chú ý của các nhà nghiên cứu, đặc biệt là trong chuỗi xương 3D. Các hành động của con người ...... hiện toàn bộ
#nhận diện hành động của con người #HAR #khung xương 3D #LSTM #mô hình hiệu suất cao #ConvST-LSTM-Net
Order, context and popularity bias in next-song recommendations
International Journal of Multimedia Information Retrieval - Tập 8 - Trang 101-113 - 2019
The availability of increasingly larger multimedia collections has fostered extensive research in recommender systems. Instead of capturing general user preferences, the task of next-item recommendation focuses on revealing specific session preferences encoded in the most recent user interactions. This study focuses on the music domain, particularly on the task of music playlist continuation, a pa...... hiện toàn bộ
Tổng số: 213
- 1
- 2
- 3
- 4
- 5
- 6
- 10