Capacity-security analysis of data hiding technologies
Tập 2 - Trang 477-480 vol.2
S. Voloshynovskiy, T. Pun
In this paper we consider the problem of joint capacity-security analysis of data hiding technologies from the communications point of view. First, we formulate data hiding as an optimal encoding problem for different operational regimes, that include both robust digital watermarking and steganography. This provides the corresponding estimation of the hidden data statistics, as well as of the rates approaching embedding capacity. Secondly, we formulate the problem of blind stochastic hidden data detection based on the developed watermark statistics. Finally, we estimate the error of watermark detection and the variance of the watermark estimation that determine the system security.
Kiến trúc bộ xử lý tín hiệu số cấu hình lại cho mã hóa video MPEG-4 hiệu suất cao Dịch bởi AI
Tập 2 - Trang 165-168 vol.2
Li-Hsun Chen, Wei-Lung Liu, O.T.-C. Chen, Ruey-Liang Ma
Trong công trình này, phân tích hồ sơ cấp lệnh và cấp chức năng của bộ mã hóa video MPEG-4 được thực hiện để thiết kế một kiến trúc bộ xử lý tín hiệu số (DSP) có thể cấu hình lại. Theo kết quả từ phân tích hồ sơ cấp lệnh, kiến trúc DSP được đề xuất sẽ được sắp xếp với 5 đơn vị logic số (ALUs), 1 bộ nhân, và 2 đơn vị tải/lưu trữ. Việc sắp xếp như vậy trong các đơn vị tính sẽ cho phép kiến trúc DSP được đề xuất có khả năng xử lý song song tốt hơn và tỷ lệ sử dụng phần cứng cao hơn trong việc hiện thực hóa bộ mã hóa video MPEG-4. Kết quả từ phân tích hồ sơ cấp chức năng cho thấy rằng chức năng ước lượng chuyển động yêu cầu sức mạnh tính toán nhiều nhất. Do đó, kiến trúc DSP được đề xuất cấu hình lại 4 ALUs và 1 bộ nhân thành một đơn vị chức năng cho xử lý song song cao của ước lượng chuyển động. Thiết kế phần cứng của ước lượng chuyển động chủ yếu phụ thuộc vào các bộ cộng và bộ nhân của kiến trúc DSP được đề xuất, cộng thêm một vài mạch điều khiển để chuyển đổi các đơn vị tính. Sắp xếp này sẽ có chi phí phần cứng thấp hơn so với các bộ xử lý video truyền thống có các đơn vị chức năng chuyên biệt cho ước lượng chuyển động. Cuối cùng, phân tích và so sánh benchmarking được thực hiện giữa kiến trúc DSP được đề xuất và kiến trúc TI TMS320C64x. Trong việc xử lý bộ mã hóa video MPEG-4, kiến trúc DSP được đề xuất có hiệu suất tính toán cao hơn tới 80% so với kiến trúc TI TMS320C64x.
Truy cập nội dung và phân phối dữ liệu y tế đa phương tiện trong E-health Dịch bởi AI
Tập 2 - Trang 341-344 vol.2
Jinman Kim, D.D. Feng, T.W. Cai, S. Eberl
E-health đang có tác động lớn đến việc phân phối và khả năng tiếp cận thông tin trong các dịch vụ y tế, bệnh viện và đến công chúng. Nghiên cứu trước đây đã đề cập đến việc phát triển kiến trúc hệ thống nhằm tích hợp các hệ thống thông tin y tế phân tán và không đồng nhất. Giảm bớt những khó khăn trong việc chia sẻ và quản lý dữ liệu y tế đa phương tiện và khả năng truy cập kịp thời vào những dữ liệu này là nhu cầu cấp thiết đối với các nhà cung cấp dịch vụ chăm sóc sức khỏe. Chúng tôi đã đề xuất một tác nhân máy khách-máy chủ tích hợp và cho phép một cổng thông tin đến tất cả các hệ thống thông tin được phép của bệnh viện bao gồm hệ thống lưu trữ và truyền tải hình ảnh (PACS), hệ thống thông tin chẩn đoán hình ảnh (RIS) và hệ thống thông tin bệnh viện (HIS) thông qua intranet và Internet. Tác nhân mà chúng tôi đề xuất cho phép truy cập từ xa vào hệ thống thông tin thường đóng của bệnh viện và một máy chủ quản lý tất cả dữ liệu y tế đa phương tiện, cho phép tìm kiếm sâu và phức tạp để truy cập nội dung và tự động tạo báo cáo bệnh nhân để phân phối.
Iterative 3D surface modelling from a sparse set of matched feature points
Tập 1 - Trang 893-896 vol.1
Ning Xu, N. Ahuja
We present an iterative algorithm to reconstruct a 3D object surface from a sparse set of matched feature points on the input stereo images of the object. The initial matches are sparse and do not have to be accurate. The reconstructed 3D surface is represented in terms of triangular polygons whose vertices are initially the 3D points corresponding to these matched feature points. In order to render photorealistic images of the surface, these feature points are iteratively updated. New feature points are added into the feature point set as well as the depth estimates of the feature points are refined. Experimental results showing the updated correspondences, reconstructed surfaces and virtual views rendered from new directions are presented.
On probe strategies for dynamic multimedia server selection
Tập 1 - Trang 393-396 vol.1
L. Amini, H. Schulzrinne
While there has been extensive research into wide-area load balancing for Web servers, dynamic server selection issues for rich media have largely been ignored We argue that streaming media imposes new challenges that are not met by current proposals for collecting and disseminating server and network path metrics. We define a model for quantitatively evaluating the network overhead of competing Internet measurement strategies, propose a novel strategy to better meet requirements for rich media, and use topologies representative of the Internet to show our strategy reduces total and average per link probe overhead by as much as 98%. We discuss additional advantages to our approach, including the ability to represent multiple, potentially streaming media specific, metrics; the ability to effect policy-based selection; and protection against denial of service attacks.
Fast computation of DCT by statistic adapted look-up tables
Tập 1 - Trang 781-784 vol.1
R. Kutka
A fast algorithm to compute the discrete cosine transform (DCT) for video compression is presented. We replace the multiplications, which are the most time-consuming steps, by look-up table accesses. The problem of very long and memory-consuming tables is solved by reducing the tables to significant parts. This technique can be applied to other transformations, such as FFT or wavelets. The algorithm described computes 24% faster than Wang's (1995) DCT on a Pentium processor.
Dự án Cộng đồng Các tác nhân Đa phương tiện Dịch bởi AI
Tập 2 - Trang 289-292 vol.2
Gang Wei, V.A. Petrushin, A.V. Gershman
Những thách thức trong phân tích đa phương tiện đang kêu gọi việc chia sẻ nỗ lực nghiên cứu, trong khi thực tế sự hợp tác bị cản trở bởi các vấn đề kỹ thuật và quyền sở hữu. Dự án Cộng đồng Các tác nhân Đa phương tiện (COMMA) cố gắng giải quyết vấn đề này bằng cách tạo ra một môi trường mở để phát triển, thử nghiệm và triển khai các phương pháp phân tích và chú thích nội dung đa phương tiện. Mỗi phương pháp được đại diện như một tác nhân (mô-đun thực thi) có thể giao tiếp với các tác nhân khác dựa trên các bộ mô tả và sơ đồ mô tả trong tiêu chuẩn MPEG-7 sắp tới. Điều này cho phép các tác nhân xử lý đa phương tiện được phát triển bởi các tổ chức khác nhau hoạt động và hợp tác với nhau, bất kể ngôn ngữ lập trình và kiến trúc nội bộ của chúng. Các nhà nghiên cứu có thể so sánh hiệu suất của các tác nhân và kết hợp chúng để xây dựng các nguyên mẫu hệ thống mạnh mẽ và đáng tin cậy hơn. Nó cũng có thể đóng vai trò là một môi trường học tập cho các nhà nghiên cứu và sinh viên để tiếp cận và thử nghiệm các thuật toán phân tích đa phương tiện tiên tiến. Thông qua việc chia sẻ các tác nhân truyền thông, Cộng đồng có thể tăng hiệu quả nghiên cứu trong khi bảo vệ quyền sở hữu trí tuệ của các nhà phát minh.
On model-based clustering of video scenes using scenelets
Tập 1 - Trang 301-304 vol.1
Hong Lu, Yap-Peng Tan
We propose in this paper a model-based approach to clustering video scenes based on scenelets. We define a video scenelet as a short consecutive sample of frames of a video sequence. The approach makes use of an unsupervised method to represent scenelets of a video with a concise Gaussian mixture model and cluster them into different video scenes according to their visual similarities. In particular the expectation-maximization algorithm is employed to estimate the unknown model parameters, and Bayesian information criterion is used to determine the optimal number and model of scene clusters in a principled manner. This approach is fundamentally different from many existing video clustering methods, as it does not require explicit knowledge of shot boundaries. Instead, the shot boundaries can also be obtained as a by-product of the scene clustering process. The proposed methods have been tested with various types of sports videos and promising results are reported in this paper.
Mosaic feedback for sketch training and retrieval improvement
Tập 2 - Trang 437-440 vol.2
I. la Tendresse, O. Kao, M. Skubowius
The results of queries in image databases are usually presented as a thumbnail list. Subsequently, each of these images can be used for refinement of the initial query. This approach is however not suitable for queries by sketch: in order to receive the desired images the user has to recognise misleading areas of the sketch and to modify these appropriately. This is a non-trivial problem, especially for users with limited expertise in image retrieval and when complex features are used for the image description and comparison. Therefore, this paper presents a mosaic-based technique for sketch feedback, which combines the best sections of the database into a single image. An analysis of individual sections and the linked target images shows, which areas of the sketch lead to poor results and should be modified. Performance measurements show a significant increase of the recall rate.
Multi-modal extraction of highlights from TV Formula 1 programs
Tập 1 - Trang 817-820 vol.1
M. Petkovic, V. Mihajlovic, W. Jonker, S. Djordjevic-Kajan
As amounts of publicly available video data grow, the need to automatically infer semantics from raw video data becomes significant. In this paper, we focus on the use of dynamic Bayesian networks (DBN) for that purpose, and demonstrate how they can be effectively applied for fusing the evidence obtained from different media information sources. The approach is validated in the particular domain of Formula I race videos. For that specific domain we introduce a robust audiovisual feature extraction scheme and a text recognition and detection method. Based on numerous experiments performed with DBN, we give some recommendations with respect to the modeling of temporal and atemporal dependences within the network. Finally, we present the experimental results for the detection of excited speech and the extraction of highlights, as well as the advantageous query capabilities of our system.
