Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Phân tích và nâng cao video của bài trình bày trên slide điện tử
Proceedings. IEEE International Conference on Multimedia and Expo - Tập 1 - Trang 77-80 vol.1
Tóm tắt
Bài báo này trình bày một phương pháp mới để đánh chỉ mục video của các bài thuyết trình sử dụng các slide điện tử. Bằng cách xác định hình ảnh các slide trong các khung hình video, và sau đó ghép nối chuỗi video với các slide điện tử gốc, video có thể được đánh chỉ mục và tìm kiếm, và sự xuất hiện hình ảnh của các đoạn có thể được cải thiện. Trước tiên chúng tôi phát hiện "khu vực nội dung" trong các khung hình video bằng phương pháp bình phương tối thiểu có trọng số dựa trên sự tương đồng màu sắc. Bằng cách theo dõi "sự khác biệt về nội dung" giữa các khung hình liên tiếp, chúng tôi tạm thời phân đoạn video thành các chuỗi hiển thị cùng một slide. Vì việc khác biệt hóa này loại bỏ các hiệu ứng hình ảnh cấp thấp, chúng tôi có thể liên kết các đoạn video với slide bằng cách khớp sự khác biệt nội dung của các đoạn video liền kề với sự khác biệt nội dung của tất cả các cặp slide có thể có. Bằng cách xác định xác suất chuyển tiếp của các đoạn video, chúng tôi có thể giải quyết vấn đề khớp này một cách hiệu quả trong hai bước, đầu tiên là tìm các khớp có khả năng cao, sau đó sử dụng lập trình động cho phần còn lại chưa khớp. Sau khi khớp, sự tương ứng với các slide gốc có thể được sử dụng để cải thiện chất lượng video trình bày trong khu vực nội dung, và cũng có thể được sử dụng để đánh chỉ mục và tổng hợp. Các thí nghiệm cho thấy hiệu suất cao của phân vùng và khớp trên một số video trình bày khác nhau rất nhiều về màu sắc và phong cách nền.
Từ khóa
#Phân đoạn hình ảnh #Phát hiện cạnh hình ảnh #Đánh chỉ mục #Phương pháp bình phương tối thiểu #Khoa học máy tính #Chuỗi video #Giám sát #Hiển thị #Máy ảnh #Truy xuất dựa trên nội dungTài liệu tham khảo
10.1006/jvci.1997.0355
10.1109/76.915358
boreczky, 1996, Comparison of video shot boundary detection techniques, Storage and Retrieval for Still Image and Video Databases, 170, 10.1117/12.234794
syeda-mahmood, 2000, Detecting topical events in digital video, ACM conference on Multimedia
syeda-mahmood, 2000, Indexing for topics in videos using foils, IEEE Conference on Computer Vision and Pattern Recognition
liu, 2000, A hidden markov model approach to the structure of documentaries, Proceedings of the IEEE International Worksop on Content-based Access of Image and Video Databases
liu, 2001, Time-constrained dynamic semantic compression for video indexing and interactive searching, Proceedings of IEEE Conference on Computer Vision and Pattern Recognition
10.1145/319463.319691
10.1145/319463.319690