Trích xuất các đoạn phim cho phân tích điện ảnh

Multimedia Tools and Applications - Tập 26 - Trang 277-298 - 2005
Ba Tu Truong1, Svetha Venkatesh1, Chitra Dorai2
1Department of Computing Science, Curtin University of Technology, Perth, Western Australia
2Watson Research Center, IBM T.J., Yorktown Heights, USA

Tóm tắt

Trong nghiên cứu này, chúng tôi tập trung vào vấn đề ‘biên tập ngược’ trong phân tích phim, tức là việc trích xuất các đoạn phim, những cảnh quay nguyên bản mà một biên tập viên phim sử dụng để tạo ra một cảnh hoàn chỉnh. Khả năng phân rã các cảnh và đoạn phim cuối cùng thành các đoạn là rất quan trọng cho việc duyệt phim không tuyến tính, chú thích nội dung và trích xuất các cấu trúc điện ảnh bậc cao hơn từ phim. Một khung làm việc gồm hai phần cho việc trích xuất các đoạn phim được đề xuất. Phần đầu tiên tập trung vào việc lọc ra những cảnh hành động mà việc trích xuất đoạn phim không hữu ích. Phần thứ hai tập trung vào việc trích xuất các đoạn phim sử dụng các phương pháp phân cụm phân cấp tích tụ cùng với các chỉ số tương đồng khác nhau và khoảng cách nhóm, và trình bày các phát hiện của chúng tôi với 10 bộ phim.

Từ khóa

#trích xuất đoạn phim #phân tích điện ảnh #biên tập ngược #phân cụm phân cấp #tương đồng

Tài liệu tham khảo

B. Adams, C. Dorai, and S. Venkatesh. “Automatic extraction of expressive elements from motion pictures: Tempo,” IEEE Transactions on Multimedia, Vol. 4, No. 4, pp. 472–481, 2002. F.E. Beaver, Dictionary of Film Terms: The Aesthetics companion to Film Analysis, New York: Twayne Publisher, 1994. J.M. Corridoni and A.D. Bimbo, “Structured representation and automatic indexing of movie information conent,” Pattern Recognition, Vol. 31, No. 12, pp. 2027–2045, 1998. N. Dimitrova, J. Martino, L. Agnihotri, and H. Elenbaas, “Color superhistograms for video representation,” in ICIP’99, Kobe, 1999, Vol. 3, pp. 314–318. N.D. Doulamis, A.D. Doulamis, Y.S. Avrithis, and S.D. Kollias, “Video content representation using optimal extraction of frames and scenes,” in ICIP, Vol. 1., Chicago, Illiois, 1998, pp. 875–879. M.S. Drew and J. Au, “Video keyframe production by efficient clustering of compressed chromaticity signatures,” in ACM Multimedia 2000, Los Angeles, 2000. B.S. Everitt, Cluster Analysis 3rd edition. Edward Arnold, 1993. D. Farin, W. Effelsberg, and P. de With, “Robust clustering-based video-summarization with integration of domain-knowledge,” in IEEE International Conference on Multimedia and Expo(ICME), Lausanne, 2002. A. Girgensohn and J.S. Boreczky, “Time-constrained keyframe selection technique,” Multimedia Tools and Applications, Vol. 11, No. 3, pp. 347–358, 2000. J. Huang, S. Kumar, M. Mitra, W. Zhu, and R. Zahib, “Spatial Color Indexing and Applications,” International Journal of Computer Vision, Vol. 35, No. 3, pp. 245–268, 1999. L. Hubert and P. Arabie, “Comparing partitions,” Journal of Classificaiton, Vol. 2, pp. 193–218, 1985. S. Kobayashi, Colorist: A Practical Handbook for Personal and Professional Use, Kodansa International: Tokyo, 1998. Y. Li, T. Zhang, and D. Tretter, “An overview of video abstraction techniques,” Technical Report HPL-2001-191, HP Laboratory, 2001. R. Lienhart, “Reliable transition detection in videos: A survey and practitioner’s guide,” International Journal of Image and Graphics, Vol. 1, No. 3, pp. 469–486, 2001. T. Moriayama and M. Sakauchi, “Video summarisation based on the psychological content in the track structure,” in ACM multimedia workshops 2000, 2002, pp. 191–194. J. Nam and A.H. Tewfik, “Dynamic video sumarization and visualization,” in The 7th ACM Conference on Multimida, ACMMM’99, Vol. 2. Orlando, Florida, 1999, pp. 53–56. C.-W. Ngo, T.-C. Pong, and H.-Z. Zhang, “On Clustering and Retrieval of video shots,” in: ACM Multimedia’01, Ottawa, 2001, pp. 51–60. Y. Rui, T.S. Huang, and M.S., “Constructing table-of-content for videos,” ACM Multimedia System Journal: Special Issue in Multimedia Systems on Video Libraries, Vol. 7, No. 5, pp. 359–368, 1999. S. Sharff, “The Elements of Cinema: Towards a CinestheticImpact,” Columbia Uni Press: New York, 1982. E.A. Tekalp and A. Mehrotra, “Automatic soccer video analysis and summarization,” IEEE Transaction on Image Processing, 2003. B.T. Truong, C. Dorai, and S. Venkatesh, “Automatic scene extraction in motion pictures,” IEEE Transactions in Circuits and Systems for Video Technology, Vol. 13, No. 1, pp. 5–10, 2003. B.T. Truong, S. Venkatesh, and C. Dorai, “New enhancements to cut, fade, and dissolve detection process in video segmentation,” in ACM Multimedia 2000, LA, 2000, pp. 219–227. B.T. Truong, S. Venkatesh, and C. Dorai, “Application of computational media aesthetics methodology to extracting color semantics in film,” in ACM Multiemdia 2002, France Les Pins, 2002, pp. 339–342. B.T. Truong, S. Venkatesh, and C. Dorai, “Discovering semantics from the visualization of film takes,” in Accepted for IEEE Multimedia Modelling 2004, Brisbane, Australia, 2004. E. Veneau, R. Ronfard, and P. Bouthemy, “From video shot clustering to sequence segmentation,” in ICPR’00, Vol. 4, Barcelona, 2000, pp. 254–257. G.W. Milligan and M.C. Cooper, “An examination of procedures for determining the number of clusters in a data set,” Psychometrika, Vol. 50, No. 2, pp. 159–179, 1985. J. Wang and T.-S. Chua, “A cinematic-based framework for detecting scene boundaries in video,” The Visual Computer. To appear, 2003. M. Yeung, B.-L. Yeo, and B. Liu, “Segmentation of video by clustering and graph analysis,” Computer Vision and Image Understanding, Vol. 7, No. 1, pp. 94–109, 1998. H. Zettl, Sight Sound Motion: Applied Media Aesthetics, 3rd edition, Wadsworth Publishing, 1999. L. Zhao, W. Qi, S. Yang, and H. Zhang, “Video shot grouping using best-first model merging,” in Proc. 13th SPIE Symposium on Electronic Imaging—Storage and Retrieval for Image and Video Databases, San Jose, 2001, pp. 262–267. D. Zhong, H. Zhang, and S.-F. Chang, “Clustering methods for video browsing and annotation,” in Storage and Retrieval for Still Image and Video Databases IV, 1996, pp. 239–246. Y. Zhuang, Y. Rui, T. Huang, and S. Mehrotra, “Adaptive key frame extraction using unsupervised clustering,” in ICIP’98, Chicago, 1998, pp. 866–870.