Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
So sánh các bộ phát hiện khuôn mặt và đặc trưng khuôn mặt dựa trên khuôn khổ phát hiện đối tượng tổng quát Viola–Jones
Tóm tắt
Khuôn mặt con người cung cấp thông tin hữu ích trong quá trình tương tác; do đó, bất kỳ hệ thống nào tích hợp Tương tác Người-Máy Dựa trên Thị giác đều cần phát hiện khuôn mặt và đặc trưng khuôn mặt một cách nhanh chóng và đáng tin cậy. Nhiều cách tiếp cận đã tập trung vào khả năng này nhưng chỉ có các triển khai mã nguồn mở được sử dụng rộng rãi bởi các nhà nghiên cứu. Một ví dụ điển hình là khuôn khổ phát hiện đối tượng Viola–Jones, đặc biệt trong bối cảnh xử lý khuôn mặt, đã được sử dụng thường xuyên. Cộng đồng OpenCV chia sẻ một bộ sưu tập các bộ phân loại công khai cho tình huống phát hiện khuôn mặt. Tuy nhiên, các bộ phân loại này đã được huấn luyện trong các điều kiện khác nhau và với các dữ liệu khác nhau nhưng hiếm khi được kiểm tra trên cùng một bộ dữ liệu. Trong bài báo này, chúng tôi cố gắng lấp đầy khoảng trống đó bằng cách phân tích hiệu suất riêng lẻ của tất cả các bộ phân loại công khai, trình bày ưu điểm và nhược điểm của chúng với mục tiêu xác định một mức cơ sở cho các phương pháp khác. Các so sánh vững chắc cũng sẽ giúp các nhà nghiên cứu lựa chọn một bộ phân loại cụ thể cho kịch bản của họ. Bố cục thử nghiệm cũng mô tả một số quy tắc hợp lý để tăng tỷ lệ phát hiện đặc trưng khuôn mặt trong khi giảm tỷ lệ phát hiện sai khuôn mặt.
Từ khóa
#Viola-Jones #phát hiện khuôn mặt #đặc trưng khuôn mặt #mã nguồn mở #OpenCV #phân loại viên.Tài liệu tham khảo
citation_journal_title=IEEE Trans. Pattern Anal. Mach. Intell.,; citation_title=Looking at people: sensing for ubiquitous and wearable computing; citation_author=A. Pentland; citation_volume=22; citation_issue=1; citation_publication_date=2000; citation_pages=107-119; citation_doi=10.1109/34.824823; citation_id=CR1
citation_journal_title=Commun. Assoc. Comput. Mach.; citation_title=Computer vision in the interface; citation_author=M. Turk; citation_volume=47; citation_issue=1; citation_publication_date=2004; citation_pages=61-67; citation_id=CR2
Li, S.Z., Zhu, L., Zhang, Z., Blake, A., Zhang, H., Shum, H.: Statistical learning of multi-view face detection. In: European Conference Computer Vision, pp. 67–81 (2002)
Schneiderman, H., Kanade, T.: A statistical method for 3d object detection applied to faces and cars. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 1746–1759 (2000)
citation_journal_title=Int. J. Comp. Vis.; citation_title=Robust real-time face detection; citation_author=P. Viola, M.J. Jones; citation_volume=57; citation_issue=2; citation_publication_date=2004; citation_pages=151-173; citation_doi=10.1023/B:VISI.0000013087.49260.fb; citation_id=CR5
Lienhart, R., Maydt, J.: An extended set of Haar-like features for rapid object detection. In: IEEE ICIP 2002, vol. 1, pp. 900–903 (2002)
Castrillón, M., Déniz, O., Antón, L., Lorenzo, J.: Face and facial feature detection evaluation. In: Proceedings of the International Joint Conference on Computer Vision and Computer Graphics Theory and Applications, VISIGRAPP, pp. 167–172 (2008)
Lienhart, R., Kuranov, A., Pisarevsky, V.: Empirical analysis of detection cascades of boosted classifiers for rapid object detection. In: DAGM’03, 25th Pattern Recognition Symposium, Madgeburg, Germany, pp. 297–304 (2003)
Schmidt, A., Kasinski, A.: The performance of the haar cascade classifiers applied to the face and eyes detection. In: Springer (ed.) Proceedings of the 5th International Conference on Computer Recognition Systems CORES2007. Advances in Soft Computing, vol. 45. Wroclaw, Poland, pp. 816–823 (2007)
citation_journal_title=Pattern Recogn.; citation_title=Locating and extracting the eye in human face images; citation_author=K.-M. Lam, H. Yan; citation_volume=29; citation_issue=5; citation_publication_date=1996; citation_pages=771-779; citation_doi=10.1016/0031-3203(95)00119-0; citation_id=CR10
citation_journal_title=Pattern Recogn.; citation_title=Towards a system for automatic facial feature detection; citation_author=G. Chow, X. Li; citation_volume=26; citation_issue=12; citation_publication_date=1993; citation_pages=1739-1755; citation_doi=10.1016/0031-3203(93)90173-T; citation_id=CR11
citation_journal_title=CVGIP: Image Underst.; citation_title=Labeling of human face components from range data; citation_author=Y. Yacoob, L.S. Davis; citation_volume=60; citation_issue=2; citation_publication_date=1994; citation_pages=168-178; citation_doi=10.1006/ciun.1994.1045; citation_id=CR12
Morimoto, C.H., Flickner, M.: Real time multiple face detection using active illumination. In: 4th IEEE International Conference on Automatic Face and Gesture Recognition, p. 8 (2000)
Smeraldi, F., Carmona, O., Bigün, J.: Saccadic search with Gabor features applied to eye detection and real-time head tracking. Image Vis. Comput. 18
citation_journal_title=IEEE Trans. Pattern Anal. Mach. Intell.; citation_title=Face detection in color images; citation_author=R.-L. Hsu, M. Abdel-Mottsleb; citation_volume=24; citation_issue=5; citation_publication_date=2002; citation_pages=686-706; citation_id=CR15
citation_journal_title=Int. J. Comp. Vis.; citation_title=Feature extraction from faces using deformable templates; citation_author=A.L. Yuille, P.W. Hallinan, D.S. Cohen; citation_volume=8; citation_issue=2; citation_publication_date=1992; citation_pages=99-111; citation_doi=10.1007/BF00127169; citation_id=CR16
Huang, W., Sun, Q., Lam, C.-P., Wu, J.-K.: A robust approach to face and eyes detection from image with cluttered background. In: International Conference Pattern Recognition, vol. 1, pp. 110–114 (1998)
Ding, L., Martinez, A.: Precise detailed detection of faces and facial features. In: IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2008, pp. 1–7 (2008)
Bala, L.-P., Talmi, K., Liu, J.: Automatic detection and tracking of faces and facial features in video. In: Picture Coding Symposium, pp. 251–256 (1997)
citation_journal_title=Signal Process. Image Commun.; citation_title=A novel method for automatic face segmentation, facial feature extraction and tracking; citation_author=K. Sobottka, I. Pitas; citation_volume=12; citation_issue=3; citation_publication_date=1998; citation_pages=263-281; citation_doi=10.1016/S0923-5965(97)00042-8; citation_id=CR20
Feyrer, S., Zell, A.: Detection, tracking and pursuit of humans with autonomous mobile robot. In: Proceedings of International Conference on Intelligent Robots and Systems, Kyongju, Korea, pp. 864–869 (1999)
citation_journal_title=Pattern Recogn.; citation_title=Facial feature extraction and determination of pose; citation_author=A. Nikolaidis, I. Pitas; citation_volume=33; citation_publication_date=2000; citation_pages=1783-1791; citation_doi=10.1016/S0031-3203(99)00176-4; citation_id=CR22
citation_journal_title=Image Vis. Comput.; citation_title=Nouse ’use your nose as a mouse’ perceptual vision technology for hands-free games and interfaces; citation_author=D.O. Gorodnichy, G. Roth; citation_volume=22; citation_issue=12; citation_publication_date=2004; citation_pages=931-942; citation_doi=10.1016/j.imavis.2004.03.021; citation_id=CR23
Horprasert, T., Yacoob, Y., Davis, L.: Computing 3-d head orientation from a monocular image sequence. In: Proceedings International Conference Automatic Face and Gesture Recognition, Killington, Vermont, USA, pp. 242–247 (1996)
Rabie, A., Lang, C., Hanheide, M., Castrillón, M., Sagerer, G.: Automatic initialization for facial analysis in interactive robotics. In: 6th International Conference on Computer Vision Systems, Vision for Cognitive Systems, pp. 517–526 (2008)
Castrillón Santana, M., Déniz Suárez, O., Hernández Tejera, M., Guerra Artal, C.: ENCARA2: Real-time detection of multiple faces at different resolutions in video streams. J. Vis. Commun. Image Represent. pp. 130–140 (2007)
Lin, K., Huang, J., Chen, J., Zhou, C.: Real-time eye detection in video streams. In: Fourth International Conference on Natural Computation, pp. 193–197 (2008)
Ren, X., Song, J., Ying, H., Zhu, Y., Qiu, X.: Robust nose detection and tracking using gentleboost and improved Lucas–Kanade optical flow algorithms. Lecture Notes in Computer Science: Advanced Intelligent Computing Theories and Applications. With Aspects of Theoretical and Methodological Issues, vol. 4681, pp. 1240–1246 (2007)
Liang, L., Liu, X., Pi, X., Zhao, Y., Nefian, A.V.: Speaker independent audio-visual continuous speech recognition. In: International Conference on Multimedia and Expo, pp. 25–28 (2002)
citation_journal_title=Comp. Vis. Image Underst.; citation_title=Face detection: A survey; citation_author=E. Hjelmas, B.K. Low; citation_volume=83; citation_issue=3; citation_publication_date=2001; citation_pages=236-274; citation_doi=10.1006/cviu.2001.0921; citation_id=CR30
citation_journal_title=Trans. Pattern Anal. Mach. Intell.; citation_title=Detecting faces in images: A survey; citation_author=M.-H. Yang, D. Kriegman, N. Ahuja; citation_volume=24; citation_issue=1; citation_publication_date=2002; citation_pages=34-58; citation_doi=10.1109/34.982883; citation_id=CR31
Intel, Intel Open Source Computer Vision Library, v1.1ore,
http://sourceforge.net/projects/opencvlibrary/
(October 2008)
Hewitt, R.: Seeing with opencv. a computer-vision library, Servo, pp. 62–65 (2007)
Lienhart, R., Liang, L., Kuranov, A.: A detector tree of boosted classifiers for real-time object detection and tracking. In: IEEE ICME2003, pp. 277–280 (2003)
citation_journal_title=J. Comput. Sci. Coll.; citation_title=Facial feature detection using haar classifiers; citation_author=P.I. Wilson, J. Fernandez; citation_volume=21; citation_publication_date=2006; citation_pages=127-133; citation_id=CR35
Bradley, D.: Profile face detection.
http://www.davidbradley.info/publications/bradley-iurac-03.swf
, last accessed 5/11/2007 (2003)
Reimondo. A.: Haar cascades repository,
http://alereimondo.no-ip.org/OpenCV/34
(2007)
Kruppa, H., Castrillón Santana, M., Schiele, B.: Fast and robust face finding via local context. In: Joint IEEE International Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance (VS-PETS), pp. 157–164 (2003)
Yu, S.: Tree-based 20 × 20 eye detectors,
http://yushiqi.cn/research/eyedetection
(2009)
Wimmer, M.: Eyefinder,
http://www9.cs.tum.edu/people/wimmerm/se/project.eyefinder/
, last accesed 5/11/2007 (2004)
Urtho, Eye detector,
http://face.urtho.net/
, last accesed 5/9/2007 (2006)
Shan, T.: Security and surveillance,
http://www.itee.uq.edu.au/~sas/people.htm
(2008)
Beumer, G., Tao, Q., Bazen, A., Veldhuis, R.: A landmark paper in face recognition. In: 7th International Conference on Automatic Face and Gesture Recognition, vol. 78, 2006. FGR 2006, IEEE Computer Society Press, Southampton (2006)
Hameed, S.: Eye cascade,
http://umich.edu/~shameem
(October 2008)
Bediz, Y., Akar, G.B.: View point tracking for 3d display systems. In: 3th European Signal Processing Conference, EUSIPCO-2005, (2005)
citation_journal_title=IEEE Trans. Pattern Anal. Mach. Intell.; citation_title=Example-based learning for view-based human face detection; citation_author=K.-K. Sung, T. Poggio; citation_volume=20; citation_issue=1; citation_publication_date=1998; citation_pages=39-51; citation_doi=10.1109/34.655648; citation_id=CR46
citation_journal_title=IEEE Trans. Pattern Anal. Machine Intell.; citation_title=Neural network-based face detection; citation_author=H.A. Rowley, S. Baluja, T. Kanade; citation_volume=20; citation_issue=1; citation_publication_date=1998; citation_pages=23-38; citation_doi=10.1109/34.655647; citation_id=CR47
Carnegie Mellon University, CMU/VACS image database: Frontal face images,
http://vasc.ri.cmu.edu/idb/html/face/frontal_images/index.html
, last accesed 5/11/2007 (1999)
citation_journal_title=IEEE Trans PAMI; citation_title=Eigenfaces vs. Fisherfaces: recognition using class specific linear projection; citation_author=P. Belhumeur, J. Hespanha, D. Kriegman; citation_volume=19; citation_issue=7; citation_publication_date=1997; citation_pages=711-720; citation_id=CR49
citation_title=Labeled faces in the wild: A database for studying face recognition in unconstrained environments, Tech. Rep. 07-49; citation_publication_date=2007; citation_id=CR50; citation_author=G.B. Huang; citation_author=M. Ramesh; citation_author=T. Berg; citation_author=E. Learned-Miller; citation_publisher=University of Massachusetts
Jesorsky, O., Kirchberg, K.J., Frischholz, R. W.: Robust face detection using the Hausdorff distance, Lecture Notes in Computer Science. Procs. of the Third International Conference on Audio- and Video-Based Person Authentication 2091, 90–95 (2001)