Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Biểu diễn phân biệt thưa cho nhận diện khuôn mặt
Tóm tắt
Gần đây, phương pháp Phân loại dựa trên Biểu diễn Thưa (Sparse Representation Classification - SRC) đã đạt được những thành công lớn trong nhận diện khuôn mặt. Trong SRC, hình ảnh thử nghiệm được kỳ vọng sẽ được biểu diễn tốt nhất dưới dạng tổ hợp tuyến tính thưa của các hình ảnh huấn luyện từ cùng một lớp, và độ chính xác của việc biểu diễn được đo bằng chuẩn ℓ
2 hoặc chuẩn ℓ
1 của phần dư mã hóa. Tuy nhiên, SRC quá nhấn mạnh vào tính thưa và bỏ qua thông tin không gian trong quá trình mã hóa đặc trưng địa phương, điều này đã được chứng minh là rất quan trọng trong các vấn đề nhận diện khuôn mặt trong thế giới thực. Ngoài ra, một số công trình nghiên cứu xem xét thông tin không gian nhưng lại bỏ qua khả năng phân biệt khác nhau ở các vùng khuôn mặt khác nhau. Trong bài báo này, chúng tôi đề xuất việc cân nhắc các vị trí không gian dựa trên khả năng phân biệt của chúng trong mã hóa thưa để nhận diện khuôn mặt mạnh mẽ. Cụ thể, chúng tôi học các trọng số tại các vị trí khuôn mặt dựa trên độ đo thông tin tác dụng trong từng vùng khuôn mặt, nhằm làm nổi bật những vị trí trong hình ảnh khuôn mặt quan trọng cho việc phân loại. Hơn nữa, để xây dựng trọng số mạnh mẽ nhằm khai thác tối đa thông tin cấu trúc của từng vùng khuôn mặt, chúng tôi đã sử dụng dữ liệu bên ngoài để học các trọng số có thể bao trùm tất cả các biến thể hình ảnh khuôn mặt khác nhau của các đối tượng khác nhau, do đó tính mạnh mẽ của các trọng số thu được có thể được đảm bảo. Cuối cùng, chúng tôi xem xét cấu trúc nhóm của các hình ảnh huấn luyện (tức là những hình ảnh từ cùng một đối tượng) và thêm một ràng buộc chuẩn ℓ
2,1 (nhóm Lasso) vào việc hình thành, điều này tăng cường tính thưa ở mức độ nhóm. Các thí nghiệm rộng rãi trên ba tập dữ liệu khuôn mặt chuẩn cho thấy phương pháp mà chúng tôi đề xuất mạnh mẽ và hiệu quả hơn nhiều so với các phương pháp cơ bản trong việc xử lý sự che khuất khuôn mặt, hư hại, thay đổi ánh sáng và biểu cảm, v.v.
Từ khóa
#Biểu diễn thưa #Nhận diện khuôn mặt #Tính phân biệt #Thông tin không gian #Phân loạiTài liệu tham khảo
Ahonen T, Hadid A, Pietikäinen M (2004) Face recognition with local binary patterns. In: ECCV 2004. Springer, pp 469–481
Belhumeur PN, Hespanha JP, Kriegman D (1997) Eigenfaces vs. fisherfaces: Recognition using class specific linear projection. IEEE Trans Pattern Anal Mach Intell 19(7):711–720
Chai Z, Mendez-Vazquez H, He R, Sun Z, Tan T (2013) Semantic pixel sets based local binary patterns for face recognition. In: ACCV. Springer, pp 639–651
Cover TM, Thomas JA (2012) Elements of information theory. Wiley
Gao S, Tsang IW, Chia LT, Zhao P (2010) Local features are not lonely–laplacian sparse coding for image classification. In: 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, pp 3555–3561
Gao S, Tsang IWH, Chia LT (2010) Kernel sparse representation for image classification and face recognition. In: ECCV 2010. Springer, pp 1–14
Georghiades AS, Belhumeur PN, Kriegman D (2001) From few to many: Illumination cone models for face recognition under variable lighting and pose. IEEE Trans Pattern Anal Mach Intell 23(6): 643–660
He X, Niyogi P (2004) Locality preserving projections. In: Advances in Neural Information Processing Systems, pp 153–160
He X, Yan S, Hu Y, Niyogi P, Zhang HJ (2005) Face recognition using laplacianfaces. IEEE Trans Pattern Anal Mach Intell 27(3):328–340
Ji S, Xue Y, Carin L (2008) Bayesian compressive sensing. IEEE Trans Signal Process 56(6):2346–2356
Liu Y, Wu F, Zhang Z, Zhuang Y, Yan S (2010) Sparse representation using nonnegative curds and whey. In: 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE , pp 3578–3585
Martinez AM (1998) The ar face database. CVC Technical Report 24
Peng Y, Ganesh A, Wright J, Xu W, Ma Y (2012) Rasl: Robust alignment by sparse and low-rank decomposition for linearly correlated images. IEEE Trans Pattern Anal Mach Intell 34(11):2233–2246
Quanz B, Huan J, Mishra M (2012) Knowledge transfer with low-quality data: A feature extraction issue. IEEE Trans Knowl Data Eng 24(10):1789–1802
Ramirez I, Sapiro G (2010) Universal sparse modeling. Tech. rep., DTIC Document
Samaria FS, Harter AC (1994) Parameterisation of a stochastic model for human face identification. In: Proceedings of the Second IEEE Workshop on Applications of Computer Vision, 1994. IEEE , pp 138–142
Wang J, Yang J, Yu K, Lv F, Huang T, Gong Y (2010) Locality-constrained linear coding for image classification. In: 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, pp 3360–3367
Wright J, Ma Y (2010) Dense error correction via ℓ 1-minimization. IEEE Trans Inf Theory 56(7): 3540–3560
Wright J, Yang AY, Ganesh A, Sastry SS, Ma Y (2009) Robust face recognition via sparse representation. IEEE Trans Pattern Anal Mach Intell 31 (2):210–227
Yang J, Yu K, Gong Y, Huang T (2009) Linear spatial pyramid matching using sparse coding for image classification. In: IEEE Conference on Computer Vision and Pattern Recognition, 2009. IEEE , pp 1794–1801
Yang M, Zhang D, Yang J (2011) Robust sparse coding for face recognition. In: 2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, pp 625–632
Yang M, Zhang L, Yang J, Zhang D (2013) Regularized robust coding for face recognition. IEEE Trans Image Process 22(5):1753–1766
Zhang C, Wang S, Huang Q, Liu J, Liang C, Tian Q (2013) Image classification using spatial pyramid robust sparse coding. Pattern Recogn Lett 34(9):1046–1052
Zhang D, Yang M, Feng X (2011) Sparse representation or collaborative representation: Which helps face recognition?. In: 2011 IEEE International Conference on Computer Vision. IEEE, pp 471–478
Zheng M, Bu J, Chen C, Wang C, Zhang L, Qiu G, Cai D (2011) Graph regularized sparse coding for image representation. IEEE Trans Image Process 20(5):1327–1336
