Huaibo Huang1,2,3, Aijing Yu1,2,3, Zhenhua Chai4, Ran He1,5,2,3, Tieniu Tan1,5,2,3
1National Laboratory of Pattern Recognition, CASIA, Beijing, China
2Center for Research on Intelligent Perception and Computing, CASIA, Beijing, China
3School of Artificial Intelligence, University of Chinese Academy of Sciences, Beijing, China
4Vision Intelligence Center, AI Platform, Meituandianping Group, Beijing, China
5Center for Excellence in Brain Science and Intelligence Technology, CAS, Beijing, China
Tóm tắt
Việc khôi phục hình ảnh sạch từ một hình ảnh có mưa được gọi là khôi phục hình ảnh đơn trong điều kiện mưa. Các phương pháp hiện nay đã sử dụng các kỹ thuật học sâu để loại bỏ mưa khỏi hình ảnh đơn bằng cách tận dụng một số thông tin trước đó. Tuy nhiên, do sự đa dạng về hình thức của các vệt mưa và sự tích tụ, rất khó để phân tách thông tin mưa và nền trong không gian nhúng, điều này dẫn đến việc khôi phục không chính xác. Để giải quyết vấn đề này, bài báo này đề xuất một phương pháp học tập lựa chọn wavelet attention bằng cách học một loạt bản đồ wavelet attention để hướng dẫn việc phân tách thông tin mưa và nền trong cả không gian và miền tần số. Khía cạnh chính của phương pháp của chúng tôi là sử dụng biến đổi wavelet để học nội dung và cấu trúc của các đặc trưng có mưa vì các đặc trưng tần số cao nhạy hơn với sự suy giảm do mưa, trong khi các đặc trưng tần số thấp giữ lại nhiều nội dung nền hơn. Trước tiên, chúng tôi phát triển một mạng mã hóa - giải mã wavelet attention chọn lọc để học các bản đồ wavelet attention hướng dẫn sự phân tách giữa các đặc trưng có mưa và nền ở nhiều thang đo khác nhau. Trong khi đó, chúng tôi giới thiệu định hình wavelet và không định hình vào mạng mã hóa - giải mã, việc này cho thấy sự vượt trội trong việc học các biểu diễn ngày càng trừu tượng trong khi vẫn giữ lại các chi tiết nền. Ngoài ra, chúng tôi đề xuất việc học căn chỉnh tiềm ẩn để giám sát các đặc trưng nền cũng như tăng cường dữ liệu đào tạo để cải thiện độ chính xác của việc khôi phục. Cuối cùng, chúng tôi sử dụng một mạng phân biệt phân cấp dựa trên wavelet attention chọn lọc để cải thiện tính chân thực hình ảnh của các kết quả được tạo ra cả toàn cục lẫn cục bộ. Các thử nghiệm rộng rãi trên các tập dữ liệu tổng hợp và thực tế chứng minh rằng phương pháp đề xuất đạt được kết quả hấp dẫn hơn cả về định lượng lẫn định tính so với các phương pháp hiện tại tiên tiến nhất.