Bộ xử lý đầu vào dựa trên cấu trúc hình chóp cho các ứng dụng thị giác động

Proceedings of the IEEE - Tập 90 Số 7 - Trang 1188-1200 - 2002
P.J. Burt1
1Sarnoff Corporation, Princeton, NJ, USA

Tóm tắt

Các nhiệm vụ thị giác thời gian thực như lái xe tự động yêu cầu một sức mạnh tính toán rất lớn, tuy nhiên các hệ thống thị giác thực tế cần phải gọn nhẹ và có chi phí thấp. Tôi đề xuất rằng các hệ thống như vậy có thể được phân chia thành hai giai đoạn tính toán, cho "xử lý đầu vào" và "diễn giải cấp cao," và rằng mỗi giai đoạn này có thể được thực hiện như một mạch tích hợp đơn hoặc một số mạch tích hợp nhỏ. Hai giai đoạn này khác nhau về đại diện dữ liệu và kiến trúc tính toán: Giai đoạn đầu vào hoạt động trên dữ liệu hình ảnh đã được lấy mẫu và các phép toán của nó được thực hiện trên một bộ xử lý được tối ưu cho xử lý tín hiệu. Giai đoạn cấp cao hoạt động trên dữ liệu hình ảnh trừu tượng và biểu tượng và các phép toán của nó được thực hiện trên một bộ vi xử lý đa năng. Trong bài báo này, tôi mô tả một kiến trúc "đường ống phân đoạn" cho xử lý đầu vào và một thực hiện bộ xử lý ở mức chip. Bộ xử lý đầu vào cho thị giác này được thiết kế để hỗ trợ các chức năng thị giác ban đầu, chẳng hạn như tăng cường đặc trưng và phân tích chuyển động cũng như phân tích stereo, cho một loạt các ứng dụng thị giác động năng động. Phương pháp này sử dụng có hệ thống một khung hình chóp đa độ phân giải để đạt được hiệu quả tính toán cao, tính bền vững và độ chính xác.

Từ khóa

#Computer architecture #Real time systems #Computer vision #Machine vision #Costs #Circuits #Signal processing #High performance computing #Microprocessors #Image segmentation

Tài liệu tham khảo

bergen, 1992, hierarchical model-based motion estimation, Proc Eur Conf Computer Vision, 237 10.1109/ACV.1994.341288 10.1109/ICCV.1993.378222 burt, 1983, a multiresolution spline with applications to image mosaics, ACM Transactions on Graphics, 2, 217, 10.1145/245.247 burt, 1983, multi-resolution flow-through motion analysis, Proc IEEE Conf Computer Vision and Pattern Recognition, 246 mandelbaum, 2000 wildes, 2000, qualitative spatiotemporal analysis using an oriented energy representation, Proc Eur Conf Computer Vision, 768 anderson, 1985, change detection and tracking using pyramid transform techniques, Proc SPIE Conf Intelligent Robotics and Computer Vision, 72 10.1109/ICPR.1990.119374 10.1007/BF00055150 10.1109/TC.1978.1675108 10.1109/ACV.1998.732887 10.1109/CVPR.1988.196228 10.1109/WVM.1989.47088 10.1109/TCOM.1983.1095851 wolberg, 1990, Digital Image Warping 10.1016/S0004-3702(98)00071-X hwang, 1984, Computer Architecture and Parallel Processing burt, 1997, Reconstruction From the FSD Laplacian Pyramid 10.1109/ISIC.1998.713795 10.1007/BF00836281 10.1109/CAMP.2000.875956