Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Bộ xử lý đầu vào dựa trên cấu trúc hình chóp cho các ứng dụng thị giác động
Tóm tắt
Các nhiệm vụ thị giác thời gian thực như lái xe tự động yêu cầu một sức mạnh tính toán rất lớn, tuy nhiên các hệ thống thị giác thực tế cần phải gọn nhẹ và có chi phí thấp. Tôi đề xuất rằng các hệ thống như vậy có thể được phân chia thành hai giai đoạn tính toán, cho "xử lý đầu vào" và "diễn giải cấp cao," và rằng mỗi giai đoạn này có thể được thực hiện như một mạch tích hợp đơn hoặc một số mạch tích hợp nhỏ. Hai giai đoạn này khác nhau về đại diện dữ liệu và kiến trúc tính toán: Giai đoạn đầu vào hoạt động trên dữ liệu hình ảnh đã được lấy mẫu và các phép toán của nó được thực hiện trên một bộ xử lý được tối ưu cho xử lý tín hiệu. Giai đoạn cấp cao hoạt động trên dữ liệu hình ảnh trừu tượng và biểu tượng và các phép toán của nó được thực hiện trên một bộ vi xử lý đa năng. Trong bài báo này, tôi mô tả một kiến trúc "đường ống phân đoạn" cho xử lý đầu vào và một thực hiện bộ xử lý ở mức chip. Bộ xử lý đầu vào cho thị giác này được thiết kế để hỗ trợ các chức năng thị giác ban đầu, chẳng hạn như tăng cường đặc trưng và phân tích chuyển động cũng như phân tích stereo, cho một loạt các ứng dụng thị giác động năng động. Phương pháp này sử dụng có hệ thống một khung hình chóp đa độ phân giải để đạt được hiệu quả tính toán cao, tính bền vững và độ chính xác.
Từ khóa
#Computer architecture #Real time systems #Computer vision #Machine vision #Costs #Circuits #Signal processing #High performance computing #Microprocessors #Image segmentationTài liệu tham khảo
bergen, 1992, hierarchical model-based motion estimation, Proc Eur Conf Computer Vision, 237
10.1109/ACV.1994.341288
10.1109/ICCV.1993.378222
burt, 1983, a multiresolution spline with applications to image mosaics, ACM Transactions on Graphics, 2, 217, 10.1145/245.247
burt, 1983, multi-resolution flow-through motion analysis, Proc IEEE Conf Computer Vision and Pattern Recognition, 246
mandelbaum, 2000
wildes, 2000, qualitative spatiotemporal analysis using an oriented energy representation, Proc Eur Conf Computer Vision, 768
anderson, 1985, change detection and tracking using pyramid transform techniques, Proc SPIE Conf Intelligent Robotics and Computer Vision, 72
10.1109/ICPR.1990.119374
10.1007/BF00055150
10.1109/TC.1978.1675108
10.1109/ACV.1998.732887
10.1109/CVPR.1988.196228
10.1109/WVM.1989.47088
10.1109/TCOM.1983.1095851
wolberg, 1990, Digital Image Warping
10.1016/S0004-3702(98)00071-X
hwang, 1984, Computer Architecture and Parallel Processing
burt, 1997, Reconstruction From the FSD Laplacian Pyramid
10.1109/ISIC.1998.713795
10.1007/BF00836281
10.1109/CAMP.2000.875956