Ma trận cơ bản: Lý thuyết, thuật toán và phân tích độ ổn định

Springer Science and Business Media LLC - Tập 17 - Trang 43-75 - 1996
Quan-Tuan Luong1, Olivier D. Faugeras1
1I.N.R.I.A., Sophia-Antipolis, France

Tóm tắt

Trong bài báo này, chúng tôi phân tích chi tiết hình học của một cặp camera, tức là một thiết lập stereo. Trái ngược với những gì đã được thực hiện trong quá khứ và vẫn đang được sử dụng hiện nay, chẳng hạn như trong phân tích stereo hoặc chuyển động, chúng tôi không giả định rằng các tham số nội tại của các camera là đã biết (tọa độ của các điểm chính, tỷ lệ pixel và tiêu cự). Điều này quan trọng vì hai lý do. Thứ nhất, nó thực tế hơn trong các ứng dụng mà các tham số này có thể thay đổi tùy theo nhiệm vụ (thị giác chủ động). Thứ hai, trường hợp tổng quát mà chúng tôi xem xét ở đây, nắm bắt tất cả thông tin liên quan cần thiết để thiết lập sự tương ứng giữa hai cặp hình ảnh. Thông tin này về cơ bản là về chiếu và được ẩn giấu một cách gây nhầm lẫn trong định dạng thường được sử dụng của ma trận Essential được giới thiệu bởi Longuet-Higgins (1981). Bài báo này làm rõ bản chất về chiếu của vấn đề tương ứng trong stereo và cho thấy rằng hình học epipolar có thể được tóm tắt trong một ma trận 3×3 có hạng 2 mà chúng tôi đề xuất gọi là ma trận cơ bản. Sau phân tích lý thuyết này, chúng tôi bắt đầu nhiệm vụ ước lượng ma trận cơ bản từ các sự tương ứng điểm, một nhiệm vụ có tầm quan trọng thực tiễn. Chúng tôi phân tích lý thuyết và so sánh thực nghiệm sử dụng dữ liệu tổng hợp và thực tế, nhiều phương pháp ước lượng khác nhau. Vấn đề về độ ổn định của việc ước lượng được nghiên cứu từ hai góc độ bổ sung. Đầu tiên, chúng tôi chỉ ra rằng có một mối quan hệ thú vị giữa ma trận cơ bản và các mặt phẳng ba chiều gây ra các homography giữa các hình ảnh và tạo ra sự không ổn định trong các quy trình ước lượng. Thứ hai, chúng tôi chỉ ra một mối quan hệ sâu sắc giữa sự không ổn định của quy trình ước lượng và sự hiện diện trong cảnh các bề mặt gọi là bề mặt quan trọng đã được nghiên cứu trong bối cảnh phân tích chuyển động. Cuối cùng, chúng tôi kết luận bằng việc nhấn mạnh rằng chúng tôi tin rằng ma trận cơ bản sẽ đóng một vai trò quan trọng trong các ứng dụng tương lai của Thị giác máy tính ba chiều bằng cách tăng cường tính linh hoạt, độ ổn định và do đó khả năng áp dụng vào các vấn đề thực tế khó khăn.

Từ khóa

#ma trận cơ bản #hình học stereo #ước lượng #thị giác máy tính ba chiều #ổn định

Tài liệu tham khảo

Coxeter, H.S.M. 1987. Projective Geometry. Springer Verlag (Second Edition).

Daniilidis, K. 1992. Zur Fehlerempfindlichkeit in der Ermittlung von Objektbeschreibungen und relativen Bewegugen aus monokularen Bildfolgen. Ph.D. Thesis, University of Karsruhe.

Faugeras, O.D. and Lustman, F. 1988. Motion and structure from motion in a piecewise planar environment. International Journal of Pattern Recognition and Artificial Intelligence, 2(3):485–508.

Faugeras, O.D., Lustman, F., and Toscani, G. 1987. Motion and structure from point and line matches. In Proc. International Conference on Computer Vision, pp. 25–34.

Faugeras, O.D. and Toscani, G. 1986. The calibration problem for stereo. In Proceedings of CVPR'86, pp. 15–20.

Gros, P. and Quan, L. 1993. 3D projective invariants from two images. In Geometric Methods in Computer Vision II, SPIE Optical Instrumentation and Applied Science, San Diego.

Hartley, R.I. 1993. Cheirality invariants. In Proc. DARPA Image Understanding Workshop, University of Maryland, pp. 745–753.

Kanatani, K. 1991. Computational projective geometry. Computer Vision, Graphics, and Image Processing. Image Understanding, 54(3).

Lee, C.H. 1991. Time-varying images: the effect of finite resolution on uniqueness. Computer Vision, Graphics, and Images Processing. Image Understanding, 54(3):325–332.

Longuet-Higgins, C. 1984. The reconstruction of a scene from two projections: configurations that defeat the 8-point algorithm. In Proc. 1st Conf. on Artificial Intelligence Applications, Denver, pp. 395–397.

Luong, Q.-T. 1992. Matrice fondamentale et auto-calibration en vision par ordinateur. Ph.D. Thesis, Universite de Paris-Sud, Orsay.

Luong, Q.-T. and Faugeras, O.D. 1993a. Camera calibration, scene motion and structure recovery from point correspondences and fundamental matrices. Submitted to IJCV.

Luong, Q.-T. and Faugeras, O.D. 1994. Stratified projective motion analysis: Fundamental matrix and self-calibration. In preparation.

Luong, Q.-T. and Vieville, T. 1994. Canonical representations for the geometries of multiple projective views. CVGIP: image understanding. To appear.

Mitiche, A., Zhuang, X., and Haralick, R. 1987. Interpretation of optical flow by rotation decoupling. In Proc IEEE Workshop on Computer Vision, Miami Beach, FL, pp. 195–200.

Mundy, J.L. and Zisserman, A. (Eds.) 1992, Geometric Invariance in Computer Vision. MIT Press.

Mundy, J., Welty, R.P., Brill, M.H., Payton, P.M., and Barrett. 1992. 3-D model alignment without computing pose. In Proc. DARPA Image Understanding Workshop, San Mateo, CA, pp. 727–735.

Nishimura, E., Xu, G., and Tsuji, S. 1993. Motion segmentation and correspondence using epipolar constraint. In Proc. 1st Asian Conf. Computer Vision, Osaka, Japan, pp. 199–204.

Robert, L. 1993. Reconstruction de Courbs et de Surfaces par Vision Stéréoscopique. Applications a la Robotique Mobile. Ph.D. Thesis, Ecole Polytechnique.

Semple, J.G. and Kneebone, G.T. 1952. Algebraic Projective Geometry. Clarendon Press: Oxford. Reprinted 1979.

Viéville, T. and Sander, P. 1992. Using pseudo kalman-filters in the presence of constraints. Technical Report RR-1669, INRIA.