Giải pháp ứng dụng mạng học sâu nén và phân đoạn ngữ nghĩa cho bản đồ đám mây điểm LiDAR

Journal of Military Science and Technology - Số IITE - Trang 131-138 - 2025
Bui Thi Thanh Tam1, Cao Van Toan1, Phan Huy Anh1, Pham Van Quoc2, Pham Dang Duong2
1Institute of Information Technology and Electronics, Academy of Military Science and Technology
2HUS High School for Gifted Students of Science, VNU University of Science

Tóm tắt

 Việc điều hướng các thiết bị bay không người lái (UAV) trong môi trường không có tín hiệu GNSS thường dựa vào các bản đồ LiDAR được xây dựng sẵn. Tuy nhiên, dung lượng bộ nhớ lớn và độ phức tạp tính toán cao của các bản đồ đám mây điểm này đặt ra những thách thức đáng kể cho các UAV có tài nguyên hạn chế. Bài báo này đề xuất một giải pháp học sâu sử dụng kiến trúc RandLA-Net gọn nhẹ để nén và phân đoạn ngữ nghĩa hiệu quả các bản đồ này. Kết quả cho thấy giải pháp đề xuất giúp giảm về dung lượng mô hình và tập dữ liệu, trong khi vẫn duy trì độ chính xác phân đoạn tương đương với mô hình RandLA-Net cơ sở, qua đó đưa ra một giải pháp khả thi cho việc xử lý thời gian thực trên thiết bị trong các hệ thống nhúng.

Từ khóa

#Deep learning #Localization and navigation; Point cloud; LiDAR; Semantic segmentation.

Tài liệu tham khảo

[1]. Chang, Y., “A Review of UAV Autonomous Navigation in GPS-Denied Environments,” Robotics and Autonomous Systems, Vol. 170, p. 104533 (2023).

[2]. Meng, H.-Y., “VV-Net: Voxel VAE Net with Group Convolutions,” in IEEE/CVF International Conference on Computer Vision (ICCV) (2019).

[3]. Guibas, H. T., “KPConv: Flexible and Deformable Convolution for Point Clouds,” in IEEE/CVF International Conference on Computer Vision (ICCV), Seoul (2019).

[4]. Hu, Q., “RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA (2020).

[5]. Yang, B., “PIXOR: Real-Time 3D Object Detection from Point Clouds,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2018).

[6]. Qi, C. R., “PointNet: Deep Learning on Point Sets for 3D Classification,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2017).

[7]. Qi, C. R., “PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space,” in Advances in Neural Information Processing Systems (NeurIPS) (2017).

[8]. Landrieu, L., “Large-Scale Point Cloud Semantic Segmentation with Superpoint Graphs,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2018).

[9]. Armeni, I., “Joint 2D-3D-Semantic Data for Indoor Scene Understanding,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2017).