Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
PARAMAP và Isomap: So Sánh Hai Thuật Toán Biểu Diễn Phi Tuyến
Tóm tắt
Các kỹ thuật giảm chiều được sử dụng để đại diện cho dữ liệu nhiều chiều bằng một cấu trúc chiều thấp có ý nghĩa và tiết kiệm hơn. Trong bài báo này, chúng tôi sẽ nghiên cứu hai phương pháp như vậy, đó là Bản đồ tham số của Carroll (viết tắt là PARAMAP) (Shepard và Carroll, 1966) và Bản đồ đồng dạng của Tenenbaum (viết tắt là Isomap) (Tenenbaum, de Silva, và Langford, 2000). Phương pháp đầu tiên dựa vào việc tối ưu hóa lặp lại một hàm chi phí, trong khi phương pháp thứ hai áp dụng MDS cổ điển sau một bước tiền xử lý liên quan đến việc sử dụng thuật toán đường đi ngắn nhất để xác định các khoảng cách địa chất xấp xỉ. Chúng tôi sẽ phát triển một chỉ số về tính đồng nhất dựa trên việc bảo tồn cấu trúc cục bộ giữa dữ liệu đầu vào và nhúng chiều thấp được ánh xạ, và so sánh các phương pháp khác nhau trên nhiều tập dữ liệu khác nhau, bao gồm các điểm nằm trên bề mặt của một hình cầu, một số dữ liệu được gọi là "dữ liệu Swiss Roll", và các hình cầu cắt ngắn.
