Đánh giá ảnh hưởng của thiết kế lấy mẫu huấn luyện đến hiệu suất của các bộ phân loại học máy trong lập bản đồ lớp phủ đất sử dụng dữ liệu viễn thám đa thời gian và nền tảng Google Earth Engine

Remote Sensing - Tập 13 Số 8 - Trang 1433
Shobitha Shetty1,2, Prasun Kumar Gupta2, Mariana Belgiu1, S. K. Srivastav2
1Faculty of Geo-Information Science and Earth Observation (ITC), University of Twente, 7500 AE Enschede, the Netherlands
2Indian Institute of Remote Sensing, ISRO, 4 Kalidas Road, Dehradun 248001, India

Tóm tắt

Các bộ phân loại học máy ngày nay đang được sử dụng ngày càng nhiều cho việc lập bản đồ Sử dụng Đất và Phủ Lớp (LULC) từ hình ảnh viễn thám. Tuy nhiên, để chọn đúng bộ phân loại cần phải hiểu các yếu tố chính ảnh hưởng đến hiệu suất của chúng. Nghiên cứu hiện tại đã điều tra trước hết là tác động của thiết kế lấy mẫu huấn luyện đến kết quả phân loại thu được bởi bộ phân loại Random Forest (RF), và thứ hai là so sánh hiệu suất của nó với các bộ phân loại học máy khác cho việc lập bản đồ LULC sử dụng dữ liệu viễn thám vệ tinh đa thời gian và nền tảng Google Earth Engine (GEE). Chúng tôi đã đánh giá tác động của ba phương pháp lấy mẫu, cụ thể là Lấy Mẫu Ngẫu Nhiên Phân Tầng Đều (SRS(Eq)), Lấy Mẫu Ngẫu Nhiên Phân Tầng Theo Tỷ Lệ (SRS(Prop)), và Lấy Mẫu Hệ Thống Phân Tầng (SSS) đến kết quả phân loại thu được bởi mô hình LULC được huấn luyện RF. Kết quả của chúng tôi cho thấy rằng phương pháp SRS(Prop) có lợi cho các lớp lớn đồng thời đạt được độ chính xác tổng thể tốt. Phương pháp SRS(Eq) cung cấp độ chính xác tốt ở cấp độ lớp, ngay cả đối với các lớp thiểu số, trong khi phương pháp SSS hoạt động tốt cho các khu vực có độ biến đổi trong lớp lớn. Để đánh giá hiệu suất của các bộ phân loại học máy, RF vượt trội hơn Cây Phân Loại và Hồi Quy (CART), Máy Vector Hỗ Trợ (SVM), và Máy Vector Liên Quan (RVM) với mức độ tin cậy >95%. Hiệu suất của các bộ phân loại CART và SVM được thấy là tương tự nhau. RVM đạt được kết quả phân loại tốt với số lượng mẫu huấn luyện hạn chế.

Từ khóa

#Lập bản đồ lớp phủ đất #học máy #Random Forest #viễn thám #lấy mẫu phân tầng #Google Earth Engine #Độ chính xác phân loại #dữ liệu đa thời gian

Tài liệu tham khảo

Luan, 2018, Linking greenhouse gas emissions to urban landscape structure: The relevance of spatial and thematic resolutions of land use/cover data, Landsc. Ecol., 33, 1211, 10.1007/s10980-018-0661-9

Roy, 2015, Development of Decadal (1985–1995–2005) Land Use and Land Cover Database for India, Remote Sens., 7, 2401, 10.3390/rs70302401

Jalkanen, 2019, Identification of ecological networks for land-use planning with spatial conservation prioritization, Landsc. Ecol., 35, 353, 10.1007/s10980-019-00950-4

Shalaby, 2007, Remote sensing and GIS for mapping and monitoring land cover and land-use changes in the Northwestern coastal zone of Egypt, Appl. Geogr., 27, 28, 10.1016/j.apgeog.2006.09.004

Lu, 2007, A survey of image classification methods and techniques for improving classification performance, Int. J. Remote Sens., 28, 823, 10.1080/01431160600746456

Khatami, 2016, A meta-analysis of remote sensing research on supervised pixel-based land-cover image classification processes: General guidelines for practitioners and future research, Remote Sens. Environ., 177, 89, 10.1016/j.rse.2016.02.028

Yu, 2014, Meta-discoveries from a synthesis of satellite-based land-cover mapping research, Int. J. Remote Sens., 35, 4573, 10.1080/01431161.2014.930206

Ghimire, 2012, An Evaluation of Bagging, Boosting, and Random Forests for Land-Cover Classification in Cape Cod, Massachusetts, USA, GIScience Remote Sens., 49, 623, 10.2747/1548-1603.49.5.623

Foody, 2004, A relative evaluation of multiclass image classification by support vector machines, IEEE Trans. Geosci. Remote Sens., 42, 1335, 10.1109/TGRS.2004.827257

Nery, T., Sadler, R., Solis-Aulestia, M., White, B., Polyakov, M., and Chalak, M. (2016, January 10–15). Comparing supervised algorithms in Land Use and Land Cover classification of a Landsat time-series. Proceedings of the 2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Beijing, China.

Tso, B., and Mather, P.M. (2009). Classification Methods for Remotely Sensed Data, CRC Press. [2nd ed.].

Friedl, 2002, Global land cover mapping from MODIS: Algorithms and early results, Remote Sens. Environ., 83, 287, 10.1016/S0034-4257(02)00078-0

Lawrence, 2001, Rule-Based Classification Systems Using Classification and Regression Tree (CART) Analysis, Photogramm. Eng. Remote Sens., 67, 1137

Breiman, 2001, Random Forests, Mach. Learn., 45, 5, 10.1023/A:1010933404324

Gislason, 2006, Random Forests for land cover classification, Pattern Recognit. Lett., 27, 294, 10.1016/j.patrec.2005.08.011

Mountrakis, 2011, Support vector machines in remote sensing: A review, ISPRS J. Photogramm. Remote Sens., 66, 247, 10.1016/j.isprsjprs.2010.11.001

Foody, 2006, Training set size requirements for the classification of a specific class, Remote Sens. Environ., 104, 1, 10.1016/j.rse.2006.03.004

Tipping, 2001, Sparse Bayesian Learning and the Relevance Vector Machine, J. Mach. Learn. Res., 1, 211

Pal, 2012, Evaluation of SVM, RVM and SMLR for Accurate Image Classification with Limited Ground Data, IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens., 5, 1344, 10.1109/JSTARS.2012.2215310

Foody, 2008, RVM-Based Multi-Class Classification of Remotely Sensed Data, Int. J. Remote Sens., 29, 1817, 10.1080/01431160701822115

Talukdar, S., Singha, P., Mahato, S., Pal, S., Liou, Y.-A., and Rahman, A. (2020). Land-Use Land-Cover Classification by Machine Learning Classifiers for Satellite Observations—A Review. Remote Sens., 12.

Rostami, M., Kolouri, S., Eaton, E., and Kim, K. (2019). Deep Transfer Learning for Few-Shot SAR Image Classification. Remote Sens., 11.

Bejiga, M.B., Melgani, F., and Beraldini, P. (2019). Domain Adversarial Neural Networks for Large-Scale Land Cover Classification. Remote Sens., 11.

Heydari, 2018, Effect of classifier selection, reference sample size, reference class distribution and scene heterogeneity in per-pixel classification accuracy using 26 Landsat sites, Remote Sens. Environ., 204, 648, 10.1016/j.rse.2017.09.035

Jin, 2014, Assessing the impact of training sample selection on accuracy of an urban classification: A case study in Denver, Colorado, Int. J. Remote Sens., 35, 2067, 10.1080/01431161.2014.885152

Minasny, 2007, The variance quadtree algorithm: Use for spatial sampling design, Comput. Geosci., 33, 383, 10.1016/j.cageo.2006.08.009

Beuchle, 2015, Land cover changes in the Brazilian Cerrado and Caatinga biomes from 1990 to 2010 based on a systematic remote sensing sampling approach, Appl. Geogr., 58, 116, 10.1016/j.apgeog.2015.01.017

Montanari, 2012, The use of scaled semivariograms to plan soil sampling in sugarcane fields, Precis. Agric., 13, 542, 10.1007/s11119-012-9265-6

Stein, 1998, Constrained Optimization of Spatial Sampling using Continuous Simulated Annealing, J. Environ. Qual., 27, 1078, 10.2134/jeq1998.00472425002700050013x

Chen, 2013, Even sampling designs generation by efficient spatial simulated annealing, Math. Comput. Model., 58, 670, 10.1016/j.mcm.2011.10.035

Gorelick, 2017, Google Earth Engine: Planetary-scale geospatial analysis for everyone, Remote Sens. Environ., 202, 18, 10.1016/j.rse.2017.06.031

Midekisa, A., Holl, F., Savory, D.J., Andrade-Pacheco, R., Gething, P.W., Bennett, A., and Sturrock, H.J.W. (2017). Mapping land cover change over continental Africa using Landsat and Google Earth Engine cloud computing. PLoS ONE, 12.

Hansen, 2013, High-resolution global maps of 21st-century forest cover change, Science, 342, 850, 10.1126/science.1244693

Goldblatt, R., You, W., Hanson, G., and Khandelwal, A.K. (2016). Detecting the Boundaries of Urban Areas in India: A Dataset for Pixel-Based Image Classification in Google Earth Engine. Remote Sens., 8.

Patel, 2015, Multitemporal settlement and population mapping from Landsat using Google Earth Engine, Int. J. Appl. Earth Obs. Geoinf., 35, 199

Trianni, G., Angiuli, E., Lisini, G., and Gamba, P. (2014, January 13–18). Human settlements from Landsat data using Google Earth Engine. Proceedings of the 2014 IEEE Geoscience and Remote Sensing Symposium, Quebec City, QC, Canada.

Aguilar, R., Zurita-Milla, R., Izquierdo-Verdiguier, E., and De By, R.A. (2018). A Cloud-Based Multi-Temporal Ensemble Classifier to Map Smallholder Farming Systems. Remote Sens., 10.

Dong, 2016, Mapping paddy rice planting area in northeastern Asia with Landsat 8 images, phenology-based algorithm and Google Earth Engine, Remote Sens. Environ., 185, 142, 10.1016/j.rse.2016.02.016

Shelestov, 2017, Exploring Google Earth Engine Platform for Big Data Processing: Classification of Multi-Temporal Satellite Imagery for Crop Mapping, Front. Earth Sci., 5, 17, 10.3389/feart.2017.00017

Becker, 2021, Statistical features for land use and land cover classification in Google Earth Engine, Remote Sens. Appl. Soc. Environ., 21, 100459

Padarian, 2015, Using Google’s cloud-based platform for digital soil mapping, Comput. Geosci., 83, 80, 10.1016/j.cageo.2015.06.023

ESA (2020, June 07). Land Cover CCI Product User Guide Version 2. Tech. Rep., Available online: http://maps.elie.ucl.ac.be/CCI/viewer/download/ESACCI-LC-Ph2-PUGv2_2.0.pdf.

Roy, P.S., Kushwaha, S., Murthy, M., and Roy, A. (2012). Biodiversity Characterisation at Landscape Level: National Assessment.

Loveland, 1997, The International Geosphere Biosphere Programme Data and Information System global land cover data set (DISCover), Acta Astronaut., 41, 681, 10.1016/S0094-5765(98)00050-2

Huang, 2002, An assessment of support vector machines for land cover classification, Int. J. Remote Sens., 23, 725, 10.1080/01431160110040323

Belgiu, 2016, Random forest in remote sensing: A review of applications and future directions, ISPRS J. Photogramm. Remote Sens., 114, 24, 10.1016/j.isprsjprs.2016.01.011

1978, Sampling Techniques, Technometrics, 20, 104, 10.1080/00401706.1978.10489623

McBratney, 1981, The design of optimal sampling schemes for local estimation and mapping of of regionalized variables—I, Comput. Geosci., 7, 331, 10.1016/0098-3004(81)90077-7

Heuvelink, 2015, Spsann–Optimization of Sample Patterns Using Spatial Simulated Annealing, EGU Gen. Assem., 7780, 17

Kohavi, 1995, A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection, Int. Jt. Conf. Artif. Intell., 14, 1137

Yang, 2015, Evaluating unsupervised and supervised image classification methods for mapping cotton root rot, Precis. Agric., 16, 201, 10.1007/s11119-014-9370-9

Tipping, M.E., and Faul, A.C. (2003, January 3–6). Fast Marginal Likelihood Maximisation for Sparse Bayesian Models. Proceedings of the Ninth International Workshop on Artificial Intelligence and Statistics, Key West, FL, USA.

Shetty, S., Gupta, P.K., Belgiu, M., and Srivastav, S.K. (2019). Analysis of Machine Learning Classifiers for LULC Classification on Google Earth Engine, University of Twente (ITC).

Shaumyan, A. (2018, January 16). Python Package for Bayesian Machine Learning with Scikit-Learn API. Available online: https://github.com/AmazaspShumik/sklearn-bayes.

Panyam, 2002, Efficiency of Dispatch ® and Infiltrator ® Cardiac Infusion Catheters in Arterial Localization of Nanoparticles in a Porcine Coronary Model of Restenosis, J. Drug Target., 10, 515, 10.1080/1061186021000038391

Heung, 2016, An overview and comparison of machine-learning techniques for classification purposes in digital soil mapping, Geoderma, 265, 62, 10.1016/j.geoderma.2015.11.014

Pal, 2005, Support vector machines for classification in remote sensing, Int. J. Remote Sens., 26, 1007, 10.1080/01431160512331314083

Xiong, K., Adhikari, B.R., Stamatopoulos, C.A., Zhan, Y., Wu, S., Dong, Z., and Di, B. (2020). Comparison of Different Machine Learning Methods for Debris Flow Susceptibility Mapping: A Case Study in the Sichuan Province, China. Remote Sens., 12.

Shao, 2012, Comparison of support vector machine, neural network, and CART algorithms for the land-cover classification using limited training data points, ISPRS J. Photogramm. Remote Sens., 70, 78, 10.1016/j.isprsjprs.2012.04.001

Foody, G.M., Pal, M., Rocchini, D., Garzon-Lopez, C.X., and Bastin, L. (2016). The Sensitivity of Mapping Methods to Reference Data Quality: Training Supervised Image Classifications with Imperfect Reference Data. ISPRS Int. J. Geo-Inf., 5.

Mellor, 2015, Exploring issues of training data imbalance and mislabelling on random forest performance for large area land cover classification using the ensemble margin, ISPRS J. Photogramm. Remote Sens., 105, 155, 10.1016/j.isprsjprs.2015.03.014

Tuteja, U. (2013). Baseline Data on Horticultural Crops in Uttarakhand, Agricultural Economics Research Centre, University of Delhi.