Đánh giá ảnh hưởng của thiết kế lấy mẫu huấn luyện đến hiệu suất của các bộ phân loại học máy trong lập bản đồ lớp phủ đất sử dụng dữ liệu viễn thám đa thời gian và nền tảng Google Earth Engine
Tóm tắt
Các bộ phân loại học máy ngày nay đang được sử dụng ngày càng nhiều cho việc lập bản đồ Sử dụng Đất và Phủ Lớp (LULC) từ hình ảnh viễn thám. Tuy nhiên, để chọn đúng bộ phân loại cần phải hiểu các yếu tố chính ảnh hưởng đến hiệu suất của chúng. Nghiên cứu hiện tại đã điều tra trước hết là tác động của thiết kế lấy mẫu huấn luyện đến kết quả phân loại thu được bởi bộ phân loại Random Forest (RF), và thứ hai là so sánh hiệu suất của nó với các bộ phân loại học máy khác cho việc lập bản đồ LULC sử dụng dữ liệu viễn thám vệ tinh đa thời gian và nền tảng Google Earth Engine (GEE). Chúng tôi đã đánh giá tác động của ba phương pháp lấy mẫu, cụ thể là Lấy Mẫu Ngẫu Nhiên Phân Tầng Đều (SRS(Eq)), Lấy Mẫu Ngẫu Nhiên Phân Tầng Theo Tỷ Lệ (SRS(Prop)), và Lấy Mẫu Hệ Thống Phân Tầng (SSS) đến kết quả phân loại thu được bởi mô hình LULC được huấn luyện RF. Kết quả của chúng tôi cho thấy rằng phương pháp SRS(Prop) có lợi cho các lớp lớn đồng thời đạt được độ chính xác tổng thể tốt. Phương pháp SRS(Eq) cung cấp độ chính xác tốt ở cấp độ lớp, ngay cả đối với các lớp thiểu số, trong khi phương pháp SSS hoạt động tốt cho các khu vực có độ biến đổi trong lớp lớn. Để đánh giá hiệu suất của các bộ phân loại học máy, RF vượt trội hơn Cây Phân Loại và Hồi Quy (CART), Máy Vector Hỗ Trợ (SVM), và Máy Vector Liên Quan (RVM) với mức độ tin cậy >95%. Hiệu suất của các bộ phân loại CART và SVM được thấy là tương tự nhau. RVM đạt được kết quả phân loại tốt với số lượng mẫu huấn luyện hạn chế.
Từ khóa
#Lập bản đồ lớp phủ đất #học máy #Random Forest #viễn thám #lấy mẫu phân tầng #Google Earth Engine #Độ chính xác phân loại #dữ liệu đa thời gianTài liệu tham khảo
Luan, 2018, Linking greenhouse gas emissions to urban landscape structure: The relevance of spatial and thematic resolutions of land use/cover data, Landsc. Ecol., 33, 1211, 10.1007/s10980-018-0661-9
Roy, 2015, Development of Decadal (1985–1995–2005) Land Use and Land Cover Database for India, Remote Sens., 7, 2401, 10.3390/rs70302401
Jalkanen, 2019, Identification of ecological networks for land-use planning with spatial conservation prioritization, Landsc. Ecol., 35, 353, 10.1007/s10980-019-00950-4
Shalaby, 2007, Remote sensing and GIS for mapping and monitoring land cover and land-use changes in the Northwestern coastal zone of Egypt, Appl. Geogr., 27, 28, 10.1016/j.apgeog.2006.09.004
Lu, 2007, A survey of image classification methods and techniques for improving classification performance, Int. J. Remote Sens., 28, 823, 10.1080/01431160600746456
Khatami, 2016, A meta-analysis of remote sensing research on supervised pixel-based land-cover image classification processes: General guidelines for practitioners and future research, Remote Sens. Environ., 177, 89, 10.1016/j.rse.2016.02.028
Yu, 2014, Meta-discoveries from a synthesis of satellite-based land-cover mapping research, Int. J. Remote Sens., 35, 4573, 10.1080/01431161.2014.930206
Ghimire, 2012, An Evaluation of Bagging, Boosting, and Random Forests for Land-Cover Classification in Cape Cod, Massachusetts, USA, GIScience Remote Sens., 49, 623, 10.2747/1548-1603.49.5.623
Foody, 2004, A relative evaluation of multiclass image classification by support vector machines, IEEE Trans. Geosci. Remote Sens., 42, 1335, 10.1109/TGRS.2004.827257
Nery, T., Sadler, R., Solis-Aulestia, M., White, B., Polyakov, M., and Chalak, M. (2016, January 10–15). Comparing supervised algorithms in Land Use and Land Cover classification of a Landsat time-series. Proceedings of the 2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Beijing, China.
Tso, B., and Mather, P.M. (2009). Classification Methods for Remotely Sensed Data, CRC Press. [2nd ed.].
Friedl, 2002, Global land cover mapping from MODIS: Algorithms and early results, Remote Sens. Environ., 83, 287, 10.1016/S0034-4257(02)00078-0
Lawrence, 2001, Rule-Based Classification Systems Using Classification and Regression Tree (CART) Analysis, Photogramm. Eng. Remote Sens., 67, 1137
Gislason, 2006, Random Forests for land cover classification, Pattern Recognit. Lett., 27, 294, 10.1016/j.patrec.2005.08.011
Mountrakis, 2011, Support vector machines in remote sensing: A review, ISPRS J. Photogramm. Remote Sens., 66, 247, 10.1016/j.isprsjprs.2010.11.001
Foody, 2006, Training set size requirements for the classification of a specific class, Remote Sens. Environ., 104, 1, 10.1016/j.rse.2006.03.004
Tipping, 2001, Sparse Bayesian Learning and the Relevance Vector Machine, J. Mach. Learn. Res., 1, 211
Pal, 2012, Evaluation of SVM, RVM and SMLR for Accurate Image Classification with Limited Ground Data, IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens., 5, 1344, 10.1109/JSTARS.2012.2215310
Foody, 2008, RVM-Based Multi-Class Classification of Remotely Sensed Data, Int. J. Remote Sens., 29, 1817, 10.1080/01431160701822115
Talukdar, S., Singha, P., Mahato, S., Pal, S., Liou, Y.-A., and Rahman, A. (2020). Land-Use Land-Cover Classification by Machine Learning Classifiers for Satellite Observations—A Review. Remote Sens., 12.
Rostami, M., Kolouri, S., Eaton, E., and Kim, K. (2019). Deep Transfer Learning for Few-Shot SAR Image Classification. Remote Sens., 11.
Bejiga, M.B., Melgani, F., and Beraldini, P. (2019). Domain Adversarial Neural Networks for Large-Scale Land Cover Classification. Remote Sens., 11.
Heydari, 2018, Effect of classifier selection, reference sample size, reference class distribution and scene heterogeneity in per-pixel classification accuracy using 26 Landsat sites, Remote Sens. Environ., 204, 648, 10.1016/j.rse.2017.09.035
Jin, 2014, Assessing the impact of training sample selection on accuracy of an urban classification: A case study in Denver, Colorado, Int. J. Remote Sens., 35, 2067, 10.1080/01431161.2014.885152
Minasny, 2007, The variance quadtree algorithm: Use for spatial sampling design, Comput. Geosci., 33, 383, 10.1016/j.cageo.2006.08.009
Beuchle, 2015, Land cover changes in the Brazilian Cerrado and Caatinga biomes from 1990 to 2010 based on a systematic remote sensing sampling approach, Appl. Geogr., 58, 116, 10.1016/j.apgeog.2015.01.017
Montanari, 2012, The use of scaled semivariograms to plan soil sampling in sugarcane fields, Precis. Agric., 13, 542, 10.1007/s11119-012-9265-6
Stein, 1998, Constrained Optimization of Spatial Sampling using Continuous Simulated Annealing, J. Environ. Qual., 27, 1078, 10.2134/jeq1998.00472425002700050013x
Chen, 2013, Even sampling designs generation by efficient spatial simulated annealing, Math. Comput. Model., 58, 670, 10.1016/j.mcm.2011.10.035
Gorelick, 2017, Google Earth Engine: Planetary-scale geospatial analysis for everyone, Remote Sens. Environ., 202, 18, 10.1016/j.rse.2017.06.031
Midekisa, A., Holl, F., Savory, D.J., Andrade-Pacheco, R., Gething, P.W., Bennett, A., and Sturrock, H.J.W. (2017). Mapping land cover change over continental Africa using Landsat and Google Earth Engine cloud computing. PLoS ONE, 12.
Hansen, 2013, High-resolution global maps of 21st-century forest cover change, Science, 342, 850, 10.1126/science.1244693
Goldblatt, R., You, W., Hanson, G., and Khandelwal, A.K. (2016). Detecting the Boundaries of Urban Areas in India: A Dataset for Pixel-Based Image Classification in Google Earth Engine. Remote Sens., 8.
Patel, 2015, Multitemporal settlement and population mapping from Landsat using Google Earth Engine, Int. J. Appl. Earth Obs. Geoinf., 35, 199
Trianni, G., Angiuli, E., Lisini, G., and Gamba, P. (2014, January 13–18). Human settlements from Landsat data using Google Earth Engine. Proceedings of the 2014 IEEE Geoscience and Remote Sensing Symposium, Quebec City, QC, Canada.
Aguilar, R., Zurita-Milla, R., Izquierdo-Verdiguier, E., and De By, R.A. (2018). A Cloud-Based Multi-Temporal Ensemble Classifier to Map Smallholder Farming Systems. Remote Sens., 10.
Dong, 2016, Mapping paddy rice planting area in northeastern Asia with Landsat 8 images, phenology-based algorithm and Google Earth Engine, Remote Sens. Environ., 185, 142, 10.1016/j.rse.2016.02.016
Shelestov, 2017, Exploring Google Earth Engine Platform for Big Data Processing: Classification of Multi-Temporal Satellite Imagery for Crop Mapping, Front. Earth Sci., 5, 17, 10.3389/feart.2017.00017
Becker, 2021, Statistical features for land use and land cover classification in Google Earth Engine, Remote Sens. Appl. Soc. Environ., 21, 100459
Padarian, 2015, Using Google’s cloud-based platform for digital soil mapping, Comput. Geosci., 83, 80, 10.1016/j.cageo.2015.06.023
ESA (2020, June 07). Land Cover CCI Product User Guide Version 2. Tech. Rep., Available online: http://maps.elie.ucl.ac.be/CCI/viewer/download/ESACCI-LC-Ph2-PUGv2_2.0.pdf.
Roy, P.S., Kushwaha, S., Murthy, M., and Roy, A. (2012). Biodiversity Characterisation at Landscape Level: National Assessment.
Loveland, 1997, The International Geosphere Biosphere Programme Data and Information System global land cover data set (DISCover), Acta Astronaut., 41, 681, 10.1016/S0094-5765(98)00050-2
Huang, 2002, An assessment of support vector machines for land cover classification, Int. J. Remote Sens., 23, 725, 10.1080/01431160110040323
Belgiu, 2016, Random forest in remote sensing: A review of applications and future directions, ISPRS J. Photogramm. Remote Sens., 114, 24, 10.1016/j.isprsjprs.2016.01.011
McBratney, 1981, The design of optimal sampling schemes for local estimation and mapping of of regionalized variables—I, Comput. Geosci., 7, 331, 10.1016/0098-3004(81)90077-7
Heuvelink, 2015, Spsann–Optimization of Sample Patterns Using Spatial Simulated Annealing, EGU Gen. Assem., 7780, 17
Kohavi, 1995, A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection, Int. Jt. Conf. Artif. Intell., 14, 1137
Yang, 2015, Evaluating unsupervised and supervised image classification methods for mapping cotton root rot, Precis. Agric., 16, 201, 10.1007/s11119-014-9370-9
Tipping, M.E., and Faul, A.C. (2003, January 3–6). Fast Marginal Likelihood Maximisation for Sparse Bayesian Models. Proceedings of the Ninth International Workshop on Artificial Intelligence and Statistics, Key West, FL, USA.
Shetty, S., Gupta, P.K., Belgiu, M., and Srivastav, S.K. (2019). Analysis of Machine Learning Classifiers for LULC Classification on Google Earth Engine, University of Twente (ITC).
Shaumyan, A. (2018, January 16). Python Package for Bayesian Machine Learning with Scikit-Learn API. Available online: https://github.com/AmazaspShumik/sklearn-bayes.
Panyam, 2002, Efficiency of Dispatch ® and Infiltrator ® Cardiac Infusion Catheters in Arterial Localization of Nanoparticles in a Porcine Coronary Model of Restenosis, J. Drug Target., 10, 515, 10.1080/1061186021000038391
Heung, 2016, An overview and comparison of machine-learning techniques for classification purposes in digital soil mapping, Geoderma, 265, 62, 10.1016/j.geoderma.2015.11.014
Pal, 2005, Support vector machines for classification in remote sensing, Int. J. Remote Sens., 26, 1007, 10.1080/01431160512331314083
Xiong, K., Adhikari, B.R., Stamatopoulos, C.A., Zhan, Y., Wu, S., Dong, Z., and Di, B. (2020). Comparison of Different Machine Learning Methods for Debris Flow Susceptibility Mapping: A Case Study in the Sichuan Province, China. Remote Sens., 12.
Shao, 2012, Comparison of support vector machine, neural network, and CART algorithms for the land-cover classification using limited training data points, ISPRS J. Photogramm. Remote Sens., 70, 78, 10.1016/j.isprsjprs.2012.04.001
Foody, G.M., Pal, M., Rocchini, D., Garzon-Lopez, C.X., and Bastin, L. (2016). The Sensitivity of Mapping Methods to Reference Data Quality: Training Supervised Image Classifications with Imperfect Reference Data. ISPRS Int. J. Geo-Inf., 5.
Mellor, 2015, Exploring issues of training data imbalance and mislabelling on random forest performance for large area land cover classification using the ensemble margin, ISPRS J. Photogramm. Remote Sens., 105, 155, 10.1016/j.isprsjprs.2015.03.014
Tuteja, U. (2013). Baseline Data on Horticultural Crops in Uttarakhand, Agricultural Economics Research Centre, University of Delhi.