Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
So sánh giữa các kỹ thuật học máy và học sâu trong việc dự đoán ô nhiễm không khí: một nghiên cứu điển hình từ Trung Quốc
Tóm tắt
Tác động tiêu cực của ô nhiễm không khí luôn là một vấn đề lớn đối với sức khỏe con người. Sự hiện diện của mức độ ô nhiễm không khí cao có thể gây ra các bệnh nghiêm trọng như khí phế thũng, bệnh phổi tắc nghẽn mạn tính (COPD) hoặc hen suyễn. Dự đoán chất lượng không khí giúp chúng ta thực hiện các kế hoạch hành động thực tiễn nhằm kiểm soát ô nhiễm không khí. Chỉ số chất lượng không khí (AQI) phản ánh mức độ tập trung của các chất ô nhiễm tại một địa phương. AQI trung bình đã được tính toán cho các thành phố khác nhau ở Trung Quốc để hiểu các xu hướng hàng năm. Hơn nữa, chỉ số chất lượng không khí đã được dự đoán cho mười thành phố lớn trên toàn quốc bằng năm kỹ thuật học sâu khác nhau, bao gồm: Mạng nơ-ron hồi tiếp (RNN), Đơn vị hồi tiếp hai chiều có cổng (Bi-GRU), Bộ nhớ dài ngắn hai chiều (BiLSTM), Mạng nơ-ron tích chập BiLSTM (CNN-BiLSTM), và Mạng tích chập BiLSTM (Conv1D-BiLSTM). Hiệu suất của những mô hình này đã được so sánh với một mô hình học máy, eXtreme Gradient Boosting (XGBoost) để khám phá mô hình học sâu hiệu quả nhất. Kết quả gợi ý rằng mô hình học máy XGBoost vượt trội hơn các mô hình học sâu. Trong khi Conv1D-BiLSTM và CNN-BiLSTM hoạt động tốt trong số các mô hình học sâu trong việc ước lượng chỉ số chất lượng không khí (AQI), thì RNN và Bi-GRU là những mô hình ít hiệu quả nhất. Do đó, cả mô hình XGBoost và các mô hình mạng nơ-ron đều có khả năng nắm bắt tính phi tuyến có trong dữ liệu với độ chính xác đáng tin cậy.
Từ khóa
#ô nhiễm không khí #chỉ số chất lượng không khí #học máy #học sâu #mạng nơ-ron hồi tiếp #Bi-GRU #BiLSTM #CNN-BiLSTM #nghiên cứu điển hình trung quốcTài liệu tham khảo
Agency, U. States. C. I. (2011). The CIA World Factbook 2011. www.snowballpublishing.com.
Al-Janabi, S., Mohammad, M., & Al-Sultan, A. (2020). A new method for prediction of air pollution based on intelligent computation. Soft Computing, 1, 661–680. https://doi.org/10.1007/s00500-019-04495-1.
Athira, V., Geetha, P., Vinakumar, R., & Soman, J. P. (2018). DeepAirNet: Applying recurrent networks for air quality prediction. Procedia Computer Science, 132, 1394–1403. https://doi.org/10.1016/j.procs.2018.05.068.
Biancofiore, F., Busilacchio, M., Verdecchia, M., Tomassetti, B., Aruffo, E., Bianco, S., Di Tommaso, S., Colangeli, C., Rosatelli, G., & Di Carlo, P. (2017). Recursive neural network model for analysis and forecast of PM10 and PM2.5. Atmospheric Pollution Research, 4, 652–659. https://doi.org/10.1016/j.apr.2016.12.014.
Chen, T., & Guestrin, C. (2016). Xgboost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International conference on knowledge discovery and data mining (pp. 785–794)
Dhakal, S., Gautam, Y., & Bhattarai, A. (2021). Exploring a deep LSTM neural network to forecast daily PM2.5 concentration using meteorological parameters in Kathmandu Valley, Nepal. Air Quality Atmosphere Health, 1, 83–96. https://doi.org/10.1007/s11869-020-00915-6.
Freeman, B. S., Taylor, G., Gharabaghi, B., & The, J. (2018). Forecasting air quality time series using deep learning. Journal of the Air and Waste Management Association, 68(8), 866–886. https://doi.org/10.1080/10962247.2018.1459956.
Gao, F. (2013). Evaluation of the Chinese new air quality index (GB3095–2012): Based on comparison with the US AQI system and the WHO AQGs. Novia: Thesis dissertation, Novia University of Applied Sciences.
Goudarzi, G., Shirmardi, M., Naimabadi, A., Ghadiri, A., & Sajedifar, J. (2019). Chemical and organic characteristics of PM2.5 particles and their in-vitro cytotoxic effects on lung cells: The Middle East dust storms in Ahvaz Iran. Science of the Total Environment, 655, 434–445. https://doi.org/10.1016/j.scitotenv.2018.11.153.
Gu, K., Zhou, Y., Sun, H., Zhao, L., & Liu, S. (2020). Prediction of air quality in Shenzhen based on neural network algorithm. Neural Computing Applications, 7, 1879–1892. https://doi.org/10.1007/s00521-019-04492-3.
Han, J., Kamber, M., & Pei, J. (2012). Data preprocessing. Data Mining (pp. 83–124). Elsevier. https://doi.org/10.1016/b978-0-12-381479-1.00003-4.
He, B.-J., Ding, L., & Prasad, D. (2019). Enhancing urban ventilation performance through the development of precinct ventilation zones: A case study based on the Greater Sydney Australia. Sustainable Cities and Society, 47, 101472. https://doi.org/10.1016/j.scs.2019.101472.
Jiang, B., Xia, D., & Zhang, X. (2018). A multicomponent kinetic model established for investigation on atmospheric new particle formation mechanism in H2SO4 –HNO3 –NH3 -VOC system. Science of the Total Environment, 616–617, 1414–1422.
Jiao, Y., Wang, Z., & Zhang, Y. (2019). Prediction of Air Quality Index based on LSTM (pp. 17–20). IEEE 8th Joint International Information Technology and Artificial Intelligence Conference (ITAIC). https://doi.org/10.1109/ITAIC.2019.8785602.
Jing, H., & Wang, Y. (2020). Research on urban air quality prediction based on ensemble learning of XGBoost. E3S Web of Conferences Vol. 165 (p. 02014). EDP Sciences.
Khaefi, M., Goudarzi, G., Yari, A. R., Geravandi, S., Dobaradaran, S., Idani, E., Javanmardi, P., Youesfi, F., Hashemzadeh, B., Shahriari, A., & Mohammadi, M. J. (2016). An association between ambient pollutants and hospital admitted respiratory cases in Ahvaz Iran. Fresenius Environmental Bulletin, 25(10), 3955–3961.
Khaniabadi, Y. O., Daryanoosh, S. M., Hopke, P. K., Ferrante, M., De Marco, A., Sicard, P., Oliveri Conti, G., Goudarzi, G., Basiri, H., Mohammadi, M. J., & Keishams, F. (2017). Acute myocardial infarction and COPD attributed to ambient SO2 in Iran. Environmental Research, 156, 683–687.
Kumar, R. P., Perumpully, S. J., Samuel, C., & Gautam, S. (2022). Exposure and health: A progress update by evaluation and scientometric analysis. Stochastic Environmental Research and Risk Assessment. https://doi.org/10.1007/s00477-022-02313-z.
Li, X., Peng, L., Yao, X., Cui, S., Hu, Y., You, C., & Chi, T. (2017). Long short-term memory neural network for air pollutant concentration predictions: Method development and evaluation. Environmental Pollution, 231, 997–1004.
Li, Q., Li, S., Hu, J., Zhang, S., & Hu, J. (2018a). Tourism review sentiment classification using a bidirectional recurrent neural network with an attention mechanism and topic-enriched word vectors. Sustainability, 9, 3313. https://doi.org/10.3390/su10093313.
Li, M., He, B., Guo, R., Li, Y., Chen, Y., & Fan, Y. (2018b). Study on population distribution pattern at the county level of China. Sustainability, 10, 3598. https://doi.org/10.3390/su10103598.
Lin, B., & Zhu, J. (2018). Changes in urban air quality during urbanization in China. Journal of Cleaner Production, 188, 312–321. https://doi.org/10.1016/j.jclepro.2018.03.293.
Liu, W., Xu, Z., & Yang, T. (2018). Health effects of air pollution in China. International Journal of Environmental Research and Public Health, 15(7), 1471. https://doi.org/10.3390/ijerph15071471.
Lu, W., Li, J., Li, Y., Sun, A., & Wang, J. (2020). A CNN-LSTM-based model to forecast stock prices. Complexity, 2020, 1–10. https://doi.org/10.1155/2020/6622927.
Minmin, L., He, B., Guo, R., Li, Y., Chen, Y., & Fan, Y. (2018). Study on population distribution pattern at the county level of China. Sustainability, 10, 3598.
Navares, R., & Aznarte, J. L. (2020). Predicting air quality with deep learning LSTM: Towards comprehensive models. Ecological Informarics, 55, 101019. https://doi.org/10.1016/j.ecoinf.2019.101019.
Nejadettehad, A., Mahini, H., & Bahrak, B. (2020). Short-term demand forecasting for online car-hailing services using recurrent neural networks. Applied Artifificial Intelligence, 9, 674–689. https://doi.org/10.1080/08839514.2020.1771522.
Ni, X. Y., Huang, H., & Du, W. P. (2017). Relevance analysis and short-term prediction of PM2.5 concentrations in Beijing based on multi-source data. Atmospheric Environment, 150, 146–161. https://doi.org/10.1016/j.atmosenv.2016.11.054.
Ong, B. T., Sugiura, K., & Zettsu, K. (2015). Dynamically pre-trained deep recurrent neural networks using environmental monitoring data for predicting PM2.5. Neural Computing Applications,6, 1553–1566. https://doi.org/10.1007/s00521-015-1955-3.
Osowski, S., & Garanty, K. (2007). Forecasting of the daily meteorological pollution using wavelets and support vector machine. Engineering Applications and Artificial Intelligence, 6, 745–755. https://doi.org/10.1016/j.engappai.2006.10.008.
Patra, A. K., Gautam, S., Majumdar, S., & Kumar, P. (2016). Prediction of particulate matter concentration profile in an opencast copper mine in India using an artificial neural network model. Air Quality, Atmosphere and Health, 9, 697–711. https://doi.org/10.1007/s11869-015-0369-9.
Perez, P., & Gramsch, E. (2016). Forecasting hourly PM2.5 in Santiago de Chile with emphasis on night episodes. Atmospheric Environment, 124, 22–27. https://doi.org/10.1016/j.atmosenv.2015.11.016.
Pisoni, E., Albrecht, D., Mara, T. A., Rosati, R., Tarantola, S., & Thunis, P. (2018). Application of uncertainty and sensitivity analysis to the air quality SHERPA modelling tool. Atmospheric Environment, 183, 84–93. https://doi.org/10.1016/j.atmosenv.2018.04.006.
Ribeiro, M. C., Pinho, P., Branquinho, C., Llop, E., & Pereira, M. J. (2016). Geostatistical uncertainty of assessing air quality using high-spatial-resolution lichen data: A health study in the urban area of Sines, Portugal. Science of the Total Environment, 562, 740–750. https://doi.org/10.1016/j.scitotenv.2016.04.081.
Shahriar, S. A., Kayes, I., Hasan, K., Salam, M. A., & Chowdhury, S. (2020). Applicability of machine learning in modeling of atmospheric particle pollution in Bangladesh. Air Quality Atmosphere Health, 10, 1247–1256. https://doi.org/10.1007/s11869-020-00878-8.
Shaziayani, W. N., Ul-Saufie, A. Z., Ahmat, H., & Al-Jumeily, D. (2021). Coupling of quantile regression into boosted regression trees (BRT) technique in forecasting emission model of PM10 concentration. Air Quality Atmosphere Health, 14, 1647–1663. https://doi.org/10.1007/s11869-021-01045-3.
Shi, X., Chen, Z., Wang, H., Yeung, D. Y., Wong, W. K., & Woo, W. C. (2015). Convolutional LSTM network: A machine learning approach for precipitation nowcasting. arXiv preprint arXiv:1506.04214.
Song, Y., Qin, S., Qu, J., & Liu, F. (2015). The forecasting research of early warning systems for atmospheric pollutants: A case in Yangtze River Delta region. Atmospheric Environment, 118, 58–69. https://doi.org/10.1016/j.atmosenv.2015.06.032.
Taylan, O. (2017). Modelling and analysis of ozone concentration by artificial intelligent techniques for estimating air quality. Atmospheric Environment, 150, 356–365. https://doi.org/10.1016/j.atmosenv.2016.11.030.
Wen, C., Liu, S., Yao, X., Peng, L., Li, X., Hu, Y., & Chi, T. (2019). A novel spatiotemporal convolutional long short-term neural network for air pollution prediction. Science of the Total Environment, 654, 1091–1099. https://doi.org/10.1016/j.scitotenv.2018.11.086.
Wu, S., Feng, Q., Du, Y., & Li, X. (2011). Artificial neural network models for daily PM10 air pollution index prediction in the urban area of Wuhan, China. Environmental Engineering Science, 5, 357–363. https://doi.org/10.1089/ees.2010.0219.
Xayasouk, T., Lee, H., & Lee, G. (2020). Air Pollution Prediction Using Long Short-Term Memory (LSTM) and Deep Autoencoder (DAE) Models. Sustainability, 6, 2570. https://doi.org/10.3390/su12062570.
Zhang, L., Liu, P., Zhao, L., Wang, G., Zhang, W., & Liu, J. (2021). Air quality predictions with a semi-supervised bidirectional LSTM neural network. Atmospheric Pollution Research, 12, 328–339. https://doi.org/10.1016/j.apr.2020.09.003.
Zhou, Y., Chang, F.-J., Chang, L.-C., Kao, I.-F., & Wang, Y.-S. (2019b). Explore a deep learning multi-output neural network for regional multi-step-ahead air quality forecasts. Journal of Cleaner Production, 209, 134–145. https://doi.org/10.1016/j.jclepro.2018.10.243.
Zhou, X., Xu, J., Zeng, P., & Meng, X. (2019). Air pollutant concentration prediction based on GRU method. Journal of Physics: Conference Series, 032058. https://doi.org/10.1088/1742-6596/1168/3/032058.
Zhu, S., Lian, X., Liu, H., Hu, J., Wang, Y., & Che, J. (2017). Daily air quality index forecasting with hybrid models: A case in China. Environmental Pollution, 231, 1232–1244. https://doi.org/10.1016/j.envpol.2017.08.069.
Zou, B., You, J., Lin, Y., Duan, X., Zhao, X., Fang, X., Campen, M. J., & Li, S. (2019). Air pollution intervention and life-saving effect in China. Environment International, 125, 529–541. https://doi.org/10.1016/j.envint.2018.10.045.