Củng cố tính chính trực trong khoa học dữ liệu môi trường và học máy đòi hỏi phải hiểu về bất bình đẳng xã hội - sinh thái

Joe F. Bozeman1,2
1School of Civil and Environmental Engineering, Georgia Institute of Technology, Atlanta, USA
2School of Public Policy, Georgia Institute of Technology, Atlanta, USA

Tóm tắt

Bất bình đẳng xã hội - sinh thái trong khoa học dữ liệu môi trường — chẳng hạn như những bất bình đẳng phát sinh từ các phương pháp dựa trên dữ liệu và học máy (ML) — là những vấn đề hiện đang được tranh luận và diễn tiến. Có sự đồng thuận ngày càng gia tăng về việc tích hợp công bằng trong tất cả các lĩnh vực nghiên cứu và thiết kế — từ khởi đầu đến quản lý, đồng thời cũng giải quyết các yếu tố quy trình, phân phối và công nhận. Tuy nhiên, việc thực hiện điều này có vẻ khó khăn hoặc đáng sợ đối với một số người. Quan điểm hiện tại giúp giảm bớt những lo ngại này bằng cách cung cấp cơ sở cho mối liên hệ giữa khoa học dữ liệu môi trường và bất bình đẳng xã hội - sinh thái, sử dụng Khung Công bằng Hệ thống, và cung cấp nền tảng cho một sự chuyển đổi mô hình hướng tới việc chuẩn hóa việc sử dụng các phương pháp tập trung vào công bằng trong khoa học dữ liệu môi trường và các bối cảnh học máy. Việc củng cố tính chính trực của khoa học dữ liệu môi trường và học máy mới chỉ bắt đầu từ góc độ phát triển công cụ tập trung vào công bằng và ứng dụng nghiêm ngặt. Để đạt được mục tiêu này, quan điểm này cũng cung cấp các hướng đi và thách thức tương lai liên quan bằng cách tổng quan một số công cụ và chiến lược có ý nghĩa — chẳng hạn như áp dụng Giao thức Wells-Du Bois, sử dụng các chỉ số công bằng và giải quyết một cách có hệ thống vấn đề không thể tái sản xuất; các nhu cầu và đề xuất khởi phát — chẳng hạn như giải quyết thiên lệch dữ liệu và hỗ trợ nghiên cứu hội tụ; và xác định một lộ trình mười bước phía trước. Cuối cùng, công việc mà các nhà khoa học và kỹ sư môi trường thực hiện cuối cùng ảnh hưởng đến phúc lợi của tất cả chúng ta.

Từ khóa

#bất bình đẳng xã hội - sinh thái #khoa học dữ liệu môi trường #học máy #công bằng #công cụ và chiến lược

Tài liệu tham khảo

Baker E, Carley S, Castellanos S, Nock D, Bozeman III J F, Konisky D, Monyei C G, Shah M, Sovacool B (2023). Metrics for decisionmaking in energy justice. Annual Review of Environment and Resources, 48(1): 737–760 Balayn A M A, Lof C, Houben G J P M (2021). Managing bias and unfairness in data for decision support: a survey of machine learning and data engineering approaches to identify and mitigate bias and unfairness within data management and analytics systems. VLDB Journal, 30(5): 739–768 Bozeman J F III, Nobler E, Nock D (2022). A path toward systemic equity in life cycle assessment and decision-making: standardizing sociodemographic data practices. Environmental Engineering Science, 39(9): 759–769 Bozeman III J F, Chopra S S, James P, Muhammad S, Cai H, Tong K, Carrasquillo M, Rickenbacker H, Nock D, Ashton W et al. (2023). Three research priorities for just and sustainable urban systems: now is the time to refocus. Journal of Industrial Ecology, 27(2): 382–394 Chubb J, Reed M S (2018). The politics of research impact: academic perceptions of the implications for research funding, motivation and quality. British Politics, 13(3): 295–311 Cui S, Gao Y, Huang Y, Shen L, Zhao Q, Pan Y, Zhuang S (2023). Advances and applications of machine learning and deep learning in environmental ecology and health. Environmental Pollution, 335(10): 122358 Feldman M, Friedler S, Moeller J, Scheidegger C, Venkatasubramanian S (2014). Certifying and removing disparate impact. arXiv.1412.3756 Gauchat G (2012). Politicization of science in the public sphere: a study of public trust in the United States, 1974 to 2010. American Sociological Review, 77(2): 167–187 Gibert K, Horsburgh J S, Athanasiadis I N, Holmes G (2018). Environmental data science. Environmental Modelling & Software, 106: 4–12 Grineski S, Bolin B, Boone C (2007). Criteria air pollution and marginalized populations: environmental inequity in metropolitan Phoenix, Arizona. Social Science Quarterly, 88(2): 535–554 Gundersen O E, Coakley K, Kirkpatrick C, Gil Y (2022). Sources of irreproducibility in machine learning: a review.ArXiv, abs/2204.07610 Hardt M, Price E, Srebro N (2016). Equality of opportunity in supervised learning. Proceedings of the 30th International Conference on Neural Information Processing Systems, 3323–3331 Hinnefeld J H, Cooman P, Mammo N, Deese R (2018). Evaluating Fairness Metrics in the Presence of Dataset Bias. arXiv.1809.09245 IEEE (2020). Bejing: IEEE Recommended Practice for Assessing the Impact of Autonomous and Intelligent Systems on Human Well. IEEE Std 7010-2020, 1–96 Joshi B, Swarnakar P (2023). How fair is our air? The injustice of procedure, distribution, and recognition within the discourse of air pollution in Delhi, India. Environmental Sociology, 9(2): 176–189 Liu X, Lu D, Zhang A, Liu Q, Jiang G (2022). Data-driven machine learning in environmental pollution: gains and problems. Environmental Science & Technology, 56(4): 2124–2133 Lokers R, Knapen R, Janssen S, van Randen Y, Jansen J (2016). Analysis of Big Data technologies for use in agro-environmental science. Environmental Modelling & Software: With Environment Data News, 84(10), 494–504 Monroe-White T, Lecy J (2022). The Wells-Du Bois Protocol for machine learning bias: building critical quantitative foundations for third sector scholarship. Voluntas, 34, 170–184 Montoya L D, Mendoza L M, Prouty C, Trotz M, Verbyla M E (2020). Environmental engineering for the 21st century: increasing diversity and community participation to achieve environmental and social justice. Environmental Engineering Science, 38(5): 288–297 Mowbray M, Savage T, Wu C, Song Z, Cho B A, Del Rio-Chanona E A, Zhang D (2021). Machine learning for biochemical engineering: a review. Biochemical Engineering Journal, 172: 108054 Murray S G, Wachter R M, Cucina R J (2020). Discrimination by artificial intelligence in a commercial electronic health record: a case study. Health Affairs Forefront Petersen A M, Ahmed M E, Pavlidis I (2021). Grand challenges and emergent modes of convergence science. Humanities & Social Sciences Communications, 8(1): 194 Prahl A, Goh W W P (2021). “Rogue machines” and crisis communication: When AI fails, how do companies publicly respond? Public Relations Review, 47(4): 102077 Qian J, Wu W, Yu Q, Ruiz-Garcia L, Xiang Y, Jiang L, Shi Y, Duan Y, Yang P (2020). Filling the trust gap of food safety in food trade between the EU and China: an interconnected conceptual traceability framework based on blockchain. Food and Energy Security, 9(4): e249 Ravetz J, Saltelli A (2015). The future of public trust in science. Nature, 524(7564): 161–161 Rockström J, Gupta J, Qin D, Lade S J, Abrams J F, Andersen L S, Armstrong McKay D I, Bai X, Bala G, Bunn S E, et al. (2023). Safe and just Earth system boundaries. Nature, 619(7968): 102–111 Sorrentino R M, Yamaguchi S (2008). Handbook of Motivation and Cognition Across Cultures. San Diego: Academic Tae K H, Roh Y, Oh Y H, Kim H, Whang S E (2019). Data cleaning for accurate, fair, and robust models: a big data—AI integration approach. DEEM’19: Proceedings of the 3rd International Workshop on Data Management for End-to-End Machine Learningm, 30 June 2019, Amsterdam, Netherlands Tahmasebi P, Kamrava S, Bai T, Sahimi M (2020). Machine learning in geo- and environmental sciences: from small to large scale. Advances in Water Resources, 142: 103619 Tessum C W, Apte J S, Goodkind A L, Muller N Z, Mullins K A, Paolella D A, Polasky S, Springer N P, Thakrar S K, Marshall J D, et al. (2019). Inequity in consumption of goods and services adds to racial–ethnic disparities in air pollution exposure. Proceedings of the National Academy of Sciences of the United States of America, 116(13): 6001–6006 Verlegh P W J, Steenkamp J BEM (1999). A review and meta-analysis of country-of-origin research. Journal of Economic Psychology, 20(5): 521–546 Vesilind P A (2010). Engineering Peace and Justice the Responsibility of Engineers to Society. London: Springer-Verlag Vorst R V D (1998). Engineering, ethics and professionalism. European Journal of Engineering Education, 23(2): 171–179 Wailoo K A, Dzau V J, Yamamoto K R (2023). Embed equity throughout innovation. Science, 381(6662): 1029–1029 Wen Y, Zhou Z, Zhang S, Wallington T J, Shen W, Tan Q, Deng Y, Wu Y (2022). Urban-rural disparities in air quality responses to traffic changes in a megacity of China revealed using machine learning. Environmental Science & Technology Letters, 9(7): 592–598 Zhu M, Wang J, Yang X, Zhang Y, Zhang L, Ren H, Wu B, Ye L (2022). A review of the application of machine learning in water quality evaluation. Eco-Environment & Health, 1(2): 107–116 Zliobaite I (2015). On the relation between accuracy and fairness in binary classification. In: The 2nd Workshop on Fairness, Accountability, and Transparency in Machine Learning (FATML) at ICML’15, July 11, 2015, Lille, France