Phân loại đậu tương từ các môi trường khác nhau dựa trên tích hợp metabolomic - transcriptomic

Jinghui Wang1, Qiyou Zheng1, Chenxu Wang1, Ao Zhou1
1College of Information Technology, Jilin Agricultural University, Changchun, China

Tóm tắt

Đậu tương là một sản phẩm nông nghiệp quan trọng tại Trung Quốc, với một số địa điểm địa lý thường mang lại những vụ mùa đậu tương chất lượng cao hơn và do đó có giá trị kinh tế cao hơn. Trong nghiên cứu này, các phân tích metabolomics và transcriptomics đã được thực hiện trên mẫu đậu tương từ chín khu vực thuộc tỉnh Heilongjiang và Liaoning, sử dụng công nghệ sắc ký lỏng ghép khối (LC-MS) không nhắm mục tiêu và công nghệ giải trình tự Illumina. Mục tiêu chính là thiết kế một phương pháp hiệu quả và khách quan để xác định nguồn gốc địa lý của từng giống đậu tương nhằm giảm thiểu các hành vi gian lận tiềm ẩn. Thông qua các phân tích đa chiều và một chiều, đã thành công trong việc xác định các chất chuyển hóa biểu hiện khác nhau (DEMs) và các gen biểu hiện khác nhau (DEGs), tạo ra các kết quả có ý nghĩa thống kê. Việc tích hợp các tập dữ liệu metabolomics và transcriptomics đã giúp xây dựng một mô hình mạng tương quan có khả năng phân biệt đậu tương có nguồn gốc từ các địa điểm địa lý khác nhau, dẫn đến việc xác định các dấu hiệu sinh học quan trọng nhằm nổi bật các sự khác biệt đáng chú ý. Để xác thực tính khả thi của phương pháp này trong ứng dụng thực tiễn, phân tích phân biệt dựa trên bình phương nhỏ nhất (PLS-DA) đã được sử dụng để phân biệt các mẫu đậu tương từ chín khu vực. Kết quả một cách thuyết phục đã chứng minh tính khả dụng và độ tin cậy của phương pháp này trong việc xác định chính xác nguồn gốc địa lý của đậu tương. Đặc biệt, nghiên cứu này khác biệt với các nghiên cứu trước đó về truy xuất nguồn gốc đậu tương, nhờ vào việc tích hợp phân tích dữ liệu metabolomics và transcriptomics, từ đó tiết lộ các dấu hiệu sinh học cung cấp sự phân biệt chính xác hơn về đặc điểm đậu tương giữa các khu vực khác nhau, thu hẹp một khoảng trống nghiên cứu quan trọng trong lĩnh vực truy xuất nguồn gốc đậu tương. Phương pháp phân tích tích hợp dữ liệu đôi sáng tạo này có khả năng nâng cao độ chính xác của các công cụ truy xuất nguồn gốc đậu tương và mở ra một nền tảng mới cho nghiên cứu về xác định sản phẩm nông nghiệp trong tương lai.

Từ khóa

#đậu tương #phân tích metabolomics #phân tích transcriptomics #nguồn gốc địa lý #dấu hiệu sinh học #truy xuất nguồn gốc

Tài liệu tham khảo

Zappi A, Melucci D, Scaramagli S et al (2018) Botanical traceability of unifloral honeys by chemometrics based on head-space gas chromatography. Eur Food Res Technol 244(12):2149–2157 Jamet JP, Chaumet JM (2016) Soybean in China: adaptating to the liberalization. Ocl 23(6):D604 Aung MM, Chang YS (2014) Traceability in a food supply chain: Safety and quality perspectives. Food Control 39:172–184 Jiang ZQ (2018) Research progress on traceability of grain origin produced by mineral element fingerprint analysis technology. Farm Products Process 5:70–71 Zhao S, Zhao Y (2021) Application and preparation progress of stable isotope reference materials in traceability of agricultural products. Crit Rev Anal Chem 51(8):742–753 Zhang Y, Wang D, Li X (2018) Research progress on origin tracing of agricultural products based on near infrared spectroscopy. J Food Saf Qual 9:6161–6166 Sheng CD, Yu JH, Qing LH et al (2020) Geographical specificity of fatty acid and multi-element fingerprints of soybean in northern China. Qual Assurance Saf Crops Foods 12(3):126–139 Wang ZC, Yan Y, Nisar T et al (2019) Multivariate statistical analysis combined with e-nose and e-tongue assays simplifies the tracing of geographical origins of Lycium ruthenicum Murray grown in China. Food Control 98:457–464 Jewett MC, Hofmann G, Nielsen J (2006) Fungal metabolite analysis in genomics and phenomics. Curr Opin Biotechnol 17(2):191–197 Khalid N, Aqeel M, Noman A (2019) System biology of metal tolerance in plants: An integrated view of genomics, transcriptomics, metabolomics, and phenomics. Plant Metall Funct Omics 2019:107–144 Singh S et al (2016) Heavy metal tolerance in plants: role of transcriptomics, proteomics, metabolomics, and ionomics. Front Plant Sci 6:1143 Tiedge K et al (2022) Comparative transcriptomics and metabolomics reveal specialized metabolite drought stress responses in switchgrass (Panicum virgatum). New Phytol 236(4):1393–1408 Fiehn O (2002) Metabolomics the link between genotypes and phenotypes. Funct Genomics 2002:155–171 Severin AJ, Woody JL, Bolon YT et al (2010) RNA-Seq Atlas of Glycine max: a guide to the soybean transcriptome. BMC Plant Biol 10(1):1–16 Xiao R, Ma Y, Zhang D et al (2018) Discrimination of conventional and organic rice using untargeted LC–MS-based metabolomics. J Cereal Sci 82:73–81 Gonzalez-Covarrubias V, Eduardo M-M, del Bosque-Plata L (2022) The potential of metabolomics in biomedical applications. Metabolites 12(2):194 Mehari B, Redi-Abshiro M, Chandravanshi BS et al (2019) GC?MS profiling of fatty acids in green coffee (Coffea arabica L.) beans and chemometric modeling for tracing geographical origins from Ethiopia. J Sci Food Agric 99(8):3811–3823 Zhang X, Liu Y, Li Y et al (2017) Identification of the geographical origins of sea cucumber (Apostichopus japonicus) in northern China by using stable isotope ratios and fatty acid profiles. Food Chem 218:269–276 Rubab S, Rizwani GH, Bahadur S et al (2020) Determination of the GC?MS analysis of seed oil and assessment of pharmacokinetics of leaf extract of Camellia sinensis L. J King Saud Univ Sci 32(7):3138–3144 Chen C-J et al (2022) Recent advances in LC–MS based metabolomics for clinical biomarker discovery. Mass Spectromet Rev 2022:21785 Shen S et al (2023) Metabolomics-centered mining of plant metabolic diversity and function: past decade and future perspectives. Mol Plant 16(1):43–63 Jing J, Shi Y, Zhang Q et al (2017) Prediction of Chinese green tea ranking by metabolite profiling using ultra-performance liquid chromatography-quadrupole time-of-flight mass spectrometry (UPLC-Q-TOF/MS). Food Chem 221:311–316 Lee JE, Lee BJ, Chung JO et al (2015) Metabolomic unveiling of a diverse range of green tea (Camellia sinensis) metabolites dependent on geography. Food Chem 174:452–459 Yun DY, Kang YG, Kim EH et al (2018) Metabolomics approach for understanding geographical dependence of soybean leaf metabolome. Food Res Int 106:842–852 Wang L, Liu L, Ma Y et al (2018) Transcriptome profilling analysis characterized the gene expression patterns responded to combined drought and heat stresses in soybean. Comput Biol Chem 77:413–429 Zhang Z et al (2022) Integrated metabolomics and transcriptomics analyses reveal the metabolic differences and molecular basis of nutritional quality in landraces and cultivated rice. Metabolites 12(5):384 Huang W et al (2022) Metabolomics and transcriptomics analysis of vitro growth in pitaya plantlets with different LED Light spectra treatment. Ind Crops Prod 186:115237 Zhu Z et al (2023) Transcription and metabolic profiling analysis of three discolorations in a day of hibiscus mutabilis. Biology 12(8):1115 Nguyen HD, Kim M-S (2022) The protective effects of curcumin on metabolic syndrome and its components: in-silico analysis for genes, transcription factors, and microRNAs involved. Arch Biochem Biophys 727:109326 Gong L et al (2022) Prediction of potential distribution of soybean in the frigid region in China with MaxEnt modeling. Ecol Inform 72:101834 Sheng CD et al (2020) Geographical specificity of fatty acid and multi-element fingerprints of soybean in northern China. Qual Assurance Saf Crops Foods 12(3):126–139 Nawaz MA et al (2020) Korean wild soybeans (Glycine soja Sieb & Zucc.): geographic distribution and germplasm conservation. Agronomy 10(2):214 Sachar S, Kumar A (2021) Survey of feature extraction and classification techniques to identify plant through leaves. Expert Syst Appl 167:114181 Zhang J et al (2021) Taxonomic compositions and co-occurrence relationships of protists in bulk soil and rhizosphere of soybean fields in different regions of China. Front Microbiol 12:738129 Yin L et al (2020) Optimizing feature selection of individual crop types for improved crop mapping. Remote Sens 12(1):162 Xiong F et al (2021) Non-target metabolomics revealed the differences between Rh. tanguticum plants growing under canopy and open habitats. BMC Plant Biol 21(1):1–13 Xian Y, Liu G, Yao H (2022) Predicting the current and future distributions of major food crop designated geographical indications (GIs) in China under climate change. Geocarto Int 37(25):8148–8171 Lucas KRG (2021) Using the available indicators of potential biodiversity damage for Life Cycle Assessment on soybean crop according to Brazilian ecoregions. Ecol Indic 127:107809 Chotekajorn A et al (2021) Evaluation of seed amino acid content and its correlation network analysis in wild soybean (Glycine soja) germplasm in Japan. Plant Genet Resour 19(1):35–43 Hu Y et al (2022) Sexual compatibility of transgenic soybean and different wild soybean populations. J Integr Agric 21(1):36–48 Saleem A et al (2021) A genome-wide genetic diversity scan reveals multiple signatures of selection in a European soybean collection compared to Chinese collections of wild and cultivated soybean accessions. Front Plant Sci 12:631767 Azizah FN et al (2023) Detection of metabolites in rhizosphere of soybean under different status of soil potassium. Soil Sci Plant Nutr 69(2):69–77 Liu Y et al (2022) The interrelationship between latitudinal differences and metabolic differences in the natural distribution area of Tilia amurensis Rupr. Forests 13(9):1507 Kim M et al (2022) RNA-seq gene profiling reveals transcriptional changes in the late phase during compatible interaction between a Korean soybean cultivar (Glycine max cv. Kwangan) and pseudomonas syringae pv. syringae B728a. Plant Pathol J 38(6):603 Durmanov A et al (2023) Sustainable growth of greenhouses: investigating key enablers and impacts. Emerg Sci J 7(5):1674–1690 Suseno BD (2023) Role of the magnitude of digital adaptability in sustainability of food and beverage small enterprises competitiveness. HighTech Innov J 4(2):270–282 Kassymbek R et al (2023) Optimization of the extrusion process in the production of compound feeds for dairy cows. Emerg Sci J 7:1574–1587 Yang Y et al (2022) Drought risk assessment of millet and its dynamic evolution characteristics: a case study of Liaoning Province, China. Ecol Indic 143:109407 Li D et al (2022) Spatial evolution of cultivated land in the Heilongjiang Province in China from 1980 to 2015. Environ Monit Assess 194(6):444 Bolger AM, Lohse M, Usadel B (2014) Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics 30(15):2114–2120 Kim D, Langmead B, Salzberg SL (2015) HISAT: a fast spliced aligner with low memory requirements. Nat Methods 12(4):357–360 Roberts A, Trapnell C, Donaghey J et al (2011) Improving RNA-Seq expression estimates by correcting for fragment bias. Genome Biol 12(3):1–14 Trapnell C, Williams BA, Pertea G et al (2010) Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol 28(5):511–515 Putri GH et al (2022) Analysing high-throughput sequencing data in Python with HTSeq 2.0. Bioinformatics 38(10):2943–2945 Anders S, Huber W (2012) Differential expression of RNA-Seq data at the gene level-the DESeq package. European Molecular Biology Laboratory (EMBL), 10: f1000research, Heidelberg, Germany Fouts DE, Szpakowski S, Purushe J et al (2012) Next generation sequencing to define prokaryotic and fungal diversity in the bovine rumen. PLoS ONE 7(11):e48289 Kanehisa M, Araki M, Goto S et al (2007) KEGG for linking genomes to life and the environment. Nucl Acids Res 36(suppl):D480–D484 Eriksson L, Byrne T, Johansson E et al (2013) Multi-and megavariate data analysis basic principles and applications. Umetrics Academy Kanehisa M et al (2023) KEGG for taxonomy-based analysis of pathways and genomes. Nucl Acids Res 51(D1):D587–D592 Yang H et al (2021) Integrative analyses of metabolome and transcriptome reveals metabolomic variations and candidate genes involved in sweet cherry (Prunus avium L.) fruit quality during development and ripening. PLoS ONE 16(11):e0260004 Li M et al (2022) Integrating transcriptomic and metabolomic analysis in roots of wild soybean seedlings in response to low-phosphorus stress. Front Plant Sci 13:1006806 Sugiyama A (2019) The soybean rhizosphere: metabolites, microbes, and beyond—a review. J Adv Res 19:67–73 Bont Z et al (2020) Heritable variation in root secondary metabolites is associated with recent climate. J Ecol 108(6):2611–2624 Chen Q et al (2016) Arogenate dehydratase isoforms differentially regulate anthocyanin biosynthesis in Arabidopsis thaliana. Mol Plant 9(12):1609–1619 Sun XQ, Mao ZX, Fu H et al (2014) Fatty acid characteristics of forage and its influence factors. Pratacult Sci 31(9):1774–1780 Cui D, Liu Y, Yu H et al (2021) Geographical traceability of soybean based on elemental fingerprinting and multivariate analysis. J Consum Prot Food Saf 16(4):323–331