Xây dựng mới, chú thích chức năng và phân tích transcriptome lá của cây sậy khổng lồ (Arundo donax L.) cung cấp công cụ cho việc phát triển nguồn nguyên liệu sinh liệu

Biotechnology for Biofuels - Tập 10 - Trang 1-24 - 2017
Chiara Evangelistella1, Alessio Valentini1, Riccardo Ludovisi1, Andrea Firrincieli1, Francesco Fabbrini1,2, Simone Scalabrin3, Federica Cattonaro3, Michele Morgante4,5, Giuseppe Scarascia Mugnozza1, Joost J. B. Keurentjes6, Antoine Harfouche1
1Department for innovation in biological, agro-food and forest systems, University of Tuscia, Viterbo, Italy
2Alasia Franco Vivai s.s., Savigliano, Italy
3IGA Technology Services, Udine, Italy
4Department of Agricultural and Environmental Sciences, University of Udine, Udine, Italy
5Institute of Applied Genomics, Udine, Italy
6Laboratory of Genetics, Wageningen University, Wageningen, The Netherlands

Tóm tắt

Arundo donax đã thu hút sự quan tâm trở lại như một ứng cử viên tiềm năng cho cây năng lượng sử dụng trong quá trình chuyển đổi biomass thành nhiên liệu lỏng và nhà máy sinh học. Điều này là do năng suất cao, khả năng thích ứng với điều kiện đất đai biên chế và phù hợp với sản xuất nhiên liệu sinh học và vật liệu sinh học. Mặc dù quan trọng, tài nguyên kính gene hiện có để hỗ trợ cải tiến loài này vẫn còn hạn chế. Chúng tôi đã sử dụng giải trình tự RNA (RNA-Seq) để lắp ráp và mô tả transcriptome lá của A. donax. Việc giải trình tự đã tạo ra 1249 triệu đoạn đọc sạch, được lắp ráp bằng cách sử dụng phương pháp single-k-mer và multi-k-mer thành 62,596 trình tự độc nhất (unitranscripts) với N50 là 1134 bp. Bộ phần mềm TransDecoder và Trinotate đã được sử dụng để thu được các trình tự mã hóa giả định và chú thích chúng thông qua việc ánh xạ tới các cơ sở dữ liệu UniProtKB/Swiss-Prot và UniRef90, tìm kiếm các transcript, protein, miền protein và peptid tín hiệu đã biết. Hơn nữa, các unitranscripts đã được chú thích bằng cách ánh xạ chúng tới các cơ sở dữ liệu không trùng lặp của NCBI, GO và đường dẫn KEGG thông qua Blast2GO. Transcriptome cũng được đặc trưng bởi các tìm kiếm BLAST để điều tra các transcript đồng hình của các gen chính liên quan đến các con đường chuyển hóa quan trọng như lignin, cellulose, purine và tổng hợp thiamine cũng như cố định carbon. Thêm vào đó, một tập hợp các transcript đồng hình của các gen chính liên quan đến sự phát triển khí khổng và các gen mã hóa cho protein liên quan đến căng thẳng (SAPs) đã được xác định. Ngoài ra, 8364 dấu hiệu lặp lại chuỗi đơn giản (SSR) đã được xác định và khảo sát. SSR dường như nhiều hơn ở các vùng không mã hóa (63.18%) so với vùng mã hóa (36.82%). Bộ dữ liệu SSR này đại diện cho danh mục dấu hiệu đầu tiên của A. donax. 53 SSRs (PolySSRs) sau đó được dự đoán là đa hình giữa các lắp ráp theo kiểu sinh thái đặc trưng, cho thấy sự biến đổi di truyền trong các kiểu sinh thái đã nghiên cứu. Nghiên cứu này cung cấp transcriptome lá đầu tiên có sẵn công khai cho cây năng lượng sinh học A. donax. Việc chú thích và mô tả chức năng của transcriptome sẽ rất hữu ích trong việc cung cấp cái nhìn sâu sắc về các cơ chế phân tử đặc trưng cho khả năng thích nghi cực kỳ của nó. Việc xác định các transcript đồng hình liên quan đến các con đường chuyển hóa chính mở ra một nền tảng cho việc chỉ đạo các nỗ lực cải tiến di truyền tương lai của loài này. Cuối cùng, các SSR đã được xác định sẽ tạo điều kiện cho việc khai thác đa dạng di truyền chưa được sử dụng. Transcriptome này sẽ có giá trị cho các nghiên cứu di truyền và gen học chức năng đang diễn ra trong cây trồng có giá trị kinh tế hàng đầu này.

Từ khóa

#Arundo donax #transcriptome #RNA sequencing #di truyền #sinh liệu #đa dạng di truyền

Tài liệu tham khảo

Hardion L, Verlaque R, Saltonstall K, Leriche A, Vila B. Origin of the invasive Arundo donax (Poaceae): a trans-Asian expedition in herbaria. Ann Bot. 2014;114:455–62. Corno L, Pilu R, Adani F. Arundo donax L. A non-food crop for bioenergy and bio-compound production. Biotechnol Adv. 2014;32:1535–49. Balogh E, Herr JM, Czakó M, Márton L. Defective development of male and female gametophytes in Arundo donax L. (Poaceae). Biomass Bioenergy. 2012;45:265–9. Xia Z, Xu H, Zhai J, Li D, Luo H, He C, Huang X. RNA-Seq analysis and de novo transcriptome assembly of Hevea brasiliensis. Plant Mol Biol. 2011;77:299–308. Gross SM, Martin JA, Simpson J, Abraham-Juarez MJ, Wang Z, Visel A. De novo transcriptome assembly of drought tolerant CAM plants, Agave deserti and Agave tequilana. BMC Genom. 2013;14:563. Wu T, Luo S, Wang R, Zhong Y, Xu X, Lin YE, et al. The first Illumina-based de novo transcriptome sequencing and analysis of pumpkin (Cucurbita moschata Duch.) and SSR marker development. Mol Breed. 2014;34:1437–47. Du F, Wu Y, Zhang L, Li XW, Zhao XY, Wang WH, et al. De novo assembled transcriptome analysis and SSR marker development of a mixture of six tissues from Lilium Oriental hybrid ‘Sorbonne’. Plant Mol Biol Rep. 2015;33:281–93. Jia X, Deng Y, Sun X, Liang L, Ye X. Characterization of the global transcriptome using Illumina sequencing and novel microsatellite marker information in seashore paspalum. Genes Genom. 2015;37:77–86. Martin LB, Fei Z, Giovannoni JJ, Rose JK. Catalyzing plant science research with RNA-seq. Front Plant Sci. 2013;4:66. Sablok G, Fu Y, Bobbio V, Laura M, Rotino GL, Bagnaresi P, et al. Fuelling genetic and metabolic exploration of C3 bioenergy crops through the first reference transcriptome of Arundo donax L. Plant Biotechnol J. 2014. doi:10.1111/pbi.12159. Fu Y, Poli M, Sablok G, Wang B, Liang Y, Porta N, et al. Dissection of early transcriptional responses to water stress in Arundo donax L. by unigene-based RNA-seq. Biotechnol Biofuels. 2016;9:54. Barrero RA, Guerrero FD, Moolhuijzen P, Goolsby JA, Tidwell J, Bellgard SE, et al. Shoot transcriptome of the giant reed, Arundo donax. Data Br. 2015;3:1–6. Garg R, Shankar R, Thakkar B, Kudapa H, Krishnamurthy L, Mantri N, et al. Transcriptome analyses reveal genotype-and developmental stage-specific molecular responses to drought and salinity stresses in chickpea. Sci Rep. 2016;6:19228. Carrington JC, Ambros V. Role of microRNAs in plant and animal development. Science. 2003;301(Suppl 5631):336–8. Miguel A, de Vega-Bartol J, Marum L, Chaves I, Santo T, Leitão J, et al. Characterization of the cork oak transcriptome dynamics during acorn development. BMC Plant Biol. 2015;15:158. Zhao Y, Williams R, Prakash CS, He G. Identification and characterization of gene-based SSR markers in date palm (Phoenix dactylifera L.). BMC Plant Biol. 2013;12:237–44. Li YC, Korol AB, Fahima T, Nevo E. Microsatellites within genes: structure, function, and evolution. Mol Biol Evol. 2004;21:991–1007. FastQC: a quality control tool for high throughput sequence data. 2015. http://www.bioinformatics.babraham.ac.uk/projects/fastqc/. Accessed 12 Aug 2015. FASTX-Toolkit: fastq/a short-reads pre-processing tools. 2014. http://hannonlab.cshl.edu/fastx_toolkit/index.html. Accessed 2 Oct 2015. Grabherr M, Haas B, Yassour M, Levin JZ, Thompson DA, Amit I, et al. Trinity: reconstructing a full-length transcriptome without a genome from RNA-Seq data. Nat Biotechnol. 2011;29:644–52. Robertson G, Schein J, Chiu R, Corbett R, Field M, Jackman SD, et al. De novo assembly and analysis of RNA-seq data. Nat Methods. 2010;7(Suppl 11):909–12. rnaSPAdes: de novo RNA-Seq assembler. http://bioinf.spbau.ru/en/rnaspades. Accessed 12 Nov 2015. Fu L, Niu B, Zhu Z, Wu S, Li W. CD-HIT: accelerated for clustering the next-generation sequencing data. Bioinformatics. 2012;28:3150–2. EvidentialGene: tr2aacds, mRNA transcript assembly software. 2013. http://arthropods.eugenes.org/EvidentialGene/about/EvidentialGene_trassembly_pipe.html. Accessed 15 Dec 2015. Langmead B, Salzberg SL. Fast gapped-read alignment with Bowtie 2. Nat Methods. 2012;9:357–9. Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 2009;25:1754–60. Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. The sequence alignment/map format and SAMtools. Bioinformatics. 2009;25:2078–9. EnsemblPlants FTP server. 2015. http://ftp.ensemblgenomes.org/pub/plants/release-29/fasta/. Accessed 5 Nov 2015. RNA-Seq de novo assembly using Trinity. 2015. https://github.com/trinityrnaseq/trinityrnaseq/wiki. Accessed 13 Aug 2015. Simão FA, Waterhouse RM, Ioannidis P, Kriventseva EV, Zdobnov EM. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 2015;31:3210–2. TransDecoder (find coding regions within transcripts). 2014. http://transdecoder.github.io/. Accessed 14 Jan 2016. Trinotate: transcriptome functional annotation and analysis. 2014. http://trinotate.github.io. Accessed 14 Jan 2016. The Broad Institute. 2015. https://data.broadinstitute.org/Trinity/Trinotate_v2.0_RESOURCES/. Accessed 14 Jan 2016. Finn RD, Clements J, Eddy SR. HMMER web server: interactive sequence similarity searching. Nucleic Acids Res. 2011;39:29–37. Petersen TN, Brunak S, von Heijne G, Nielsen H. Signalp 4.0: discriminating signal peptides from transmembrane regions. Nat Methods. 2011;8(Suppl 10):785–6. Conesa A, Gotz S, Garcia-Gomez JM, Terol J, Talon M, Robles M. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 2005;21(Suppl 18):3674–6. Matsunaga A, Tsugawa M, Fortes J. Cloudblast: Combining mapreduce and virtualization on distributed resources for bioinformatics applications. IEEE Fourth International Conference on eScience; 2008. MISA—MIcroSAtellite identification tool. 2002. http://pgrc.ipk-gatersleben.de/misa/. Accessed 8 Mar 2016. Xia EH, Yao QY, Zhang HB, Jiang JJ, Zhang LP, Gao LZ. CandiSSR: an efficient pipeline used for identifying candidate polymorphic SSRs based on multiple assembled sequences. Front Plant Sci. 2016;6:1171. Koressaar T, Remm M. Enhancements and modifications of primer design program Primer3. Bioinformatics. 2007;23(Suppl 10):1289–91. Untergasser A, Cutcutache I, Koressaar T, Ye J, Faircloth BC, Remm M, et al. Primer3—new capabilities and interfaces. Nucleic Acids Res. 2012;40(Suppl 15):e115. BioEdit—biological sequence alignment Editor. (http://www.mbio.ncsu.edu/bioedit/bioedit.html). Accessed 5 Dec 2016. Nakasugi K, Crowhurst R, Bally J, Waterhouse P. Combining transcriptome assemblies from multiple de novo assemblers in the allo-tetraploid plant Nicotiana benthamiana. PLoS ONE. 2014;9(Suppl 3):e91776. Miller JR, Koren S, Sutton G. Assembly algorithms for next-generation sequencing data. Genomics. 2010;95:315–27. Cantu D, Pearce SP, Distelfeld A, Christiansen MW, Uauy C, Akhunov E, et al. Effect of the down-regulation of the high Grain Protein Content (GPC) genes on the wheat transcriptome during monocarpic senescence. BMC Genom. 2011;12:492. He B, Zhao S, Chen Y, Cao Q, Wei C, Cheng X, Zhang Y. Optimal assembly strategies of transcriptome related to ploidies of eukaryotic organisms. BMC Genom. 2015;16:65. Sukrong S, Yun KY, Stadler P, Kumar C, Facciuolo T, Moffatt BA, et al. Improved growth and stress tolerance in the Arabidopsis oxt1 mutant triggered by altered adenine metabolism. Mol Plant. 2012;5(Suppl 6):1310–32. Muthamilarasan M, Khan Y, Jaishankar J, Shweta S, Lata C, Prasad M. Integrative analysis and expression profiling of secondary cell wall genes in C4 biofuel model Setaria italica reveals targets for lignocellulose bioengineering. Front Plant Sci. 2015;6:965. Richmond TA, Somerville CR. The cellulose synthase superfamily. Plant Physiol. 2000;124:495–8. Giri J, Dansana PK, Kothari KS, Sharma G, Vij S, Tyagi AK. SAPs as novel regulators of abiotic stress response in plants. BioEssays. 2013;35(Suppl 7):639–48. Wang P, Liu H, Hua H, Wang L, Song CP. A vacuole localized β-glucosidase contributes to drought tolerance in Arabidopsis. Chin Sci Bull. 2011;56(Suppl 33):3538–46. Jiang T, Zhang XF, Wang XF, Zhang DP. Arabidopsis 3-ketoacyl-CoA thiolase-2 (KAT2), an enzyme of fatty acid β-oxidation, is involved in ABA signal transduction. Plant Cell Physiol. 2011;52(Suppl 3):528–38. Baldoni E, Genga A, Cominelli E. Plant MYB transcription factors: their role in drought response mechanisms. Int J Mol Sci. 2015;16(Suppl 7):15811–51. Guo M, Liu JH, Ma X, Luo DX, Gong ZH, Lu MH. The plant heat stress transcription factors (HSFs): structure, regulation, and function in response to abiotic stresses. Front Plant Sci. 2016;7:114. Kolmos E, Nowak M, Werner M, Fischer K, Schwarz G, Mathews S, et al. Integrating ELF4 into the circadian system through combined structural and functional studies. HFSP J. 2009;3(Suppl 5):350–66. Anand A, Krichevsky A, Schornack S, Lahaye T, Tzfira T, Tang Y, et al. Arabidopsis VIRE2 INTERACTING PROTEIN2 is required for Agrobacterium T-DNA integration in plants. Plant Cell. 2007;9(Suppl 5):1695–708. Rezaei MK, Shobbar ZS, Shahbazi M, Abedini R, Zare S. Glutathione S-transferase (GST) family in barley: identification of members, enzyme activity, and gene expression pattern. J Plant Physiol. 2013;170(Suppl 14):1277–84. Xu J, Xing XJ, Tian YS, Peng RH, Xue Y, Zhao W, Yao QH. Transgenic Arabidopsis plants expressing tomato glutathione S-transferase showed enhanced resistance to salt and drought stress. PLoS ONE. 2015;10(Suppl 9):e0136960. Morgante M, De Paoli E, Radovic S. Transposable elements and the plant pan-genomes. Curr Opin Plant Biol. 2007;10:149–55. Lai J, Li R, Xu X, Jin W, Xu M, Zhao H, et al. Genome-wide patterns of genetic variation among elite maize inbred lines. Nat Genet. 2010;42:1027–30. Hirsch CN, Foerster JM, Johnson JM, Sekhon RS, Muttoni G, Vaillancourt B, et al. Insights into the maize pan-genome and pan-transcriptome. Plant Cell. 2014;26(Suppl 1):121–35. Li YH, Zhou G, Ma J, Jiang W, Jin LG, Zhang Z, et al. De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits. Nature biotechnol. 2014;32(Suppl 10):1045–52. Czaban A, Sharma S, Byrne SL, Spannagl M, Mayer KF, Asp T. Comparative transcriptome analysis within the Lolium/Festuca species complex reveals high sequence conservation. BMC Genom. 2015;16:249. He R, Kim MJ, Nelson W, Balbuena TS, Kim R, Kramer R, et al. Next-generation sequencing-based transcriptomic and proteomic analysis of the common reed, Phragmites australis (Poaceae), reveals genes involved in invasiveness and rhizome specificity. Am J Bot. 2012;99:232–47. Tian XJ, Long Y, Wang J, Zhang JW, Wang YY, Li WM, et al. De novo transcriptome assembly of common wild rice (Oryza rufipogon Griff.) and discovery of drought-response genes in root tissue based on transcriptomic data. PLoS ONE. 2015;10(Suppl 7):e0131455. Li M, Liang Z, Zeng Y, Jing Y, Wu K, Liang J, et al. De novo analysis of transcriptome reveals genes associated with leaf abscission in sugarcane (Saccharum officinarum L.). BMC Genom. 2016;17:195. Li HZ, Gao X, Li XY, Chen QJ, Dong J, Zhao WC. Evaluation of assembly strategies using RNA-Seq data associated with grain development of wheat (Triticum aestivum L.). PLoS ONE. 2013;8(Suppl 12):e83530. Krasileva KV, Buffalo V, Bailey P, Pearce S, Ayling S, Tabbita F, et al. Separating homeologs by phasing in the tetraploid wheat transcriptome. Genome Biol. 2013;14(Suppl 6):R66. Xu C, Jiao C, Zheng Y, Sun H, Liu W, Cai X, Dai S. De novo and comparative transcriptome analysis of cultivated and wild spinach. Sci Rep. 2015;5:17706. Farrell JD, Byrne S, Paina C, Asp T. De novo assembly of the perennial ryegrass transcriptome using an RNA-Seq strategy. PLoS ONE. 2014;9(Suppl 8):e103567. Fu N, Wang Q, Shen HL. De novo assembly, gene annotation and marker development using Illumina paired-end transcriptome sequences in celery (Apium graveolens L.). PLoS ONE. 2013;8(Suppl 2):e57686. Cardoso-Silva CB, Costa EA, Mancini MC, Balsalobre TWA, Canesin LEC, Rossini Pinto L, et al. De novo assembly and transcriptome analysis of contrasting sugarcane varieties. PLoS ONE. 2014;9(Suppl 2):e88462. Kanehisa M, Araki M, Goto S, Hattori M, Hirakawa M, Itoh M, et al. KEGG for linking genomes to life and the environment. Nucleic Acids Res. 2008;36(Suppl 1):D480–4. Takagi H, Ishiga Y, Watanabe S, Konishi T, Egusa M, Akiyoshi N, et al. Allantoin, a stress-related purine metabolite, can activate jasmonate signaling in a MYC2-regulated and abscisic acid-dependent manner. J Exp Bot. 2016;67(Suppl 8):2519–32. Goyer A. Thiamine in plants: aspects of its metabolism and functions. Phytochemistry. 2010;71(Suppl 14):1615–24. Rapala-Kozik M, Kowalska E, Ostrowska K. Modulation of thiamine metabolism in Zea mays seedlings under conditions of abiotic stress. J Exp Bot. 2008;59(Suppl 15):4133–43. Zhong R, Ye ZH. Secondary cell walls: biosynthesis, patterned deposition and transcriptional regulation. Plant Cell Physiol. 2015;56(Suppl 2):195–214. Poorter H, Villar R. The fate of acquired carbon in plants: chemical composition and construction costs. In: Bazzaz FA, Grace J, editors. Resource allocation in plants. San Diego: Academic Press; 1997. p. 39–72. Wang J, Nayak S, Koch K, Ming R. Carbon partitioning in sugarcane (Saccharum species). Front Plant Sci. 2013;4:201. Yoo CY, Hasegawa PM, Mickelbart MV. Regulation of stomatal density by the GTL1 transcription factor for improving water use efficiency. Plant Signal Behav. 2011;6(Suppl 7):1069–71. Vij S, Tyagi AK. Genome-wide analysis of the stress associated protein (SAP) gene family containing A20/AN1 zinc-finger (s) in rice and their phylogenetic relationship with Arabidopsis. Mol Gen Genom. 2006;276:565–75. Wang Y, Yang C, Jin Q, Zhou D, Wang S, Yu Y, et al. Genome-wide distribution comparative and composition analysis of the SSRs in Poaceae. BMC Genet. 2015;16:18. Liu Y, Zhang P, Song M, Hou J, Qing M, Wang W, et al. Transcriptome analysis and development of SSR molecular markers in Glycyrrhiza uralensis Fisch. PLoS ONE. 2015;10(Suppl 11):e0143017. Bose Mazumdar A, Chattopadhyay S. Sequencing, de novo assembly, functional annotation and analysis of Phyllanthus amarus leaf transcriptome using the Illumina platform. Front Plant Sci. 2016;6:1199. Mariani C, Cabrini R, Danin A, Piffanelli P, Fricano A, Gomarasca S, et al. Origin, diffusion and reproduction of the giant reed (Arundo donax L.): a promising weedy energy crop. Ann Appl Biol. 2010;157:191–202. Ahmad R, Liow PS, Spencer DF, Jasieniuk M. Molecular evidence for a single genetic clone of invasive Arundo donax in the United States. Aquat Bot. 2008;88:113–20. Lawson MJ, Zhang L. Distinct patterns of SSR distribution in the Arabidopsis thaliana and rice genomes. Genome Biol. 2006;7:R14. Mun JH, Kim DJ, Choi HK, Gish J, Debellé F, Mudge J. Distribution of microsatellites in the genome of Medicago truncatula: a resource of genetic markers that integrate genetic and physical maps. Genetics. 2006;172:2541–55. Hong CP, Piao ZY, Kang TW, Batley J, Yang T, Hur Y. Genomic distribution of simple sequence repeats in Brassica rapa. Mol Cells. 2007;23:349–55. Pramod S, Perkins AD, Welch ME. Patterns of microsatellite evolution inferred from the Helianthus annuus (Asteraceae) transcriptome. J Genet. 2014;93(Suppl 2):431–42. Levinson G, Gutman GA. Slipped-strand mispairing: a major mechanism for DNA sequence evolution. Mol Biol Evol. 1987;4(Suppl 3):203–21. King DG, Soller M, Kashi Y. Evolutionary tuning knobs. Endeavour. 1997;21:36–40. Trifonov EN. Tuning function of tandemly repeating sequences: a molecular device for fast adaptation. In: Wasser SP, editor. Evolutionary theory and processes: modern horizons, papers in honour of Eviatar Nevo. Berlin: Kluwer Academic Publishers; 2004. p. 115–38. Liu F, Hu Z, Liu W, Li J, Wang W, Liang Z, et al. Distribution, function and evolution characterization of microsatellite in Sargassum thunbergii (Fucales, Phaeophyta) transcriptome and their application in marker development. Sci Rep. 2016;6:18947.