Xây dựng mới, chú thích chức năng và phân tích transcriptome lá của cây sậy khổng lồ (Arundo donax L.) cung cấp công cụ cho việc phát triển nguồn nguyên liệu sinh liệu

Biotechnology for Biofuels - Tập 10 - Trang 1-24 - 2017
Chiara Evangelistella1, Alessio Valentini1, Riccardo Ludovisi1, Andrea Firrincieli1, Francesco Fabbrini1,2, Simone Scalabrin3, Federica Cattonaro3, Michele Morgante4,5, Giuseppe Scarascia Mugnozza1, Joost J. B. Keurentjes6, Antoine Harfouche1
1Department for innovation in biological, agro-food and forest systems, University of Tuscia, Viterbo, Italy
2Alasia Franco Vivai s.s., Savigliano, Italy
3IGA Technology Services, Udine, Italy
4Department of Agricultural and Environmental Sciences, University of Udine, Udine, Italy
5Institute of Applied Genomics, Udine, Italy
6Laboratory of Genetics, Wageningen University, Wageningen, The Netherlands

Tóm tắt

Arundo donax đã thu hút sự quan tâm trở lại như một ứng cử viên tiềm năng cho cây năng lượng sử dụng trong quá trình chuyển đổi biomass thành nhiên liệu lỏng và nhà máy sinh học. Điều này là do năng suất cao, khả năng thích ứng với điều kiện đất đai biên chế và phù hợp với sản xuất nhiên liệu sinh học và vật liệu sinh học. Mặc dù quan trọng, tài nguyên kính gene hiện có để hỗ trợ cải tiến loài này vẫn còn hạn chế. Chúng tôi đã sử dụng giải trình tự RNA (RNA-Seq) để lắp ráp và mô tả transcriptome lá của A. donax. Việc giải trình tự đã tạo ra 1249 triệu đoạn đọc sạch, được lắp ráp bằng cách sử dụng phương pháp single-k-mer và multi-k-mer thành 62,596 trình tự độc nhất (unitranscripts) với N50 là 1134 bp. Bộ phần mềm TransDecoder và Trinotate đã được sử dụng để thu được các trình tự mã hóa giả định và chú thích chúng thông qua việc ánh xạ tới các cơ sở dữ liệu UniProtKB/Swiss-Prot và UniRef90, tìm kiếm các transcript, protein, miền protein và peptid tín hiệu đã biết. Hơn nữa, các unitranscripts đã được chú thích bằng cách ánh xạ chúng tới các cơ sở dữ liệu không trùng lặp của NCBI, GO và đường dẫn KEGG thông qua Blast2GO. Transcriptome cũng được đặc trưng bởi các tìm kiếm BLAST để điều tra các transcript đồng hình của các gen chính liên quan đến các con đường chuyển hóa quan trọng như lignin, cellulose, purine và tổng hợp thiamine cũng như cố định carbon. Thêm vào đó, một tập hợp các transcript đồng hình của các gen chính liên quan đến sự phát triển khí khổng và các gen mã hóa cho protein liên quan đến căng thẳng (SAPs) đã được xác định. Ngoài ra, 8364 dấu hiệu lặp lại chuỗi đơn giản (SSR) đã được xác định và khảo sát. SSR dường như nhiều hơn ở các vùng không mã hóa (63.18%) so với vùng mã hóa (36.82%). Bộ dữ liệu SSR này đại diện cho danh mục dấu hiệu đầu tiên của A. donax. 53 SSRs (PolySSRs) sau đó được dự đoán là đa hình giữa các lắp ráp theo kiểu sinh thái đặc trưng, cho thấy sự biến đổi di truyền trong các kiểu sinh thái đã nghiên cứu. Nghiên cứu này cung cấp transcriptome lá đầu tiên có sẵn công khai cho cây năng lượng sinh học A. donax. Việc chú thích và mô tả chức năng của transcriptome sẽ rất hữu ích trong việc cung cấp cái nhìn sâu sắc về các cơ chế phân tử đặc trưng cho khả năng thích nghi cực kỳ của nó. Việc xác định các transcript đồng hình liên quan đến các con đường chuyển hóa chính mở ra một nền tảng cho việc chỉ đạo các nỗ lực cải tiến di truyền tương lai của loài này. Cuối cùng, các SSR đã được xác định sẽ tạo điều kiện cho việc khai thác đa dạng di truyền chưa được sử dụng. Transcriptome này sẽ có giá trị cho các nghiên cứu di truyền và gen học chức năng đang diễn ra trong cây trồng có giá trị kinh tế hàng đầu này.

Từ khóa

#Arundo donax #transcriptome #RNA sequencing #di truyền #sinh liệu #đa dạng di truyền

Tài liệu tham khảo

