Phát hiện các yếu tố di chuyển hoạt động trong Arabidopsis thaliana sử dụng công nghệ Giải trình tự Oxford Nanopore

Springer Science and Business Media LLC - Tập 18 - Trang 1-8 - 2017
Emilie Debladis1,2, Christel Llauro1,2, Marie-Christine Carpentier1,2, Marie Mirouze1,3, Olivier Panaud1,2,4
1Université de Perpignan Via Domitia, Laboratoire Génome et Développement des Plantes, Perpignan cedex, France
2Centre National de la Recherche Scientifique, Laboratoire Génome et Développement des Plantes, Perpignan cedex, France
3Institut de Recherche pour le Développement, UMR232 DIADE Diversité Adaptation et Développement des Plantes, Perpignan, France
4Institut Universitaire de France, Paris, France

Tóm tắt

Các yếu tố di chuyển (TE) góp phần vào cả động lực cấu trúc và chức năng của hầu hết các bộ gen eukaryote. Do tính khả năng dày đặc của chúng trong các bộ gen thực vật và động vật, việc ước lượng chính xác tác động của sự chuyển vị đến đa dạng bộ gen đã được coi là một trong những thách thức chính của bộ gen học hiện nay. Sự phát triển gần đây của công nghệ NGS (giải trình tự thế hệ tiếp theo) đã mở ra những triển vọng mới trong bộ gen học quần thể bằng cách cung cấp các phương pháp mới để phát hiện hàng loạt các Biến thể Cấu trúc liên quan đến Các yếu tố di chuyển (TEASV). Tuy nhiên, các phương pháp này dựa vào nền tảng Illumina sản xuất ra các đoạn ngắn (tối đa 350 nucleotides). Hạn chế này về kích thước của các đoạn chuỗi có thể gây ra tỷ lệ phát hiện sai cao (FDR) và do đó hạn chế khả năng phát hiện TEASV, đặc biệt trong trường hợp các bộ gen lớn và phức tạp. Các công nghệ giải trình tự mới nhất, như Oxford Nanopore Technologies (ONT) có thể tạo ra các đoạn dài kilobases, do đó tạo ra một công cụ hứa hẹn cho việc phát hiện TEASV trong thực vật và động vật. Chúng tôi trình bày kết quả của một thí nghiệm thí điểm để phát hiện TEASV trên loài thực vật mô hình Arabidopsis thaliana sử dụng giải trình tự ONT và cho thấy rằng nó có thể được sử dụng hiệu quả để phát hiện sự di chuyển của TE. Chúng tôi đã tạo ra độ phủ genome khoảng 0.8X cho một dòng gen thuần chủng tái tổ hợp epigenetic nguồn gốc từ met1 (epiRIL) bằng cách sử dụng thiết bị MinIon với hóa chất R7. Chúng tôi đã phát hiện chín bản sao mới của retrotransposon LTR Evadé (EVD). Chúng tôi cũng đã chứng minh hoạt động của transposon DNA CACTA, CAC1. Ngay cả với độ phủ chuỗi thấp (0.8X), công nghệ giải trình tự ONT cho phép chúng tôi phát hiện đáng tin cậy một số chèn TE trong bộ gen của Arabidopsis thaliana. Độ dài đoạn dài cho phép xác định chính xác và không mơ hồ các biến thể cấu trúc do hoạt động của TE gây ra. Điều này cho thấy rằng sự cân bằng giữa độ dài đoạn và độ phủ genome để phát hiện TEASV có thể nghiêng về phía độ dài đoạn. Nếu công nghệ này được cải tiến hơn nữa cả về tỷ lệ sai sót thấp hơn và chi phí vận hành, nó có thể được sử dụng hiệu quả trong các nghiên cứu đa dạng ở cấp độ quần thể.

Từ khóa

#yếu tố di chuyển #kỹ thuật giải trình tự #Arabidopsis thaliana #NGS #đa dạng gen

Tài liệu tham khảo

Britten RJ, Kohne DE. Repeated sequences in DNA. Science. 1968;161:529–40. Feschotte C, Pritham EJ. DNA transposons and the evolution of eukaryotic genomes. Annu RevGenet. 2007;41:331–68. Lisch D. How important are transposons for plant evolution? Nat Rev Genet. 2013;14:49–61. Zhao D, Ferguson AA, Jiang N. What makes up plant genomes: The vanishing line between transposable elements and genes. Biochim Biophys Acta. 1859;2016:336–80. Kobayashi S, Goto-Yamamoto N, Hirochika H. Retrotransposon-induced mutations in grape skin color. Science. 2004;304:982. Wei L, Cao X. The effect of transposable elements on phenotypic variation: insights from plants to humans. Sri China Life Sci. 2016;59:24–37. Makalowski W, Pande A, Gotea V, Makalowska I. Transposable elements and their identification. Methods Mol Biol. 2012;855:337–59. Ewing AD. Transposable element detection from whole genome sequence data. Mob DNA. 2015;6:24. Sabot F, Picault N, El-Baidouri M, Llauro C, Chaparro C, Piegu B, et al. Transpositional landscape of the rice genome revealed by paired-end mapping of high-throughput re-sequencing data. Plant J. 2011;66:241–6. Cheng C, Tarutani Y, Miyao A, Ito T, Yamazaki M, Sakai H, et al. Loss of function mutations in the rice chromomethylase OsCMT3a cause a burst of transposition. Plant J. 2015;83:1069–81. Mirouze M, Reinders J, Bucher E, Nishimura T, Schneeberger K, Ossowski S, et al. Selective epigenetic control of retrotransposition in Arabidopsis. Nature. 2009;461:427–30. Handsaker RE, Kom JM, Nemesh J, McCarroll SA. Discovery and genotyping of genome structural polymorphism by sequencing on a population scale. Nat Genet. 2011;43:269–76. Mills RE, Walker K, Stewart C, Handsaker RE, Chen K, Alkan C, et al. Mapping copy number variation by population-scale genome sequencing. Nature. 2011;470:59–65. Medvedev P, Stanciu M, Brudno M. Computational methods for discovering structural variation with next-generation sequencing. Nat Methods. 2009;6:S13–20. Ye K, Schulz MH, Long Q, Apweiler R, Ning Z. Pindel: a pattern growth approach to detect break points of large deletions and medium sized insertions from paired-end short reads. Bioinformatics. 2009;25:2865–71. Yoon S, Xuan Z, Makarov V, Ye K, Sebat J. Sensitive and accurate detection of copy number variants using read depth of coverage. Genome Res. 2009;19:1586–92. Glusman G, Severson A, Dhankani V, Robinson M, Farrah T, Mauldin DE, et al. Identification of copy number variants in whole-genome data using Reference Coverage Profiles. Front Genet. 2015;6:45. Quadrana L, Bortolini Silveira A, Mathew GF, LeBlanc C, Martienssen RA, Jeddeloh JA, et al. The Arabidopsis thaliana mobilome and its impact at the species level. elife. 2016;5:e15716. Deamer D, Akeson M, Branton D. Three decades of nano pore sequencing. Nat Biotechnol. 2016;34:518–24. Feng Y, Zhang Y, Ying C, Wang D, Du C. Nanopore-based fourth-generation DNA sequencing technology. Genomics, Proteomics Bioinformatics. 2015;13:4–16. Laver T, Harrison J, O'Neill PA, Moore K, Farbos A, Paszkiewicz K, et al. Assessing the performance of the Oxford Nanopore Technologies MinIon. Biomol Detect Quantif. 2015;3:1–8. Kurtz S, Phillippy A, Delcher AL, Smoot M, Shumway M, Antonescu C, Salzberg SL. Versatile and open software for comparing large genomes. Genome Biol. 2004;5(2):R12. Reinders J, Wulff BBH, Mirouze M, Marí-Ordóñez A, Dapp M, Rozhon W, et al. Compromised stability of DNA methylation and transposon immobilization in mosaic Arabidopsis epigenomes. Genes Dev. 2009;23:939–50. Loman NJ, Quinlan AR. Poretools: a toolkit for analyzing nanopore sequence data. Bioinformatics. 2014;30:3399–401. Koressaar T, Remm M. Enhancements and modifications of primer design program Primer3. Bioinformatics. 2007;23:1289–91.