Chú thích tiến hóa của các RNA không mã hóa dài bảo tồn ở các loài động vật có vú chính

Dechao Bu1, Haitao Luo1, Fei Jiao2, Shuangsang Fang1, ChengFu Tan1, Zhiyong Liu1, Yi Zhao1
1Key Lab of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China
2Department of Biochemistry and Molecular Biology, Binzhou Medical College, Yantai, 264003, China

Tóm tắt

Tóm tắt Các bộ gen động vật có vú chứa hàng chục nghìn RNA không mã hóa dài (lncRNAs) đã được gán cho nhiều quá trình sinh học đa dạng. Tuy nhiên, hệ transcriptome lncRNA của hầu hết các loài động vật có vú chưa được thiết lập, giới hạn việc chú thích tiến hóa cho các transcript mới này. Dựa trên dữ liệu giải trình tự RNA từ sáu mô của chín loài, chúng tôi đã xây dựng các danh mục lncRNA toàn diện (4.142–42.558 lncRNAs) bao phủ các loài động vật có vú chính. So với RNA mã hóa protein, sự biểu hiện của lncRNAs cho thấy tính đặc hiệu dòng dõi nổi bật. Đáng chú ý, mặc dù 30%–99% lncRNAs ở người được bảo tồn giữa các loài khác nhau ở cấp độ locus DNA, chỉ có 20%–27% trong số những locus lncRNA được bảo tồn này được phát hiện là có sự phiên mã, điều này tạo nên sự tương phản rõ rệt với tỷ lệ của các gen mã hóa protein được bảo tồn (48%–80%). Phát hiện này cung cấp một nguồn tài nguyên quý giá cho các nhà khoa học thực nghiệm để nghiên cứu cơ chế của lncRNAs. Hơn nữa, chúng tôi đã xây dựng cây phát sinh lncRNA biểu hiện trong chín loài động vật có vú và chứng minh rằng hồ sơ biểu hiện lncRNA có thể xác định vị trí phát sinh một cách đáng tin cậy tương tự như các đồng loại mã hóa của chúng. Dữ liệu của chúng tôi cũng tiết lộ rằng tỷ lệ tiến hóa của sự biểu hiện lncRNA khác nhau giữa các mô và cao hơn đáng kể so với các gen mã hóa protein. Nhằm đơn giản hóa các quy trình duyệt lncRNAs và phát hiện trạng thái tiến hóa của chúng, chúng tôi đã tích hợp tất cả dữ liệu được sản xuất trong nghiên cứu này vào một cơ sở dữ liệu có tên PhyloNONCODE (http://www.bioinfo.org/phyloNoncode). Công trình của chúng tôi bắt đầu đặt các lncRNAs động vật có vú vào bối cảnh tiến hóa và đại diện cho một nguồn tài nguyên phong phú cho các phân tích so sánh và chức năng của lớp gen quan trọng này.

Từ khóa


Tài liệu tham khảo

Mattick JS, Makunin IV. Non-coding RNA. Hum Mol Genet, 2006, 15: R17–R29

Ponting CP, Oliver PL, Reik W. Evolution and functions of long noncoding RNAs. Cell, 2009, 136: 629–641

Wilusz JE, Sunwoo H, Spector DL. Long noncoding RNAs: functional surprises from the RNA world. Genes Dev, 2009, 23: 1494–1504

Moran VA, Perera RJ, Khalil AM. Emerging functional and mechanistic paradigms of mammalian long non-coding RNAs. Nucleic Acids Res, 2012, 40: 6391–6400

Puvvula PK, Desetty RD, Pineau P, Marchio A, Moon A, Dejean A, Bischof O. Long noncoding RNA PANDA and scaffold-attachmentfactor SAFA control senescence entry and exit. Nat Commun, 2014, 5: 5323

Chen G, Wang Z, Wang D, Qiu C, Liu M, Chen X, Zhang Q, Yan G, Cui Q. LncRNADisease: a database for long-non-coding RNA-associated diseases. Nucleic Acids Res, 2013, 41: D983–D986

Kung JT, Colognori D, Lee JT. Long noncoding RNAs: past, present, and future. Genetics, 2013, 193: 651–669

Liu Q, Huang J, Zhou N, Zhang Z, Zhang A, Lu Z, Wu F, Mo YY. LncRNA loc285194 is a p53-regulated tumor suppressor. Nucleic Acids Res, 2013, 41: 4976–4978

Xue Y, Ma G, Gu D, Zhu L, Hua Q, Du M, Chu H, Tong N, Chen J, Zhang Z, Wang M. Genome-wide analysis of long noncoding RNA signature in human colorectal cancer. Gene, 2015, 556: 227–234

Chakravarty D, Sboner A, Nair SS, Giannopoulou E, Li R, Hennig S, Mosquera JM, Pauwels J, Park K, Kossai M, MacDonald TY, Fontugne J, Erho N, Vergara IA, Ghadessi M, Davicioni E, Jenkins RB, Palanisamy N, Chen Z, Nakagawa S, Hirose T, Bander NH, Beltran H, Fox AH, Elemento O, Rubin MA. The oestrogen receptor α-regulated lncRNA NEAT1 is a critical modulator of prostate cancer. Nat Commun, 2014, 5: 5383

Cabili MN, Trapnell C, Goff L, Koziol M, Tazon-Vega B, Regev A, Rinn JL. Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses. Genes Dev, 2011, 25: 1915–1927

Marques AC, Ponting CP. Catalogues of mammalian long noncoding RNAs: modest conservation and incompleteness. Genome Biol, 2009, 10: R124

Ponjavic J, Ponting CP, Lunter G. Functionality or transcriptional noise? Evidence for selection within long noncoding RNAs. Genome Res, 2007, 17: 556–565

Mitchell Guttman IA, Garber M, French C, French C, Lin MF, Feldser D, Huarte M, Zuk O, Carey BW, Cassady JP, Cabili MN, Jaenisch R, Mikkelsen TS, Jacks T, Hacohen N, Bernstein BE, Kellis M, Regev A, Rinn JL, Lander ES. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals. Nature, 2009, 458: 223–227

Kaessmann H. Origins, evolution, and phenotypic impact of new genes. Genome Res, 2010, 20: 1313–1326

Liz J, Portela A, Soler M, Gómez A, Ling H, Michlewski G, Calin GA, Guil S, Esteller M. Regulation of pri-miRNA processing by a long noncoding RNA transcribed from an ultraconserved region. Mol Cell, 2014, 55: 138–147

Necsulea A, Soumillon M, Warnefors M, Liechti A, Daish T, Zeller U, Baker JC, Grützner F, Kaessmann H. The evolution of lncRNA repertoires and expression patterns in tetrapods. Nature, 2014, 505: 635–640

Kutter C, Watt S, Stefflova K, Wilson MD, Goncalves A, Ponting CP, Odom DT, Marques AC. Rapid turnover of long noncoding RNAs and the evolution of gene expression. PLoS Genet, 2012, 8: e1002841

Managadze D, Rogozin IB, Chernikova D, Shabalina SA, Koonin EV. Negative correlation between expression level and evolutionary rate of long intergenic noncoding RNAs. Genome Biol Evol, 2011, 3: 1390–1404

Brawand D, Soumillon M, Necsulea A, Julien P, Csárdi G, Harrigan P, Weier M, Liechti A, Aximu-Petri A, Kircher M, Albert FW, Zeller U, Khaitovich P, Grützner F, Bergmann S, Nielsen R, Pääbo S, Kaessmann H. The evolution of gene expression levels in mammalian organs. Nature, 2011, 478: 343–348

Flicek P, Amode MR, Barrell D, Beal K, Brent S, Chen Y, Clapham P, Coates G, Fairley S, Fitzgerald S, Gordon L, Hendrix M, Hourlier T, Johnson N, Kähäri A, Keefe D, Keenan S, Kinsella R, Kokocinski F, Kulesha E, Larsson P, Longden I, McLaren W, Overduin B, Pritchard B, Riat HS, Rios D, Ritchie GR, Ruffier M, Schuster M, Sobral D, Spudich G, Tang YA, Trevanion S, Vandrovcova J, Vilella AJ, White S, Wilder SP, Zadissa A, Zamora J, Aken BL, Birney E, Cunningham F, Dunham I, Durbin R, Fernández-Suarez XM, Herrero J, Hubbard TJ, Parker A, Proctor G, Vogel J, Searle SM. Ensembl 2011. Nucleic Acids Res, 2011, 39: D800–D806

Derrien T, Johnson R, Bussotti G, Tanzer A, Djebali S, Tilgner H, Guernec G, Martin D, Merkel A, Knowles DG, Lagarde J, Veeravalli L, Ruan X, Ruan Y, Lassmann T, Carninci P, Brown JB, Lipovich L, Gonzalez JM, Thomas M, Davis CA, Shiekhattar R, Gingeras TR, Hubbard TJ, Notredame C, Harrow J, Guigó R. The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression. Genome Res, 2012, 22: 1775–1789

Liu C, Bai B, Skogerbø G, Cai L, Deng W, Zhang Y, Bu D, Zhao Y, Chen R. NONCODE: an integrated knowledge database of non-coding RNAs. Nucleic Acids Res, 2005, 33: D112–D115

He S, Liu C, Skogerbø G, Zhao H, Wang J, Liu T, Bai B, Zhao Y, Chen R. NONCODE v2. 0: decoding the non-coding. Nucleic Acids Res, 2008, 36: D170–D172

Bu D, Yu K, Sun S, Xie C, Skogerbø G, Miao R, Xiao H, Liao Q, Luo H, Zhao G, Zhao H, Liu Z, Liu C, Chen R, Zhao Y. NONCODE v3. 0: integrative annotation of long noncoding RNAs. Nucleic Acids Res, 2012, 40: D210–D215

Washietl S, Kellis M, Garber M. Evolutionary dynamics and tissue specificity of human long noncoding RNAs in six mammals. Genome Res, 2014, 24: 616–628

Merkin J, Russell C, Chen P, Burge CB. Evolutionary dynamics of gene and isoform regulation in mammalian tissues. Science, 2012, 338: 1593–1599

Fujita PA, Rhead B, Zweig AS, Hinrichs AS, Karolchik D, Cline MS, Goldman M, Barber GP, Clawson H, Coelho A, Diekhans M, Dreszer TR, Giardine BM, Harte RA, Hillman-Jackson J, Hsu F, Kirkup V, Kuhn RM, Learned K, Li CH, Meyer LR, Pohl A, Raney BJ, Rosenbloom KR, Smith KE, Haussler D, Kent WJ. The UCSC genome browser database: update 2011. Nucleic Acids Res, 2011, 39: D876–D882

Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics, 2009, 25: 1105–1111

Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel H, Salzberg SL, Rinn JL, Pachter L. Differential gene and transcript expression analysis of RNA-Seq experiments with tophat and cufflinks. Nat Protoc, 2012, 7: 562–578

Sun L, Luo H, Bu D, Zhao G, Yu K, Zhang C, Liu Y, Chen R, Zhao Y. Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts. Nucleic Acids Res, 2013, 41: e166

Harrow J, Frankish A, Gonzalez JM, Tapanari E, Diekhans M, Kokocinski F, Aken BL, Barrell D, Zadissa A, Searle S, Barnes I, Bignell A, Boychenko V, Hunt T, Kay M, Mukherjee G, Rajan J, Despacio-Reyes G, Saunders G, Steward C, Harte R, Lin M, Howald C, Tanzer A, Derrien T, Chrast J, Walters N, Balasubramanian S, Pei B, Tress M, Rodriguez JM, Ezkurdia I, van Baren J, Brent M, Haussler D, Kellis M, Valencia A, Reymond A, Gerstein M, Guigó R, Hubbard TJ. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res, 2012, 22: 1760–1774

Kent WJ, Baertsch R, Hinrichs A, Miller W, Haussler D. Evolution’s cauldron: duplication, deletion, and rearrangement in the mouse and human genomes. Proc Natl Acad Sci USA, 2003, 100: 11484–11489

Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W. Human-mouse alignments with BLASTZ. Genome Res, 2003, 13: 103–107

Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol, 2010, 28: 511–515

Saitou N, Nei M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol, 1987, 4: 406–425

Studier JA, Keppler KJ. A note on the neighbor-joining algorithm of Saitou and Nei. Mol Biol Evol, 1988, 5: 729–731

Paradis E, Claude J, Strimmer K. APE: analyses of phylogenetics and evolution in R language. Bioinformatics, 2004, 20: 289–290

Rens W, O’Brien PC, Grutzner F, Clarke O, Graphodatskaya D, Tsend-Ayush E, Trifonov VA, Skelton H, Wallis MC, Johnston S, Veyrunes F, Graves JA, Ferguson-Smith MA. The multiple sex chromosomes of platypus and echidna are not completely identical and several share homology with the avian Z. Genome Biol, 2007, 8: R243

He S, Liu S, Zhu H. The sequence, structure and evolutionary features of hotair in mammals. BMC Evol Biol, 2011, 11: 102

Mustafi D, Kevany BM, Bai X, Maeda T, Sears JE, Khalil AM, Palczewski K. Evolutionarily conserved long intergenic non-coding RNAs in the eye. Hum Mol Genet, 2013, 22: 2992–3002

Wu T, Wang J, Liu C, Zhang Y, Shi B, Zhu X, Zhang Z, Skogerbø G, Chen L, Lu H, Zhao Y, Chen R. NPInter: the noncoding RNAs and protein related biomacromolecules interaction database. Nucleic Acids Res, 2006, 34: D150–D152

Yin Y, Zhao Y, Wang J, Liu C, Chen S, Chen R, Zhao H. antiCODE: a natural sense-antisense transcripts database. BMC Bioinformatics, 2007, 8: 319

Liao Q, Xiao H, Bu D, Xie C, Miao R, Luo H, Zhao G, Yu K, Zhao H, Skogerbø G, Chen R, Wu Z, Liu C, Zhao Y. ncFANs: a web server for functional annotation of long non-coding RNAs. Nucleic Acids Res, 2011, 39: W118–W124

Roberts TC, Morris KV, Weinberg MS. Perspectives on the mechanism of transcriptional regulation by long non-coding RNAs. Epigenetics, 2014, 9: 13–20

Pennisi E. Lengthy RNAs earn respect as cellular players. Science, 2014, 344: 1072–1072

Lau E. Non-coding RNA: zooming in on lncRNA functions. Nat Rev Genet, 2014, 15: 574–575

Alvarez-Dominguez JR, Hu W, Yuan B, Shi J, Park SS, Gromatzky AA, van Oudenaarden A, Lodish HF. Global discovery of erythroid long noncoding RNAs reveals novel regulators of red cell maturation. Blood, 2014, 123: 570–581