Phân loại tích hợp RNA không mã hóa lớn nằm ngoài gen của người làm sáng tỏ các đặc tính toàn cầu và phân loại chuyên biệt
Tóm tắt
RNA không mã hóa lớn nằm ngoài gen (lincRNA) đang nổi lên như các yếu tố điều tiết quan trọng trong nhiều quá trình tế bào khác nhau. Xác định chức năng của từng lincRNA vẫn là một thách thức. Những tiến bộ gần đây trong phương pháp giải trình tự RNA (RNA-seq) và các phương pháp tính toán cho phép phân tích chưa từng có đối với các bản phiên mã này. Trong nghiên cứu này, chúng tôi đưa ra một phương pháp tích hợp để xác định một danh mục tham khảo gồm hơn 8000 lincRNA của người. Danh mục này hợp nhất các nguồn chú giải hiện có với các bản phiên mã chúng tôi đã tổng hợp từ dữ liệu RNA-seq thu thập từ khoảng 4 tỷ lượt đọc RNA-seq trên 24 mô và loại tế bào khác nhau. Chúng tôi mô tả từng lincRNA với một bức tranh toàn cảnh hơn 30 đặc tính, bao gồm trình tự, cấu trúc, tính sao chép và đặc điểm tương đồng giữa các loài. Chúng tôi nhận thấy rằng biểu hiện của lincRNA có độ đặc thù đáng ngạc nhiên giữa các mô hơn so với các gen mã hóa, và rằng lincRNA thường được đồng biểu hiện với các gen lân cận của nó, mặc dù đến một mức độ tương tự như các cặp gen mã hóa protein lân cận. Chúng tôi phân biệt thêm một tập con của các bản phiên mã có sự bảo tồn tiến hóa cao nhưng có thể bao gồm các ORF ngắn và có thể hoạt động như lincRNA hoặc các peptide nhỏ. Danh mục tham khảo tích hợp, toàn diện nhưng mang tính bảo thủ của chúng tôi về lincRNA người tiết lộ các đặc tính toàn cầu của lincRNA và sẽ hỗ trợ các nghiên cứu thực nghiệm cũng như phân loại chức năng sâu hơn cho các gen này.
Từ khóa
#lincRNA #RNA không mã hóa #biểu hiện mô đặc thù #đồng biểu hiện #bảo tồn tiến hóa #đọc trình tự RNA #danh mục tham khảo #phân loại chức năngTài liệu tham khảo
2010, lncRNAdb: a reference database for long noncoding RNAs, Nucleic Acids Res, 39, D146
Fuglede B , Topsoe F . 2004. Jensen-Shannon divergence and Hilbert space embedding. In Proceedings of the IEEE International Symposium on Information Theory, p. 31. doi: 10.1109/ISIT.2004.1365067.
Guttman M , Donaghey J , Carey BW , Garber M , Grenier JK , Munson G , Young G , Lucas AB , Ach R , Yang X , . 2011. lincRNAs act in the circuitry controlling pluripotency and differentiation. Nature (in press).
Pruitt K , Tatusova T , Maglott D . 2002. The reference sequence (RefSeq) project. In The NCBI handbook (ed. McEntyre J , Ostell J ), chapter 18. National Center for Biotechnology Information, Bethesda, MD. http://www.ncbi.nlm.nih.gov/books/NBK21091 .
2010, A unique chromatin signature uncovers early developmental enhancers in humans, Nature, 470, 279