Retrotransposon là gì? Các nghiên cứu khoa học liên quan

Retrotransposon là ADN di động, sao chép qua RNA rồi phiên mã ngược thành cDNA và tự chèn vào vị trí mới, cơ chế copy-and-paste làm kích thước bộ gen tăng. Chúng gồm LTR chứa gag-pol và non-LTR gồm LINE tự mã hóa, SINE ký sinh; hoạt động bị ức chế bằng methyl DNA, piRNA nhưng có thể bật lại khi stress tế bào.

Định nghĩa retrotransposon

Retrotransposon là thành phần di truyền di động trong bộ gen eukaryote, sao chép qua trung gian RNA rồi phiên mã ngược thành DNA để chèn vào vị trí mới. Khác với DNA transposon “cut-and-paste”, retrotransposon nhân bản bản sao mới mà không di chuyển bản gốc, dẫn đến tăng kích thước bộ gen theo thời gian.

Quá trình hoạt động của retrotransposon bao gồm hai bước then chốt: phiên mã RNA bởi RNA polymerase II hoặc III, sau đó phiên mã ngược (reverse transcription) nhờ enzyme reverse transcriptase. cDNA thu được được tích hợp ngẫu nhiên hoặc định hướng vào bộ gen chủ, tạo ra đột biến chèn (insertional mutagenesis).

Retrotransposon chiếm tỷ lệ đáng kể trong một số bộ gen: khoảng 8–10 % ở ruồi giấm, 30–40 % ở người và lên đến 70 % ở ngô. Chúng đóng vai trò quan trọng trong tiến hóa bộ gen, tái tổ hợp, điều hòa biểu hiện gen và hình thành các yếu tố điều hòa mới.

Phân loại retrotransposon

Retrotransposon được chia thành hai nhóm chính dựa trên cấu trúc và cơ chế vận chuyển:

  • LTR (Long Terminal Repeat) retrotransposon: chứa hai vùng LTR ở đầu 5’ và 3’ đóng vai trò promoter và terminator, bao gồm họ Ty1/Copia và Ty3/Gypsy.
  • Non-LTR retrotransposon: không có LTR, gồm LINE (Long Interspersed Nuclear Elements) có khả năng tự phiên mã ngược và SINE (Short Interspersed Nuclear Elements) phụ thuộc LINE để di chuyển.

Trong nhóm non-LTR, LINE-1 (L1) là đại diện phổ biến nhất ở người, chiếm ~17 % bộ gen và chứa hai open reading frame (ORF1, ORF2). SINE như Alu (~1 M bản sao) sử dụng ORF của LINE để phiên mã ngược và chèn cDNA.

Số lượng và độ dài trung bình khác nhau giữa các loài: LTR thường dài vài kilobase, LINE dài ~6 kb, SINE ngắn ~100–300 bp. Thông tin chi tiết có thể tra cứu qua cơ sở dữ liệu Dfam: dfam.org.

Cấu trúc phân tử

Cấu trúc điển hình của LTR retrotransposon bao gồm: 5LTR    gag    pol    3LTR5’\,LTR\;–\;gag\;–\;pol\;–\;3’\,LTR, trong đó gag mã hóa protein tạo vỏ hạt và pol chứa reverse transcriptase, integrase, RNase H.

LINE-1 có cấu trúc: 5UTR    ORF1    ORF2    3UTR    poly(A)5’\,UTR\;–\;ORF1\;–\;ORF2\;–\;3’\,UTR\;–\;poly(A). ORF1 mã hóa protein liên kết RNA, ORF2 chứa reverse transcriptase và endonuclease, UTR chứa promoter nội tại.

LoạiĐộ dàiThành phần chính
LTR5–10 kb2 LTR, gag, pol
LINE~6 kb5’UTR, ORF1, ORF2, 3’UTR, poly(A)
SINE100–300 bpPol III promoter, trình tự phụ thuộc LINE

SINE không mã hóa protein nhưng chứa trình tự tín hiệu RNA polymerase III, cho phép phiên mã mạnh mẽ và tận dụng enzyme của LINE để phiên mã ngược.

Cơ chế transposition

Cơ chế “copy-and-paste” của retrotransposon gồm ba bước chính: phiên mã RNA, phiên mã ngược thành cDNA, và tích hợp cDNA vào bộ gen. Reverse transcriptase và integrase là các enzyme thiết yếu cho quá trình này.

  1. Phiên mã RNA: promoter nội tại (LTR hoặc UTR) tạo ra bản sao RNA dài đầy đủ.
  2. Phiên mã ngược: reverse transcriptase từ pol (LTR) hoặc ORF2 (LINE) tổng hợp cDNA hai mảnh hoặc liên tục.
  3. Tích hợp: integrase (LTR) hoặc endonuclease (LINE) cắt đứt vị trí chèn, chèn cDNA vào chuỗi DNA chủ.

Sự lựa chọn vị trí chèn có thể ngẫu nhiên hoặc ưu tiên vùng giàu AT (LINE) hoặc yếu tố điều hòa (LTR), dẫn đến chất biến dị cao và khả năng tạo enhancer mới trong bộ gen.

Vai trò trong tiến hóa và cấu trúc bộ gen

Retrotransposon đóng góp tới sự mở rộng và tái cấu trúc bộ gen bằng cách chèn bản sao mới vào các vị trí khác nhau, tạo ra biến dị chèn (insertional polymorphism) và tái tổ hợp bất đối xứng. Các sự kiện chèn lặp lại dẫn tới gia tăng kích thước intron, thay đổi khoảng cách giữa các exon và có thể tạo ra exon mới qua quá trình exonization.

Các LTR retrotransposon đôi khi cung cấp yếu tố điều hòa (enhancer, promoter) cho gen lân cận khi LTR chứa trình tự nhận biết yếu tố phiên mã. Tương tự, SINE như Alu ở người có thể đóng góp vào vùng điều hòa 3’ UTR, ảnh hưởng đến ổn định và dịch mã mRNA.

Phân tích so sánh bộ gen cho thấy retrotransposon chiếm tới 40% bộ gen người, 30% ở chuột và hơn 50% ở cây ngô. Tỷ lệ này thay đổi theo loài, phản ánh lịch sử bùng nổ hoạt động của các nhóm retrotransposon khác nhau .

Phương pháp phát hiện và phân tích

Phân tích toàn bộ bộ gen (genome-wide) thường dùng công cụ RepeatMasker dựa trên thư viện Dfam để nhận diện các vùng tương đồng với retrotransposon đã biết. Ensembl TE-annotator tích hợp trong Ensembl cung cấp anot chi tiết với phân loại LINE, SINE và LTR .

Phát hiện hoạt động đương thời có thể dùng RNA-seq để xác định bản sao RNA của retrotransposon, kết hợp với Cap Analysis of Gene Expression (CAGE) để xác định điểm khởi đầu phiên mã LTR. Điều này cho phép phân tích biểu hiện retrotransposon theo mô hình mô và tế bào.

Phương pháp PCR định hướng vị trí chèn (Insertion Site PCR) kết hợp sequencing mối đứt gãy DNA (DNA break mapping) giúp xác định các vị trí chèn mới trong các mẫu ung thư hoặc quần thể sinh học. Single-molecule long-read sequencing (PacBio, Oxford Nanopore) cho phép quét toàn bộ vị trí chèn và trích xuất cấu trúc hoàn chỉnh của retrotransposon.

Điều hòa hoạt động retrotransposon

Tế bào eukaryote phát triển nhiều cơ chế ngăn chặn hoạt động của retrotransposon để duy trì tính toàn vẹn bộ gen. Các con đường siRNA và piRNA trong tế bào mầm tạo ra phức hợp RISC để cắt mRNA của retrotransposon, ngăn chặn phiên mã ngược.

DNA methylation tại CpG islands trong vùng LTR hoặc promoter của LINE-1 duy trì ở mức cao khiến promoter nội tại bất hoạt. Histone modification như H3K9me3 và H3K27me3 đóng góp vào hình thành heterochromatin tại loci retrotransposon, ngăn không cho RNA polymerase tiếp cận.

Trong stress tế bào, lão hóa hoặc ung thư, cơ chế điều hòa bị suy giảm, dẫn tới bật lại retrotransposon và tăng đột biến chèn. Sự tái hoạt động này liên quan tới khả năng tạo biến dị di truyền và có thể đóng vai trò trong kháng thuốc và tiến hóa khối u .

Ứng dụng sinh học và y sinh học

LTR promoter từ retrotransposon được khai thác để thiết kế vector biểu hiện gen có độ mạnh và tính điều hòa theo mô: ví dụ LTR từ các họ Ty1/Copia sử dụng trong nông nghiệp để biểu hiện kháng nguyên trong thực vật.

Mapping retrotransposon dùng làm công cụ đánh dấu đa hình di truyền cho phân tích cấu trúc quần thể và xác định mối quan hệ họ hàng, nhất là ở các loài chưa có bộ gen tham chiếu. SINE Alu fingerprinting được ứng dụng rộng rãi trong nhân chủng học và pháp y.

Nghiên cứu mối liên hệ retrotransposon-ung thư cho thấy LINE-1 chèn mới tại gen ức chế khối u hoặc gen sửa chữa DNA có thể kích hoạt đột biến ác tính. Do đó LINE-1 cũng được sử dụng làm chỉ báo cho tiến triển khối u và đáp ứng điều trị.

Thách thức và hướng nghiên cứu tương lai

Phần lớn retrotransposon trong bộ gen được coi là ‘dark genome’ do không biểu hiện hoặc không rõ chức năng. Xác định vai trò chức năng của các loci còn ẩn đòi hỏi tích hợp multi-omics (epigenomics, transcriptomics, proteomics) và kỹ thuật CRISPR-Cas để tạo đột biến định hướng.

Phát triển công nghệ single-cell omics kết hợp long-read sequencing có thể theo dõi động học chèn và biểu hiện retrotransposon ở cấp tế bào, giúp hiểu rõ cơ chế phân tán di truyền trong quần thể tế bào ung thư hoặc mô phát triển.

Ứng dụng machine learning để dự đoán vị trí chèn ưu tiên dựa trên đặc trưng trình tự và epigenetic landscape của bộ gen chủ là hướng nghiên cứu tiềm năng, hứa hẹn cải thiện khả năng kiểm soát hoạt động retrotransposon trong liệu pháp gen và canh tác sinh học.

Tài liệu tham khảo

  • Kazazian, H. H. Jr. (2004). Mobile elements: drivers of genome evolution. Science, 303(5664), 1626–1632.
  • Wicker, T., et al. (2007). A unified classification system for eukaryotic transposable elements. Nature Reviews Genetics, 8, 973–982.
  • Bourque, G., et al. (2018). Ten things you should know about transposable elements. Genome Biology, 19, 199.
  • RepeatMasker. repeatmasker.org.
  • Dhakshnamoorthy, J., et al. (2019). piRNA-mediated transposon silencing in germ cells. Genes & Development, 33(9–10), 538–551.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề retrotransposon:

Các Retrotransposon lồng ghép trong các vùng gian gen của bộ gen ngô Dịch bởi AI
American Association for the Advancement of Science (AAAS) - Tập 274 Số 5288 - Trang 765-768 - 1996
Cấu trúc tương đối của các gen và DNA lặp lại trong các bộ gen eukaryote phức tạp chưa được hiểu rõ. Phân tích chuỗi chẩn đoán cho thấy một vùng 280-kilobase chứa gen Adh1-F và u22 chủ yếu được hình thành từ các retrotransposon chèn vào nhau. Mười họ retroelement đã được phát hiện, với tần suất tái lặp dao động từ 10 đến 30.000 bản sao trên mỗi bộ ge...... hiện toàn bộ
The paleontology of intergene retrotransposons of maize
Nature Genetics - Tập 20 Số 1 - Trang 43-45 - 1998
DNA methylation of retrotransposon genes is regulated by Piwi family members MILI and MIWI2 in murine fetal testes
Genes and Development - Tập 22 Số 7 - Trang 908-917 - 2008
Silencing of transposable elements occurs during fetal gametogenesis in males via de novo DNA methylation of their regulatory regions. The loss of MILI (miwi-like) and MIWI2 (mouse piwi 2), two mouse homologs of Drosophila Piwi, activates retrotransposon gene expression by impairing DNA methylation in the regulatory regions of the retrotransposons. However, as it...... hiện toàn bộ
Biology of Mammalian L1 Retrotransposons
Annual Review of Genetics - Tập 35 Số 1 - Trang 501-538 - 2001
▪ Abstract  L1 retrotransposons comprise 17% of the human genome. Although most L1s are inactive, some elements remain capable of retrotransposition. L1 elements have a long evolutionary history dating to the beginnings of eukaryotic existence. Although many aspects of their retrotransposition mechanism remain poorly understood, they likely integrate into genomic DNA by a process called t...... hiện toàn bộ
Retrotransposons of rice involved in mutations induced by tissue culture.
Proceedings of the National Academy of Sciences of the United States of America - Tập 93 Số 15 - Trang 7783-7788 - 1996
Five retrotransposon families of rice (Tos1-Tos5) have been reported previously. Here we report 15 new retrotransposon families of rice (Tos6-Tos20). In contrast to yeast and Drosophila retrotransposons, all of the rice retrotransposons examined appear inactive (or almost inactive) under normal growth conditions. Three of the rice retrotransposons (Tos10, Tos17, and Tos19) are activated un...... hiện toàn bộ
Mammalian non-LTR retrotransposons: For better or worse, in sickness and in health
Genome Research - Tập 18 Số 3 - Trang 343-358 - 2008
Transposable elements (TEs) have shared an exceptionally long coexistence with their host organisms and have come to occupy a significant fraction of eukaryotic genomes. The bulk of the expansion occurring within mammalian genomes has arisen from the activity of type I retrotransposons, which amplify in a “copy-and-paste” fashion through an RNA intermediate. For better or worse, the sequen...... hiện toàn bộ
How a Retrotransposon Exploits the Plant's Heat Stress Response for Its Activation
PLoS Genetics - Tập 10 Số 1 - Trang e1004115
Reconstructing de novo silencing of an active plant retrotransposon
Nature Genetics - Tập 45 Số 9 - Trang 1029-1039 - 2013
Tổng số: 765   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10