Kiểm định nhanh và nhạy các bản sao gen fusion trong dữ liệu giải trình tự toàn bộ gen

BMC Bioinformatics - Tập 24 - Trang 1-14 - 2023
Völundur Hafstað1, Jari Häkkinen1, Helena Persson1
1Faculty of Medicine, Department of Clinical Sciences Lund, Oncology, Lund University Cancer Centre, Lund, Sweden

Tóm tắt

Trong ung thư, các rearrangement gen có thể tạo ra các gen fusion, kết hợp chuỗi mã hóa protein từ hai gen đối tác khác nhau hoặc đặt một gen dưới sự kiểm soát của promoter của một gen khác. Các gen fusion này có thể hoạt động như là những nhân tố kích thích ung thư trong sự phát triển của khối u và một số trường hợp fusion liên quan đến kinase đã được khai thác thành công làm mục tiêu trị liệu. Các fusion thể hiện có thể được xác định trong dữ liệu giải trình tự RNA (RNA-Seq), nhưng phần mềm dự đoán fusion thường có tỷ lệ cao các dự đoán bản sao fusion giả tích cực. Điều này gây ra vấn đề cho cả ứng dụng nghiên cứu và lâm sàng. Chúng tôi mô tả một phương pháp để xác thực các bản sao fusion được phát hiện bởi RNA-Seq trong dữ liệu giải trình tự toàn bộ gen (WGS) đã được ghép cặp. Quy trình của chúng tôi sử dụng các cặp đọc không phù hợp để xác định các sự kiện fusion được hỗ trợ và phân tích các căn chỉnh đọc mềm bị cắt để xác định các điểm đứt gãy gen. Chúng tôi đã thử nghiệm nó trên dữ liệu RNA-Seq và WGS đã được ghép cặp cho cả khối u và các dòng tế bào ung thư và cho thấy rằng nó có thể được sử dụng để xác thực cả các gen fusion dự đoán mới và các sự kiện fusion đã được xác thực thí nghiệm. Nó nhanh hơn và nhạy hơn đáng kể so với việc sử dụng BreakDancer và Manta, phần mềm thay vào đó được thiết kế để phát hiện nhiều loại biến thể cấu trúc khác nhau trên quy mô toàn bộ bộ gen. Chúng tôi đã phát triển một quy trình nhanh và rất nhạy để xác thực các gen fusion được phát hiện bởi RNA-Seq trong dữ liệu WGS đã được ghép cặp. Nó có thể được sử dụng để xác định các gen fusion chất lượng cao cho các nghiên cứu sinh học thông tin và thí nghiệm tiếp theo, bao gồm xác thực các điểm đứt gãy gen và nghiên cứu các cơ chế tạo ra fusion. Trong một môi trường lâm sàng, nó có thể giúp tìm kiếm các gen fusion thể hiện cho liệu pháp cá thể hóa.

Từ khóa

#gen fusion #RNA-Seq #giải trình tự toàn bộ gen #xác thực #đột biến gen

Tài liệu tham khảo

Al-Salama ZT, Keam SJ. Entrectinib: first global approval. Drugs. 2019;79(13):1477–83. Drilon A, Laetsch TW, Kummar S, DuBois SG, Lassen UN, Demetri GD, Nathenson M, Doebele RC, Farago AF, Pappo AS, et al. Efficacy of larotrectinib in TRK fusion-positive cancers in adults and children. N Engl J Med. 2018;378(8):731–9. Druker BJ. STI571 (Gleevec) as a paradigm for cancer therapy. Trends Mol Med. 2002;8(4 Suppl):S14-18. Hoy SM. Pemigatinib: first approval. Drugs. 2020;80(9):923–9. Markham A. Selpercatinib: first approval. Drugs. 2020;80(11):1119–24. Sahu A, Prabhash K, Noronha V, Joshi A, Desai S. Crizotinib: a comprehensive review. South Asian J Cancer. 2013;2(2):91–7. Perner S, Mosquera JM, Demichelis F, Hofer MD, Paris PL, Simko J, Collins C, Bismar TA, Chinnaiyan AM, De Marzo AM, et al. TMPRSS2-ERG fusion prostate cancer: an early molecular event associated with invasion. Am J Surg Pathol. 2007;31(6):882–8. Ramani NS, Chen H, Broaddus RR, Lazar AJ, Luthra R, Medeiros LJ, Patel KP, Rashid A, Routbort MJ, Stewart J, et al. Utilization of cytology smears improves success rates of RNA-based next-generation sequencing gene fusion assays for clinically relevant predictive biomarkers. Cancer Cytopathol. 2021;129(5):374–82. Lee JK, Hazar-Rethinam M, Decker B, Gjoerup O, Madison RW, Lieber DS, Chung JH, Schrock AB, Creeden J, Venstrom J, et al. The pan-tumor landscape of targetable kinase fusions in circulating tumor DNA. Clin Cancer Res. 2022;28(4):728–37. Hibbard MK, Kozakewich HP, Dal Cin P, Sciot R, Tan X, Xiao S, Fletcher JA. PLAG1 fusion oncogenes in lipoblastoma. Cancer Res. 2000;60(17):4869–72. Jin Y, Mertens F, Kullendorff CM, Panagopoulos I. Fusion of the tumor-suppressor gene CHEK2 and the gene for the regulatory subunit B of protein phosphatase 2 PPP2R2A in childhood teratoma. Neoplasia. 2006;8(5):413–8. Hafstad V, Sokilde R, Hakkinen J, Larsson M, Vallon-Christersson J, Rovira C, Persson H. Regulatory networks and 5’ partner usage of miRNA host gene fusions in breast cancer. Int J Cancer. 2022;151(1):95–106. Persson H, Sokilde R, Hakkinen J, Pirona AC, Vallon-Christersson J, Kvist A, Mertens F, Borg A, Mitelman F, Hoglund M, et al. Frequent miRNA-convergent fusion gene events in breast cancer. Nat Commun. 2017;8(1):788. Persson H, Sokilde R, Hakkinen J, Vallon-Christersson J, Mitelman F, Borg A, Hoglund M, Rovira C. Analysis of fusion transcripts indicates widespread deregulation of snoRNAs and their host genes in breast cancer. Int J Cancer. 2020;146(12):3343–53. Johansson B, Mertens F, Schyman T, Bjork J, Mandahl N, Mitelman F. Most gene fusions in cancer are stochastic events. Genes Chromosom Cancer. 2019;58(9):607–11. Creason A, Haan D, Dang K, Chiotti KE, Inkman M, Lamb A, Yu T, Hu Y, Norman TC, Buchanan A, et al. A community challenge to evaluate RNA-seq, fusion detection, and isoform quantification methods for cancer discovery. Cell Syst. 2021;12(8):827-838e825. Liu S, Tsai WH, Ding Y, Chen R, Fang Z, Huo Z, Kim S, Ma T, Chang TY, Priedigkeit NM, et al. Comprehensive evaluation of fusion transcript detection algorithms and a meta-caller to combine top performing methods in paired-end RNA-seq data. Nucleic Acids Res. 2016;44(5): e47. Danecek P, Bonfield JK, Liddle J, Marshall J, Ohan V, Pollard MO, Whitwham A, Keane T, McCarthy SA, Davies RM, et al. Twelve years of SAMtools and BCFtools. Gigascience. 2021;10(2):giab008. Ghandi M, Huang FW, Jane-Valbuena J, Kryukov GV, Lo CC, McDonald ER 3rd, Barretina J, Gelfand ET, Bielski CM, Li H, et al. Next-generation characterization of the Cancer Cell Line Encyclopedia. Nature. 2019;569(7757):503–8. Nicorici D, Şatalan M, Edgren H, Kangaspeska S, Murumägi A, Kallioniemi O, Virtanen S, Kilkku O. FusionCatcher—a tool for finding somatic fusion genes in paired-end RNA-sequencing data. bioRxiv. 2014:011650. Uhrig S, Ellermann J, Walther T, Burkhardt P, Frohlich M, Hutter B, Toprak UH, Neumann O, Stenzinger A, Scholl C, et al. Accurate and efficient detection of gene fusions from RNA sequencing data. Genome Res. 2021;31(3):448–60. van Belzen I, Cai C, van Tuil M, Badloe S, Strengman E, Janse A, Verwiel ETP, van der Leest DFM, Kester L, Molenaar JJ, et al. Systematic discovery of gene fusions in pediatric cancer by integrating RNA-seq and WGS. BMC Cancer. 2023;23(1):618. Vellichirammal NN, Albahrani A, Banwait JK, Mishra NK, Li Y, Roychoudhury S, Kling MJ, Mirza S, Bhakat KK, Band V, et al. Pan-cancer analysis reveals the diverse landscape of novel sense and antisense fusion transcripts. Mol Ther Nucleic Acids. 2020;19:1379–98. Lee M, Lee K, Yu N, Jang I, Choi I, Kim P, Jang YE, Kim B, Kim S, Lee B, et al. ChimerDB 3.0: an enhanced database for fusion genes from cancer transcriptome and literature data mining. Nucleic Acids Res. 2017;45(D1):D784–9. Asmann YW, Hossain A, Necela BM, Middha S, Kalari KR, Sun Z, Chai HS, Williamson DW, Radisky D, Schroth GP, et al. A novel bioinformatics pipeline for identification and characterization of fusion transcripts in breast cancer and normal cell lines. Nucleic Acids Res. 2011;39(15): e100. Edgren H, Murumagi A, Kangaspeska S, Nicorici D, Hongisto V, Kleivi K, Rye IH, Nyberg S, Wolf M, Borresen-Dale AL, et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome Biol. 2011;12(1):R6. Kangaspeska S, Hultsch S, Edgren H, Nicorici D, Murumagi A, Kallioniemi O. Reanalysis of RNA-sequencing data reveals several additional fusion genes with multiple isoforms. PLoS ONE. 2012;7(10): e48745. Maher CA, Palanisamy N, Brenner JC, Cao X, Kalyana-Sundaram S, Luo S, Khrebtukova I, Barrette TR, Grasso C, Yu J, et al. Chimeric transcript discovery by paired-end transcriptome sequencing. Proc Natl Acad Sci USA. 2009;106(30):12353–8. Drexler HG, MacLeod RA, Uphoff CC. Leukemia cell lines: in vitro models for the study of Philadelphia chromosome-positive leukemia. Leuk Res. 1999;23(3):207–15. Gu Y, Nakamura T, Alder H, Prasad R, Canaani O, Cimino G, Croce CM, Canaani E. The t(4;11) chromosome translocation of human acute leukemias fuses the ALL-1 gene, related to Drosophila trithorax, to the AF-4 gene. Cell. 1992;71(4):701–8. Matsuo Y, MacLeod RA, Uphoff CC, Drexler HG, Nishizaki C, Katayama Y, Kimura G, Fujii N, Omoto E, Harada M, et al. Two acute monocytic leukemia (AML-M5a) cell lines (MOLM-13 and MOLM-14) with interclonal phenotypic heterogeneity showing MLL-AF9 fusion resulting from an occult chromosome insertion, ins(11;9)(q23;p22p23). Leukemia. 1997;11(9):1469–77. Odero MD, Zeleznik-Le NJ, Chinwalla V, Rowley JD. Cytogenetic and molecular analysis of the acute monocytic leukemia cell line THP-1 with an MLL-AF9 translocation. Genes Chromosomes Cancer. 2000;29(4):333–8. Sanda T, Lawton LN, Barrasa MI, Fan ZP, Kohlhammer H, Gutierrez A, Ma W, Tatarek J, Ahn Y, Kelliher MA, et al. Core transcriptional regulatory circuit controlled by the TAL1 complex in human T cell acute lymphoblastic leukemia. Cancer Cell. 2012;22(2):209–21. Liu Y, Klein J, Bajpai R, Dong L, Tran Q, Kolekar P, Smith JL, Ries RE, Huang BJ, Wang YC, et al. Etiology of oncogenic fusions in 5190 childhood cancers and its clinical and therapeutic implication. Nat Commun. 2023;14(1):1739.