Phát hiện đột biến gen tái diễn trong bối cảnh mạng lưới tương tác bằng cách sử dụng khuếch tán đồ thị đa quy mô

BMC Bioinformatics - Tập 14 - Trang 1-12 - 2013
Sepideh Babaei1,2, Marc Hulsman1, Marcel Reinders1,2, Jeroen de Ridder1,2
1Delft Bioinformatics Lab, Delft University of Technology, Delft, The Netherlands
2Netherlands Bioinformatics Centre, The Netherlands

Tóm tắt

Việc xác định các yếu tố phân tử thúc đẩy ung thư, tức là xác định các gen ung thư và các con đường mà chúng làm rối loạn, là một thách thức quan trọng trong nghiên cứu ung thư. Trong nghiên cứu này, chúng tôi nhằm mục đích xác định các con đường của những gen thường xuyên bị đột biến bằng cách khai thác khu vực lân cận mạng lưới của chúng được mã hóa trong mạng lưới tương tác protein-protein. Để đạt được điều này, chúng tôi giới thiệu một kernel khuếch tán đa quy mô và áp dụng nó cho một tập dữ liệu lớn về đột biến chèn retrovirus ở chuột. Độ mạnh của sự khuếch tán đóng vai trò như là tham số quy mô, xác định kích thước của khu vực lân cận mạng lưới được xem xét. Kết quả là, bên cạnh việc phát hiện các gen có đột biến thường xuyên trong vùng gen của chúng, chúng tôi còn tìm thấy các gen mang đột biến thường xuyên trong bối cảnh mạng lưới tương tác của chúng. Chúng tôi xác định các thành phần kết nối mật độ cao của các gen ung thư đã biết và có thể là mới, và chứng minh rằng chúng có sự phong phú mạnh mẽ cho các con đường liên quan đến ung thư ở nhiều quy mô khuếch tán khác nhau. Hơn nữa, các đột biến trong các cụm thể hiện một mẫu tương hỗ đáng kể, hỗ trợ giả thuyết rằng các gen như vậy có liên kết chức năng với nhau. Bằng cách sử dụng kernel khuếch tán đa quy mô, nhiều gen bị đột biến không thường xuyên được phát hiện là mang một số lượng đáng kể các đột biến trong khu vực lân cận mạng lưới tương tác của chúng. Nhiều trong số chúng là các gen ung thư nổi tiếng. Những kết quả này chứng minh tầm quan trọng của việc xác định các đột biến tái diễn trong khi xem xét bối cảnh mạng lưới tương tác. Quan trọng là, các gen và mạng lưới ung thư có thể được phát hiện trong nghiên cứu này được tìm thấy là có ý nghĩa ở các quy mô khuếch tán khác nhau, xác nhận sự cần thiết của một phân tích đa quy mô.

Từ khóa

#đột biến gen #mạng lưới tương tác #khuếch tán đồ thị #ung thư

Tài liệu tham khảo

Greaves M: Cancer causation: the Darwinian downside of past success? Lancet Oncol 2002,3(4):244-251. 10.1016/S1470-2045(02)00716-7 Maley CC, Galipeau PC, Li X, Sanchez CA, Paulson TG, Reid BJ: Selectively advantageous mutations and hitchhikers in neoplasms: p16 lesions are selected in Barrett’s esophagus. Cancer Res 2004,64(10):3414-327. 10.1158/0008-5472.CAN-03-3249 Nowell PC: The clonal evolution of tumor cell populations. Science 1976,194(4260):23-28. 10.1126/science.959840 Futreal PA, Coin L, Marshall M, Down T, Hubbard T, Wooster R, Rahman N, Stratton MR: A census of human cancer genes. Nat Rev Cancer 2004,4(3):177-183. 10.1038/nrc1299 Sjöblom T, Jones S, Wood L, Parsons D, Lin J, Barber T, Mandelker D, Leary R, Ptak J, Silliman N, Szabo S, Buckhaults P, Farrell C, Meeh P, Markowitz S, Willis J, Dawson D, Willson J, Gazdar A, Hartigan J, Wu L, Liu C, Parmigiani G, Park B, Bachman K, Papadopoulos N, Vogelstein B, Kinzler K, Velculescu V: The Consensus Coding Sequences of Human Breast and Colorectal Cancers. Science 2006,314(5797):268-274. 10.1126/science.1133427 Uren A, Kool J, Berns A, van Lohuizen M: Retroviral insertional mutagenesis: past, present and future. Oncogene 2005, 24: 7656-7672. 10.1038/sj.onc.1209043 Mikkers H, Nawijn M, Allen J, Brouwers C, Verhoeven E, Jonkers J, Berns A: Mice deficient for all PIM kinases display reduced body size and impaired responses to hematopoietic growth factors. Mol Cell Biol 2004, 24: 6104-6115. 10.1128/MCB.24.13.6104-6115.2004 Akagi K, Suzuki T, Stephens R, Jenkins N, Copeland N: RTCGD: retroviral tagged cancer gene database. Nucleic Acids Res 2004, 32: D523-D527. 10.1093/nar/gkh013 Erkeland S, Verhaak R, Valk P, Delwel R, Löwenberg B, Touw I: Significance of murine retroviral mutagenesis foridentification of disease genes in human acute myeloid leukemia. Cancer Res 2006, 66: 622-626. 10.1158/0008-5472.CAN-05-2908 Vogelstein B, Kinzler KW: Cancer genes and the pathways they control. Nat Med 2004,10(8):789-799. 10.1038/nm1087 Kool J, Berns A: High-throughput insertional mutagenesis screens in mice to identify oncogenic networks. Nature Rev Cancer 2009,9(6):389-399. de Ridder J, Uren A, Kool J, Reinders M, Wessels L: Detecting statistically significant common insertion sites in retroviral insertional mutagenesis screens. PLoS Comput Biol 2006,2(12):e166. 10.1371/journal.pcbi.0020166 Hanahan D, Weinberg RA: The hallmarks of cancer. Cell 2000, 100: 57-70. 10.1016/S0092-8674(00)81683-9 Hanahan D, Weinberg RA: Hallmarks of cancer: the next generation. Cell 2011,144(5):646-674. 10.1016/j.cell.2011.02.013 Pan ZZ, Wan DS, Chen G, Li LR, Lu ZH, Huang BJ: Co-mutation of p53, K-ras genes and accumulation of p53 protein and its correlation to clinicopathological features in rectal cancer. World J Gastroenterol 2004,10(24):3688-3690. de Ridder J, Kool J, Uren A, Bot J, Wessels L, Reinders M: Co-occurrence analysis of insertional mutagenesis data reveals cooperating oncogenes. Bioinformatics 2007,23(13):i133-i141. 10.1093/bioinformatics/btm202 Kanehisa M, Araki M, Goto S, Hattori M, Hirakawa M, Itoh M, Katayama T, Kawashima S, Okuda S, Tokimatsu T, Yamanishi Y: KEGG for linking genomes to life and the environment. Nucleic Acids Res 2008,36(Database issue):D480-D484. Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, Paulovich A, Pomeroy SL, Golub TR, Lander ES, Mesirov JP: Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A 2005,102(43):15545-15550. 10.1073/pnas.0506580102 Jensen LJ, Kuhn M, Stark M, Chaffron S, Creevey C, Muller J, Doerks T, Julien P, Roth A, Simonovic M, Bork P, von Mering C: STRING 8-a global view on proteins and their functional interactions in 630 organisms. Nucleic Acids Res 2009,37(Database issue):D412-D416. Kondor R, Lafferty J: Diffusion kernels on graphs and other discrete input spaces. Proceedings of the the Nineteenth International Conference on Machine Learning ICML: 8-12 July 2002; Sydney 2002, 315-322. Babaei S, van den Akker E, de Ridder J, Reinders M: Integrating protein family sequence similarities with gene expression to find signature gene networks in breast cancer metastasis. Pattern Recognit Bioinform, Lecture Notes in Computer Science 2011, 7036: 247-259. 10.1007/978-3-642-24855-9_22 Chuang HY, Lee E, Liu YT, Lee D, Ideker T: Network-based classification of breast cancer metastasis. Mol Syst Biol 2007, 3: 140. Nitsch D, Gonçalves J, Ojeda F, de Moor B, Moreau Y: Candidate gene prioritization by network analysis of differential expression using machine learning approaches. BMC Bioinformatics 2010,11(1):460. 10.1186/1471-2105-11-460 Dittrich M, Klau G, Rosenwald A, Dandekar T, Müller T: Identifying functional modules in protein-protein interaction networks: an integrated exact approach. Bioinformatics 2008, 24: i223-i231. 10.1093/bioinformatics/btn161 Ideker T, Ozier O, Schwikowski B, Siegel A: Discovering regulatory and signaling circuits in molecular interaction networks. Bioinformatics 2002, 18: S233-S240. 10.1093/bioinformatics/18.suppl_1.S233 Ulitsky I, Krishnamurthy A, Karp R, Shamir R: DEGAS: De Novo discovery of Dysregulated pathways in human diseases. PLoS ONE 2010,5(10):e13367. 10.1371/journal.pone.0013367 Vandin F, Upfal E, Raphael B: Algorithms for detecting significantly mutated pathways in cancer. J Comput Biol 2011,18(3):507-522. 10.1089/cmb.2010.0265 Chen J, Li J, Stadler W, Lussier Y: Protein-network modeling of prostate cancer gene signatures reveals essential pathways in disease recurrence. J Am Med Inform Assoc 2011, 18: 392-402. 10.1136/amiajnl-2011-000178 de Jong J, de Ridder J, van der Weyden L, Sun N, van Uitert M, Berns A, van Lohuizen M, Jonkers J, Adams D, Wessels L: Computational identification of insertional mutagenesis targets for cancer gene discovery. Nucleic Acids Res 2011,39(14):e105. Storey J, Tibshirani R: Statistical significance for genomewide studies. PNAS 2003,100(16):9440-9445. 10.1073/pnas.1530509100 Newman M, Girvan M: Finding and evaluating community structure in networks. Phys Rev 2004,69(2):026113. Smoot M, Ono K, Ruscheinski J, Wang P, Ideker T: Cytoscape 2.8: new features for data integration and network visualization. Bioinformatics 2011,27(3):431-432. 10.1093/bioinformatics/btq675 Su G, Kuchinsky A, Morris J, States D, Meng F: GLay: community structure analysis of biological networks. Bioinformatics 2010,26(24):3135-3137. 10.1093/bioinformatics/btq596 Xie C, Mao X, Huang J, Ding Y, Wu J, Dong S, Kong L, Gao G, Li C, Wei L: KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases. Nucleic Acids Res 2011, 39: W316-W322. 10.1093/nar/gkr483 Ciriello G, Cerami E, Sander C, Schultz N: Mutual exclusivity analysis identifies oncogenic network modules. Genome Res 2012,22(2):398-406. 10.1101/gr.125567.111 Milo R, Kashtan N, Itzkovitz S, Newman M, Alon U: On the uniform generation of random graphs with prescribed degree sequences. eprint arXiv:cond-mat/0312028 2004. Suzuki T, Minehata K, Akagi K, Jenkins N, Copeland N: Tumour suppressor gene identification using retroviral insertional mutagenesis in Blm-deficient mice. EMBO J 2006, 25: 3422-3431. 10.1038/sj.emboj.7601215 Rajagopalan H, Bardelli A, Lengauer C, Kinzler K, Vogelstein B, Velculescu V: Tumorigenesis: RAF/RAS oncogenes and mismatch repair status. Nature 2002,418(6901):934-934. 10.1038/418934a