Mô hình hồi quy tuyến tính nhiều chức năng để phân tích liên kết giữa RNA-seq và hình ảnh

Junhai Jiang1, Nan Lin1, Shicheng Guo2,1, Jinyun Chen3, Momiao Xiong1
1Human Genetics Center, Division of Biostatistics, School of Public Health, The University of Texas, Houston, USA
2State Key Laboratory of Genetic Engineering and Ministry of Education Key Laboratory of Contemporary Anthropology, Collaborative Innovation Center for Genetics and Development, School of Life Sciences and Institutes of Biomedical Sciences, Fudan University, Shanghai, China
3Department of Epidemiology, Division of OVP, Cancer Prevention and Population Sciences, MD Anderson Cancer Center, The University of Texas, Houston, USA

Tóm tắt

Phân tích tổng hợp nổi bật giữa dữ liệu hình ảnh giải phẫu và dữ liệu gen chưa được phát triển tối ưu, cung cấp thông tin vô giá cho việc khám phá toàn diện cấu trúc gen của bệnh và có tiềm năng mở ra một con đường mới để phát hiện các gen nhạy cảm với bệnh mới, những gen này không thể được nhận diện nếu được phân tích riêng lẻ. Một vấn đề chính trong việc thành công của phân tích dữ liệu hình ảnh và gen là làm thế nào để giảm thiểu kích thước của chúng. Hầu hết các phương pháp trước đây để trích xuất thông tin hình ảnh và giảm kích thước dữ liệu RNA-seq không khai thác thông tin không gian hình ảnh và thường bỏ qua sự biến đổi biểu hiện gen ở mức vị trí gen. Để khắc phục những hạn chế này, chúng tôi đã mở rộng phân tích thành phần chính chức năng từ một chiều sang hai chiều (2DFPCA) để đại diện cho dữ liệu hình ảnh và phát triển một mô hình hồi quy tuyến tính nhiều chức năng (MFLM) trong đó các điểm số chính chức năng của hình ảnh được coi là nhiều đặc tính định lượng và hồ sơ RNA-seq trên một gen được coi là một hàm dự đoán để đánh giá mối liên hệ giữa biểu hiện gen với hình ảnh. Phương pháp đã phát triển đã được áp dụng cho dữ liệu hình ảnh và RNA-seq trong các nghiên cứu ung thư buồng trứng và ung thư biểu mô tế bào thận rõ rệt (KIRC). Chúng tôi xác định được 24 và 84 gen có biểu hiện liên quan đến biến đổi hình ảnh trong các nghiên cứu ung thư buồng trứng và KIRC, tương ứng. Kết quả của chúng tôi cho thấy rằng nhiều gen có liên kết đáng kể với hình ảnh không biểu hiện khác biệt, nhưng đã tiết lộ các chức năng hình thái và chuyển hóa của chúng. Các kết quả cũng cho thấy rằng các đỉnh của hàm hồi quy ước lượng trong MFLM thường cho phép phát hiện các vị trí cắt ghép và nhiều isoform của biểu hiện gen.

Từ khóa


Tài liệu tham khảo

Hibar, D. P., Kohannim, O., Stein, J. L., Chiang, M. C. and Thompson, P. M. (2011) Multilocus genetic analysis of brain images. Front. Genet., 2, 73 Liu, J. and Calhoun, V. D. (2014) A review of multivariate analyses in imaging genetics. Front. Neuroinform., 8, 29 Stingo, F. C., Guindani, M., Vannucci, M. and Calhoun, V. D. (2013) An integrative Bayesian modeling approach to imaging genetics. J. Am. Stat. Assoc., 108, 876 Chi, E. C., Allen, G. I., Zhou, H., Kohannim, O., Lange, K. and Thompson, P. M. (2013) Imagine genetics via sparse canonical correlation analysis. Proceedings / IEEE International Symposium on Biomedical Imaging: from nano to macro IEEE International Symposium on Biomedical Imaging., 740–743. Burges, C. J. C. (2010) Dimension reduction: A guided tour. Found. Trends Mach. Learn., 2, 275–365 Gupta, M. R. and Jacobson, N. N. P. (2006) Wavelet principal component analysis and its application to hyperspectral images. Image Processing, IEEE Int. Conf. 1585–1588. Ramsay, J. O. and Silverman, B. W. (2005) Functional Data Analysis. 2nd edition. Heidelberg: Springer, 147–172. Ray, M. and Zhang, W. (2009) Integrating gene expression and phenotypic information to analyze Alzheimer’s disease. J. Alzheimers Dis., 16, 73–84 Wu, T., Sun, W., Yuan, S., Chen, C. H. and Li, K. C. (2008) A method for analyzing censored survival phenotype with gene expression data. BMC Bioinformatics, 9, 417 Sun, Z. and Zhu, Y. (2012) Systematic comparison of RNA-Seq normalization methods using measurement error models. Bioinformatics, 28, 2584–2591 Anders, S., Reyes, A. and Huber, W. (2012) Detecting differential usage of exons from RNA-seq data. Genome Res., 22, 2008–2017 Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G., Abecasis, G., Durbin, R., and 1000 Genome Project Data Processing Subgroup. (2009) The sequence alignment/map format and SAMtools. Bioinformatics, 25, 2078–2079 Delhomme, N., Padioleau, I., Furlong, E. E. and Steinmetz, L. M. (2012) easyRNASeq: a bioconductor package for processing RNA-Seq data. Bioinformatics, 28, 2532–2533 Lowe, D. G. (1999) Object recognition from local scale-invariant features. The Proceedings of the Seventh IEEE International Conference on Computer Vision, 2, 1150–1157. Wu, K., Zhang, L., Lin, Y., Yang, K. and Cheng, Y. (2014) Inhibition of γ-secretase induces G2/M arrest and triggers apoptosis in renal cell carcinoma. Oncol Lett, 8, 55–61 Williams, J. M., Johnson, A. C., Stelloh, C., Dreisbach, A. W., Franceschini, N., Regner, K. R., Townsend, R. R., Roman, R. J. and Garrett, M. R. (2012) Genetic variants in Arhgef11 are associated with kidney injury in the Dahl salt-sensitive rat. Hypertension, 60, 1157–1168 Zhang, G., Liu, R., Zhong, Y., Plotnikov, A. N., Zhang, W., Zeng, L., Rusinova, E., Gerona-Nevarro, G., Moshkina, N., Joshua, J., et al. (2012) Down-regulation of NF-κB transcriptional activity in HIVassociated kidney disease by BRD4 inhibition. J. Biol. Chem., 287, 28840–28851 Hernandez, P. and Tirnauer, J. S. (2010) Tumor suppressor interactions with microtubules: keeping cell polarity and cell division on track. Dis. Model. Mech., 3, 304–315 Liu, R., Loraine, A. E. and Dickerson, J. A. (2014) Comparisons of computational methods for differential alternative splicing detection using RNA-seq in plant systems. BMC Bioinformatics, 15, 364 Wang, W., Qin, Z., Feng, Z., Wang, X. and Zhang, X. (2013) Identifying differentially spliced genes from two groups of RNA-seq samples. Gene, 518, 164–170 Rasetti, R. and Weinberger, D. R. (2011) Intermediate phenotypes in psychiatric disorders. Curr. Opin. Genet. Dev., 21, 340–348 Della Peruta, M., Martinelli, G., Moratti, E., Pintani, D., Vezzalini, M., Mafficini, A., Grafone, T., Iacobucci, I., Soverini, S., Murineddu, M., et al. (2010) Protein tyrosine phosphatase receptor type γ is a functional tumor suppressor gene specifically downregulated in chronic myeloid leukemia. Cancer Res., 70, 8896–8906 van Niekerk, C. C. and Poels, L. G. (1999) Reduced expression of protein tyrosine phosphatase gamma in lung and ovarian tumors. Cancer Lett., 137, 61–73 D’Ambrogio, A., Nagaoka, K. and Richter, J. D. (2013) Translational control of cell growth and malignancy by the CPEBs. Nat. Rev. Cancer, 13, 283–290 Hansen, C. N., Ketabi, Z., Rosenstierne, M.W., Palle, C., Boesen, H. C. and Norrild, B. (2009) Expression of CPEB, GAPDH and U6snRNA in cervical and ovarian tissue during cancer development. APMIS, 117, 53–59 Ooishi, R., Shirai, M., Funaba, M. and Murakami, M. (2012) Microphthalmia-associated transcription factor is required for mature myotube formation. Biochim. Biophys. Acta, 1820, 76–83 Senchenko, V. N., Liu, J., Loginov, W., Bazov, I., Angeloni, D., Seryogin, Y., Ermilova, V., Kazubskaya, T., Garkavtseva, R., Zabarovska, V. I., et al. (2004) Discovery of frequent homozygous deletions in chromosome 3p21.3 LUCA and AP20 regions in renal, lung and breast carcinomas. Oncogene, 23, 5719–5728 Gu, J., Wu, X., Dong, Q., Romeo, M. J., Lin, X., Gutkind, J. S. and Berman, D. M. (2006) A nonsynonymous single-nucleotide polymorphism in the PDZ-Rho guanine nucleotide exchange factor (Ser1416Gly) modulates the risk of lung cancer in Mexican Americans. Cancer, 106, 2707–2715 Rodriguez-Paredes, M., Martinez de Paz, A., Simó-Riudalbas, L., Sayols, S., Moutinho, C., Moran, S., Villanueva, A., Vázquez-Cedeira, M., Lazo, P. A., Carneiro, F., et al. (2014) Gene amplification of the histone methyltransferase SETDB1 contributes to human lung tumorigenesis. Oncogene, 33, 2807–2813 Zhou, C., Chen, H., Han, L., Wang, A. and Chen, L. A. (2014) Identification of featured biomarkers in different types of lung cancer with DNA microarray. Mol. Biol. Rep., 41, 6357–6363 Knobel, P. A., Kotov, I. N., Felley-Bosco, E., Stahel, R. A. and Marti, T. M. (2011) Inhibition of REV3 expression induces persistent DNA damage and growth arrest in cancer cells. Neoplasia, 13, 961–970 Doles, J., Oliver, T. G., Cameron, E. R., Hsu, G., Jacks, T., Walker, G. C. and Hemann, M. T. (2010) Suppression of Rev3, the catalytic subunit of Polζ, sensitizes drug-resistant lung tumors to chemotherapy. Proc. Natl. Acad. Sci. USA, 107, 20786–20791 Varadi, V., Bevier, M., Grzybowska, E., Johansson, R., Enquist, K., Henriksson, R., Butkiewicz, D., Pamula-Pilat, J., Tecza, K., Hemminki, K., et al. (2011) Genetic variation in genes encoding for polymerase ζ subunits associates with breast cancer risk, tumour characteristics and survival. Breast Cancer Res. Treat., 129, 235–245 Chantôme, A., Potier-Cartereau, M., Clarysse, L., Fromont, G., Marionneau-Lambot, S., Guéguinou, M., Pagès, J. C., Collin, C., Oullier, T., Girault, A., et al. (2013) Pivotal role of the lipid Raft SK3-Orai1 complex in human cancer cell migration and bone metastases. Cancer Res., 73, 4852–4861 Ioana, M., Angelescu, C., Burada, F., Mixich, F., Riza, A., Dumitrescu, T., Alexandru, D., Ciurea, T., Cruce, M. and Saftoiu, A. (2010) MMR gene expression pattern in sporadic colorectal cancer. J Gastrointestin Liver Dis, 19, 155–159 Yan, Y., Yang, F. Q., Zhang, H. M., Li, J., Li, W., Wang, G. C., Che, J. P., Zheng, J. H. and Liu, M. (2014) Bromodomain 4 protein is a predictor of survival for urothelial carcinoma of bladder. Int. J. Clin. Exp. Pathol., 7, 4231–4238 Bokhari, A. A., Lee, L. R., Raboteau, D., Hamilton, C. A., Maxwell, G. L., Rodriguez, G. C. and Syed, V. (2014) Progesterone inhibits endometrial cancer invasiveness by inhibiting the TGFß pathway. Cancer Prev. Res., 7, 1045–1055 Zhang, B., Jia,W. H., Matsuda, K., Kweon, S. S., Matsuo, K., Xiang, Y. B., Shin, A., Jee, S. H., Kim, D. H., Cai, Q., et al., (2014) Large-scale genetic study in East Asians identifies six new loci associated with colorectal cancer risk. Nat. Genet., 46, 533–542 Chen, X., Ran, Z. H., Tong, J. L., Nie, F., Zhu, M. M., Xu, X. T. and Xiao, S. D. (2011) RNA interference (RNAi) of Ufd1 protein can sensitize a hydroxycamptothecin-resistant colon cancer cell line SW1116/HCPT to hydroxycamptothecin. J. Dig. Dis., 12, 110–116 Hwang, J. and Pallas, D. C. (2014) STRIPAK complexes: structure, biological function, and involvement in human diseases. Int. J. Biochem. Cell Biol., 47, 118–148 Landau, W. M. and Liu, P. (2013) Dispersion estimation and its effect on test performance in RNA-seq data analysis: a simulation-based comparison of methods. PLoS One, 8, e81415 Birzele, F., Csaba, G. and Zimmer, R. (2008) Alternative splicing and protein structure evolution. Nucleic Acids Res., 36, 550–558 Shapiro, I. M., Cheng, A.W., Flytzanis, N. C., Balsamo, M., Condeelis, J. S., Oktay, M. H., Burge, C. B. and Gertler, F. B. (2011) An EMTdriven alternative splicing program occurs in human breast cancer and modulates cellular phenotype. PLoS Genet., 7, e1002218 Siegel, R., Naishadham, D. and Jemal, A. (2012) Cancer statistics, 2012. CA: Cancer J. Clin., 62, 10–29 Li, M., Fu, W., Wo, L., Shu, X., Liu, F. and Li, C. (2013) miR-128 and its target genes in tumorigenesis and metastasis. Exp. Cell Res., 319, 3059–3064 Xu, L., Xiang, J., Shen, J., Zou, X., Zhai, S., Yin, Y., Li, P., Wang, X. and Sun, Q. (2013) Oncogenic MicroRNA-27a is a target for genistein in ovarian cancer cells. Anticancer. Agents Med. Chem., 13, 1126–1132 Ohyagi-Hara, C., Sawada, K., Kamiura, S., Tomita, Y., Isobe, A., Hashimoto, K., Kinose, Y., Mabuchi, S., Hisamatsu, T., Takahashi, T., et al. (2013) miR-92a inhibits peritoneal dissemination of ovarian cancer cells by inhibiting integrin a5 expression. Am. J. Pathol., 182, 1876–1889 Corney, D. C., Hwang, C. I., Matoso, A., Vogt, M., Flesken-Nikitin, A., Godwin, A. K., Kamat, A. A., Sood, A. K., Ellenson, L. H., Hermeking, H., et al. (2010) Frequent downregulation of miR-34 family in human ovarian cancers. Clin. Cancer Res., 16, 1119–1128 Park, J. H., Lee, C., Suh, J. H., Chae, J. Y. and Moon, K. C. (2013) Nuclear expression of Smad proteins and its prognostic significance in clear cell renal cell carcinoma. Hum. Pathol., 44, 2047–2054 Wu, L. N., Xue, Y. J., Zhang, L. J., Ma, X. M. and Chen, J. F. (2013) Si-RNA mediated knockdown of CELF1 gene suppressed the proliferation of human lung cancer cells. Cancer Cell Int., 13, 115 Sourbier, C., Lindner, V., Lang, H., Agouni, A., Schordan, E., Danilin, S., Rothhut, S., Jacqmin, D., Helwig, J. J. and Massfelder, T. (2006) The phosphoinositide 3-kinase/Akt pathway: a new target in human renal cell carcinoma therapy. Cancer Res., 66, 5130–5142 Sourbier, C., Danilin, S., Lindner, V., Steger, J., Rothhut, S., Meyer, N., Jacqmin, D., Helwig, J. J., Lang, H. and Massfelder, T. (2007) Targeting the nuclear factor-κB rescue pathway has promising future in human renal cell carcinoma therapy. Cancer Res., 67, 11668–11676 Huang, D., Ding, Y., Luo, W. M., Bender, S., Qian, C. N., Kort, E., Zhang, Z. F., VandenBeldt, K., Duesbery, N. S., Resau, J. H., et al. (2008) Inhibition of MAPK kinase signaling pathways suppressed renal cell carcinoma growth and angiogenesis in vivo. Cancer Res., 68, 81–88 Dormoy, V., Danilin, S., Lindner, V., Thomas, L., Rothhut, S., Coquard, C., Helwig, J.J., Jacqmin, D., Lang, H., Massfelder, T. (2009) The sonic hedgehog signaling pathway is reactivated in human renal cell carcinoma and plays orchestral role in tumor growth. Mol. Cancer, 8, 123.2803450. Huang, D.W., Sherman, B. T., Tan, Q., Kir, J., Liu, D., Bryant, D., Guo, Y., Stephens, R., Baseler, M. W., Lane, H. C., et al. (2007) DAVID Bioinformatics Resources: expanded annotation database and novel algorithms to better extract biology from large gene lists. Nucleic Acids Res., 35, W169–175 Sagan, H. (1969) Introduction to the Calculus of Variations. New York: Dover Publications, Inc.