Phân loại protein G và dự đoán độ đặc hiệu ghép nối giữa GPCRs và protein G bằng cách sử dụng biến đổi sóng liên tục và lý thuyết thông tin

Amino Acids - Tập 43 - Trang 793-804 - 2011
Zhanchao Li1,2, Xuan Zhou1, Zong Dai1, Xiaoyong Zou1
1School of Chemistry and Chemical Engineering, Sun Yat-Sen University, Guangzhou, People’s Republic of China
2School of Chemistry and Chemical Engineering, Guangdong Pharmaceutical University, Guangzhou, People’s Republic of China

Tóm tắt

Sự ghép nối giữa các thụ thể cảm ứng protein G (GPCRs) và các protein gắn nucleotide guanine (protein G) điều chỉnh nhiều tín hiệu truyền dẫn từ không gian ngoại bào vào trong tế bào. Tuy nhiên, cơ chế ghép nối giữa GPCR và protein G vẫn chưa được biết đến, và việc xác định thực nghiệm độ đặc hiệu ghép nối cũng như chức năng của chúng vừa tốn kém vừa mất nhiều thời gian. Do đó, việc phát triển một phương pháp lý thuyết để dự đoán độ đặc hiệu ghép nối giữa GPCR và protein G cũng như chức năng của chúng bằng cách sử dụng chuỗi nguyên liệu của chúng là rất quan trọng. Trong nghiên cứu này, một công cụ dự đoán mới với bốn lớp (GPCRsG_CWTIT) dựa trên máy vector hỗ trợ (SVM), biến đổi sóng liên tục (CWT) và lý thuyết thông tin (IT) đã được phát triển để phân loại protein G và dự đoán độ đặc hiệu ghép nối giữa GPCR và protein G. SVM được sử dụng để xây dựng các mô hình. CWT và IT được sử dụng để đặc trưng hóa cấu trúc chính của protein. Hiệu suất của GPCRsG_CWTIT được đánh giá thông qua kiểm tra chéo trên nhiều bộ dữ liệu. Độ chính xác tổng thể của protein G ở các cấp độ lớp và họ là 98,23% và 85,42%, tương ứng. Độ chính xác của dự đoán độ đặc hiệu ghép nối dao động từ 74,60 đến 94,30%. Những kết quả này cho thấy rằng công cụ dự đoán được đề xuất là một công cụ hiệu quả và khả thi để dự đoán độ đặc hiệu ghép nối giữa GPCR và protein G cũng như chức năng của chúng chỉ bằng cách sử dụng chuỗi peptide hoàn chỉnh của protein. Việc thiết lập một phương pháp dự đoán chính xác như vậy sẽ hỗ trợ phát hiện thuốc bằng cách cải thiện khả năng xác định và dự đoán các tương tác giữa protein. GPCRsG_CWTIT và bộ dữ liệu có thể được yêu cầu miễn phí từ các tác giả.

Từ khóa

#GPCRs #protein G #máy vector hỗ trợ #biến đổi sóng liên tục #lý thuyết thông tin #dự đoán độ đặc hiệu ghép nối

Tài liệu tham khảo

Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic local alignment search tool. J Mol Biol 215:403–410 Bhasin M, Raghava GP (2004) GPCRpred: an SVM-based method for prediction of families and subfamilies of G-protein coupled receptors. Nucleic Acids Res 32:W383–W389 Bhasin M, Raghava GP (2005) GPCRsclass: a web tool for the classification of amine type of G-protein-coupled receptors. Nucleic Acids Res 33:W143–W147 Cabrere-Vera TM, Vanhauwe J, Thomas TO, Medkova M, Preininger A, Mazzoni MR, Hamm HE (2003) Insight into G protein Structure, function, and regulation. Endocr Rev 24:765–781 Cao J, Panetta R, Yue S, Steyaert A, Young-Bellido M, Ahmad S (2003) A naïve Bayes model to predict coupling between seven transmembrane domain receptors and G-proteins. Bioinformatics 19:234–240 Chan CC, Lin CJ (2001) LIBSVM: a library for support vector machines. http://www.csie.ntu.edu.tw/~cjlin/libsvm Chou KC (2005) Prediction of G-protein-coupled receptor classes. J Proteome Res 4:1413–1418 Chou KC, Elord DW (2002) Bioinformatical analysis of G-protein-coupled receptors. J Proteome Res 1:429–433 Elefsinioti AL, Bagos PG, Spyropoulos IC, Hamodrakas SJ (2004) A database for G proteins and their interaction with GPCRs. BMC Bioinform 5:208 Elrod DW, Chou KC (2002) A study on the correlation of G-protein-coupled receptor types with amino acid composition. Protein Eng Des Sel 15:713–715 Eo HS, Choi JP, Noh SJ, Hur GG, Kim W (2007) A combined approach for the classification of G protein-coupled receptors and its application to detect GPCR splice variants. Comput Biol Chem 31:246–256 Gao QB, Wang ZZ (2006) Classification of G-protein coupled receptors at four levels. Protein Eng Des Sel 19:511–516 Gaulton A, Attwood TK (2003) Bioinformatics approaches for the classification of G-protein-coupled receptors. Curr Opin Pharmacol 3:114–120 Greasley PJ, Fanelli F, Scheer A, Abuin L, Nenniger-Tosato M, DeBenedetti PG, Cotecchia S (2001) Mutational and computational analysis of the α(1b)-adrenergic receptor. Involvement of basic and hydrophobic residues in receptors activation and G protein coupling. J Biol Chem 276:46485–46494 Guo Y, Li M, Lu M, Wen Z, Huang Z (2006a) Predicting G-protein coupled receptors-G-protein coupling specificity based on autocross-covariance transform. Proteins 65:55–60 Guo YZ, Li M, Lu M, Wen Z, Wang K, Li G, Wu J (2006b) Classifying G protein-coupled receptors and nuclear receptors on the basis of protein power spectrum from fast Fourier transform. Amino Acids 30:397–402 Guo Y, Yu L, Wen Z, Li M (2008) Using support vector machine combined with auto covariance to predict protein–protein interactions from protein sequences. Nucleic Acids Res 36:3025–3030 Harmar AJ, Hills RA, Rosser EM, Jones M, Buneman OP, Dunbar DR, Greenhill SD, Hale VA, Sharman JL, Bonner TI, Catterall WA, Davenport AP, Delagrange P, Dollery CT, Foord SM, Gutman GA, Laudet V, Neubig RR, Ohlstein EH, Olsen RW, Peters J, Pin JP, Ruffolo RR, Searls DB, Wright MW, Spedding M (2009) IUPHAR-DB: the IUPHAR database of G protein-coupled receptors and ion channels. Nucleic Acids Res 37:D680–D685 Horn F, van der Wenden EM, Oliveira L, Jzerman AP, Vriend G (2000) Receptors coupling to G proteins: is there a signal behind the sequence? Proteins 41:448–459 Karchin R, Karplus K, Haussler D (2002) Classifying G-protein coupled receptors with support vector machines. Bioinformatics 18:147–159 Kukkonen JP, Nasman J, Akerman KE (2001) Modelling of promiscuous receptor-Gi/Gs-protein coupling and effector response. Trends Pharmacol Sci 22:616–622 Li W, Jaroszewski L, Godzik A (2001) Clustering of highly homologous sequences to reduce the size of large protein databases. Bioinformatics 17:282–283 Li Z, Zhou X, Dai Z, Zou X (2010) Classification of G-protein coupled receptors based on support vector machine with maximum relevance minimum redundancy and genetic algorithm. BMC Bioinform 11:325 Moller S, Vilo J, Croning MD (2001) Prediction of the coupling specificity of G protein coupled receptors to their G proteins. Bioinformatics 17:S174–S181 Oliveira L, Paiva AC, Vriend G (1999) A low resolution model for the interaction of G proteins with G protein-coupled receptors. Protein Eng 12:1087–1095 Papasaikas PK, Bagos PG, Litou ZI, Promponas VJ, Hamodrakas SJ (2004) PRED-GPCR: GPCR recognition and family classification server. Nucleic Acids Res 32:W380–W382 Pierce KL, Premont RT, Lefkowitz RJ (2002) Seven-transmembrane receptors. Nat Rev Mol Cell Biol 3:639–650 Qian B, Soyer OS, Neubig RR, Goldstein RA (2003) Depicting a protein’s two faces: GPCR classification by phylogenetic tree-based HMMs. FEBS Lett 554:95–99 Qiu JD, Huang JH, Liang RP, Lu XQ (2009) Prediction of G-protein-coupled receptor classes based on the concept of Chou’s pseudo amino acid composition: an approach from discrete wavelet transform. Anal Biochem 390:68–73 Sgourakis NG, Bagos PG, Hamodrakas SJ (2005a) Prediction of the coupling specificity of GPCRs to four families of G-proteins using hidden Markov models and artificial neural networks. Bioinformatics 21:4101–4106 Sgourakis NG, Bagos PG, Papasaikas PK, Hamodrakas SJ (2005b) A method for the prediction of GPCRs coupling specificity to G-proteins using refined profile hidden Markov models. BMC Bioinform 6:104 Shannon CE (1948) A mathematical theory of communication. Bell System Technical J 27:379–423 Simon MI, Strathmann MP, Gautan M (1991) Diversity of G proteins in signal transduction. Science 252:802–808 Sreekumar KR, Huang Y, Pausch MH, Gulukota K (2004) Predicting GPCR-G protein coupling using hidden Markov models. Bioinformatics 20:3490–3499 Theodoropoulou MC, Bagos PG, Spyropoulos IC, Hamodrakas SJ (2008) gpDB: a database of GPCRs, G-proteins, effectors and their interactions. Bioinformatics 24:1471–1472 Thompson JD, Higgins DG, Gibson TJ (1994) CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res 22:4673–4680 Wess J (1998) Molecular basis of receptor/G-protein-coupling selectivity. Pharmacol Ther 80:231–264 Yabuki Y, Muramatsu T, Hirokawa T, Mukai H, Suwa M (2005) GRIFFIN: a system for predicting GPCR-G-protein coupling selectivity using a support vector machine and a hidden Markov model. Nucleic Acids Res 33:W148–W153