Phân Tích So Sánh Các Tham Số Cấu Trúc Protein

Gabriele Mayr1, Francisco S. Domingues2, Peter Lackner1
1Department of Molecular Biology, University of Salzburg, Hellbrunnerstrasse 34, 5020 Salzburg, Austria
2Max-Planck-Institut für Informatik, Stuhlsatzenhausweg 85, 66123 Saarbrücken, Germany

Tóm tắt

Tóm tắt Giới thiệu

Có một số phương pháp hiện có để so sánh các cấu trúc protein. Các phương pháp này đã được phân tích về hiệu suất trong việc xác định các protein có liên quan về cấu trúc/evolutionary, nhưng cho đến nay vẫn chưa có nhiều sự chú ý vào việc so sánh khách quan giữa các phân bố được tạo ra từ những phương pháp khác nhau.

Kết quả

Chúng tôi đã phân tích và so sánh các phân bố cấu trúc thu được từ các phương pháp khác nhau sử dụng ba bộ cặp protein có liên quan cấu trúc. Bộ đầu tiên tương ứng với 355 cặp protein đồng dạng xa theo cơ sở dữ liệu SCOP (bộ ASTRAL40). Bộ thứ hai được lấy từ cơ sở dữ liệu SISYPHUS và bao gồm 69 cặp protein (bộ SISY). Bộ thứ ba gồm 40 cặp khó khăn trong việc so khớp (bộ RIPC). Phân bố của các cặp trong bộ này yêu cầu các indel có số lượng và kích thước đáng kể và một số protein có liên quan bởi các hoán vị vòng tròn, cho thấy tính biến đổi cấu hình rộng rãi hoặc bao gồm các lặp lại. Hai phương pháp tiêu chuẩn (CE và DALI) đã được áp dụng để so khớp các protein trong bộ ASTRAL40. Mức độ tương đồng cấu trúc được xác định bởi cả hai phương pháp là rất tương quan và các phân bố từ hai phương pháp đồng ý với nhau trên trung bình hơn một nửa các vị trí đã được so khớp. CE, DALI, cũng như bốn phương pháp bổ sung khác (FATCAT, MATRAS, C α -match và SHEBA) đã được so sánh bằng cách sử dụng bộ SISY và RIPC. Độ chính xác của các phân bố được đánh giá bằng cách so sánh với các phân bố tham chiếu. Các phân bố được tạo ra bởi các phương pháp khác nhau trên trung bình phù hợp với hơn một nửa các phân bố tham chiếu trong bộ SISY. Các phân bố thu được trong bộ RIPC khó khăn hơn có xu hướng khác biệt đáng kể và phù hợp với các phân bố tham chiếu ít thành công hơn so với các phân bố của bộ SISY.

Kết luận

Các phân bố được tạo ra bởi các phương pháp khác nhau có xu hướng đồng ý ở mức độ đáng kể, nhưng sự đồng ý thấp hơn cho các cặp khó khăn hơn. Các kết quả cho việc so sánh với các phân bố tham chiếu là đáng khích lệ, nhưng cũng chỉ ra rằng vẫn còn chỗ để cải thiện.

Từ khóa


Tài liệu tham khảo

Sierk ML, Kleywegt GJ: Deja vu all over again: finding and analyzing protein structure similarities. Structure (Camb) 2004, 12(12):2103–2111.

Yakunin AF, Yee AA, Savchenko A, Edwards AM, Arrowsmith CH: Structural proteomics: a tool for genome annotation. Curr Opin Chem Biol 2004, 8: 42–8. 10.1016/j.cbpa.2003.12.003

Domingues FS, Rahnenführer J, Lengauer T: Automated clustering of ensembles of alternative models in protein structure databases. Protein Eng Des Sel 2004, 17: 537–43. 10.1093/protein/gzh063

Russell RB, Saqi MA, Sayle RA, Bates PA, Sternberg MJ: Recognition of analogous and homologous protein folds: analysis of sequence and structure conservation. J Mol Biol 1997, 269: 423–39. 10.1006/jmbi.1997.1019

Pascarella S, Argos P: Analysis of insertions/deletions in protein structures. J Mol Biol 1992, 224: 461–71. 10.1016/0022-2836(92)91008-D

Grishin N: Fold change in evolution of protein structures. J Struct Biol 2001, 134: 167–85. 10.1006/jsbi.2001.4335

Murzin A: How far divergent evolution goes in proteins. Curr Opin Struct Biol 1998, 8: 380–7. 10.1016/S0959-440X(98)80073-0

Lindqvist Y, Schneider G: Circular permutations of natural protein sequences: structural evidence. Curr Opin Struct Biol 1997, 7: 422–427. 10.1016/S0959-440X(97)80061-9

Godzik A: The structural alignment between two proteins: is there a unique answer? Protein Sci 1996, 5: 1325–38.

Shih ESC, Hwang MJ: Alternative alignments from comparison of protein structures. Proteins 2004, 56: 519–27. 10.1002/prot.20124

Novotny M, Madsen D, Kleywegt GJ: Evaluation of protein fold comparison servers. Proteins 2004, 54: 260–70. 10.1002/prot.10553

Shindyalov I, Bourne P: Protein structure alignment by incremental combinatorial extension (CE) of the optimal path. Protein Eng 1998, 11: 739–47. 10.1093/protein/11.9.739

Holm L, Sander C: Protein structure comparison by alignment of distance matrices. J Mol Biol 1993, 233: 123–38. 10.1006/jmbi.1993.1489

Ye Y, Godzik A: Flexible structure alignment by chaining aligned fragment pairs allowing twists. Bioinformatics 2003, 19(Suppl 2):II246-II255.

Jung J, Lee B: Protein structure alignment using environmental profiles. Protein Eng 2000, 13: 535–543. 10.1093/protein/13.8.535

Chen Y, Crippen GM: A novel approach to structural alignment using realistic structural and environmental information. Protein Sci 2005, 14: 2935–46. 10.1110/ps.051428205

Kawabata T: MATRAS: A program for protein 3D structure comparison. Nucleic Acids Res 2003, 31: 3367–3369. 10.1093/nar/gkg581

Bachar O, Fischer D, Nussinov R, Wolfson H: A computer vision based technique for 3-D sequence-independent structural comparison of proteins. Protein Eng 1993, 6: 279–88. 10.1093/protein/6.3.279

Shatsky M, Nussinov R, Wolfson HJ: A method for simultaneous alignment of multiple protein structures. Proteins 2004, 56: 143–56. 10.1002/prot.10628

Ebert J, Brutlag D: Development and validation of a consistency based multiple structure alignment algorithm. Bioinformatics 2006, 22: 1080–7. 10.1093/bioinformatics/btl046

Guda C, Lu S, Scheeff ED, Bourne PE, Shindyalov IN: CE-MC: a multiple protein structure alignment server. Nucleic Acids Res 2004, 32: W100–3. 10.1093/nar/gkh464

Konagurthu AS, Whisstock JC, Stuckey PJ, Lesk AM: MUSTANG: a multiple structural alignment algorithm. Proteins 2006, 64: 559–74. 10.1002/prot.20921

Carugo O, Pongor S: Protein fold similarity estimated by a probabilistic approach based on C α -C α distance comparison. J Mol Biol 2002, 315: 887–98. 10.1006/jmbi.2001.5250

Rogen P, Fain B: Automatic classification of protein structure by using Gauss integrals. Proc Natl Acad Sci USA 2003, 100: 119–124. 10.1073/pnas.2636460100

Sierk ML, Pearson WR: Sensitivity and selectivity in protein structure comparison. Protein Sci 2004, 13: 773–85. 10.1110/ps.03328504

Kolodny R, Koehl P, Levitt M: Comprehensive evaluation of protein structure alignment methods: scoring by geometric measures. J Mol Biol 2005, 346: 1173–88. 10.1016/j.jmb.2004.12.032

Standley DM, Toh H, Nakamura H: Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 2004, 57: 381–91. [http://dx.doi.org/10.1002/prot.20211] 10.1002/prot.20211

Zhang Y, Skolnick J: TM-align: a protein structure alignment algorithm based on the TM-score. Nucleic Acids Res 2005, 33: 2302–9. [http://dx.doi.org/10.1093/nar/gki524] 10.1093/nar/gki524

Krissinel E, Henrick K: Secondary-structure matching (SSM), a new tool for fast protein structure alignment in three dimensions. Acta Crystallogr D Biol Crystallogr 2004, 60: 2256–68. [http://dx.doi.org/10.1107/S0907444904026460] 10.1107/S0907444904026460

Taylor W, Orengo C: Protein structure alignment. J Mol Biol 1989, 208: 1–22. 10.1016/0022-2836(89)90084-3

Gerstein M, Levitt M: Comprehensive assessment of automatic structural alignment against a manual standard, the scop classification of proteins. Protein Sci 1998, 7: 445–456.

Kleywegt G: Use of non-crystallographic symmetry in protein structure refinement. Acta Crystallogr D Biol Crystallogr 1996, 52: 842–57. 10.1107/S0907444995016477

Chandonia JM, Walker NS, Conte LL, Koehl P, Levitt M, Brenner SE: ASTRAL compendium enhancements. Nucleic Acids Res 2002, 30: 260–3. 10.1093/nar/30.1.260

Andreeva A, Prlic A, Hubbard TJP, Murzin AG: SISYPHUS-structural alignments for proteins with non-trivial relationships. Nucleic Acids Res 2007, 35: D253-D259. 10.1093/nar/gkl746

Andreeva A, Howorth D, Brenner SE, Hubbard TJP, Chothia C, Murzin AG: SCOP database in 2004: refinements integrate structure and sequence family data.ever. Nucleic Acids Res 2004, 32: D226–9. 10.1093/nar/gkh039

Carugo O, Pongor S: A normalized root-mean-square distance for comparing protein three-dimensional structures. Protein Sci 2001, 10: 1470–3. 10.1110/ps.690101

Wilcoxon F: Individual Comparisons by Ranking Methods. Biometrics Bulletin 1945, 1: 80–83. 10.2307/3001968

Gordon A: Classification. 2nd edition. Chapman and Hall. London; 1999.

Rousseeuw P: Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. J Comput Appl Math 1987, 20: 53–65. 10.1016/0377-0427(87)90125-7

Guenther BD, Sheppard CA, Tran P, Rozen R, Matthews RG, Ludwig ML: The structure and properties of methylenetetrahydrofolate reductase from Escherichia coli suggest how folate ameliorates human hyperhomocysteinemia. Nat Struct Biol 1999, 6: 359–65. 10.1038/7594

Lee YH, Nadaraia S, Gu D, Becker DF, Tanner JJ: Structure of the proline dehydrogenase domain of the multifunctional PutA flavoprotein. Nat Struct Biol 2003, 10: 109–14. 10.1038/nsb885

Paetzel M, Dalbey RE, Strynadka NC: Crystal structure of a bacterial signal peptidase in complex with a beta-lactam inhibitor. Nature 1998, 396: 186–90. 10.1038/25403

Deacon A, Gleichmann T, Kalb A, Price H, Raftery J, Bradbrook G, Helliwell JYJ: The structure of concanavalin a and its bound solvent determined with small-molecule accuracy at 0.94 a resolution. J Chem Soc Faraday Trans 1997, 93: 4305. 10.1039/a704140c

Pletnev V, Ruzheinikov A, Tsygannik I, Yu IM, Duax W, Ghosh D, Pangborn W: The structure of pea lectin-d-glucopyranose complex at a 1.9 a resolution. russian journal of 1997, 23: 469.

Campbell RE, Mosimann SC, van De Rijn I, Tanner ME, Strynadka NC: The first structure of UDP-glucose dehydrogenase reveals the catalytic residues necessary for the two-fold oxidation. Biochemistry 2000, 39: 7012–23. 10.1021/bi000181h

Snook CF, Tipton PA, Beamer LJ: Crystal structure of GDP-mannose dehydrogenase: a key enzyme of alginate biosynthesis in P. aeruginosa. Biochemistry 2003, 42: 4658–68. 10.1021/bi027328k

Huang L, Kinnucan E, Wang G, Beaudenon S, Howley PM, Huibregtse JM, Pavletich NP: Structure of an E6AP-UbcH7 complex: insights into ubiquitination by the E2-E3 enzyme cascade. Science 1999, 286: 1321–6. 10.1126/science.286.5443.1321

Verdecia MA, Joazeiro CAP, Wells NJ, Ferrer JL, Bowman ME, Hunter T, Noel JP: Conformational flexibility underlies ubiquitin ligation mediated by the WWP1 HECT domain E3 ligase. Mol Cell 2003, 11: 249–59. 10.1016/S1097-2765(02)00774-8

Thompson JD, Plewniak F, Poch O: BAliBASE: a benchmark alignment database for the evaluation of multiple alignment programs. Bioinformatics 1999, 15: 87–88. 10.1093/bioinformatics/15.1.87

Thompson JD, Plewniak F, Poch O: A comprehensive comparison of multiple sequence alignment programs. Nucleic Acids Res 1999, 27: 2682–2690. 10.1093/nar/27.13.2682

Lassmann T, Sonnhammer ELL: Quality assessment of multiple alignment programs. FEBS Lett 2002, 529: 126–30. 10.1016/S0014-5793(02)03189-7

Echols N, Milburn D, Gerstein M: MolMovDB: analysis and visualization of conformational change and structural flexibility. Nucleic Acids Res 2003, 31: 478–82. 10.1093/nar/gkg104

Smith TF, Waterman MS: Identification of common molecular subsequences. J Mol Biol 1981, 147: 195–197. 10.1016/0022-2836(81)90087-5

JAligner2006. [http://jaligner.sourceforge.net/]

FATCAT[http://fatcat.ljcrf.edu/fatcat/]

MATRAS[http://biunit.naist.jp/matras/]

C alpha-match[http://bioinfo3d.cs.tau.ac.il/c_alpha_match/]

Shulman-Peleg A, Nussinov R, Wolfson HJ: Recognition of functional sites in protein structures. J Mol Biol 2004, 339: 607–33. 10.1016/j.jmb.2004.04.012

Porter CT, Bartlett GJ, Thornton JM: The Catalytic Site Atlas: a resource of catalytic sites and residues identified in enzymes using structural data. Nucleic Acids Res 2004, 32: D129–33. 10.1093/nar/gkh028

Torrance JW, Bartlett GJ, Porter CT, Thornton JM: Using a library of structural templates to recognise catalytic sites and explore their evolution in homologous families. J Mol Biol 2005, 347: 565–81. 10.1016/j.jmb.2005.01.044

Laskowski RA, Chistyakov VV, Thornton JM: PDBsum more: new summaries and analyses of the known 3D structures of proteins and nucleic acids. Nucleic Acids Res 2005, 33: D266–8. 10.1093/nar/gki001

Kleywegt GJ: Recognition of spatial motifs in protein structures. J Mol Biol 1999, 285: 1887–97. 10.1006/jmbi.1998.2393

Faudet R, Wiley D: Structure of the ABC ATPase domain of human TAP1, the transporter associated with antigen processing. EMBO J 2001, 20(17):4964–72. 10.1093/emboj/20.17.4964

Sekulic N, Shuvalova L, Spangenberg O, Konrad M, Lavie A: Structural characterization of the closed conformation of mouse guanylate kinase. J Biol Chem 277(33):30236–43. 2002, Aug 16 10.1074/jbc.M204668200

Peat TS, Frank EG, McDonald JP, Levine AS, Woodgate R, Hendrickson WA: The UmuD' protein filament and its potential role in damage induced mutagenesis. Structure 1996, 4: 1401–12. 10.1016/S0969-2126(96)00148-7