Mối tương quan yếu giữa khả năng dự đoán của các kiểu trình tự riêng lẻ và độ chính xác dự đoán tổng thể trong protein

Proteins: Structure, Function and Bioinformatics - Tập 9 Số 1 - Trang 69-78 - 1991
Marianne Rooman1, Shoshana J. Wodak2
1Unité de Conformation des Macromolécules Biologiques, Université Libre de Bruxelles, 1050 Brussels, Belgium
2Unité de Conformation des Macromolécules Biologiques, Université Libre de Bruxelles, CP 160, Av. P. Héger, P2, 1050 Brussels, Belgium

Tóm tắt

Tóm tắt

Các mẫu về tính chất axit amin (cực, kỵ nước, v.v.) đặc trưng cho các mô hình cấu trúc bậc hai được rút ra từ một cơ sở dữ liệu chứa 75 cấu trúc protein, với mục tiêu vượt qua các hạn chế do kích thước cơ sở dữ liệu gây ra nhằm tăng điểm dự đoán cấu trúc. Nhiều liên kết trình tự-cấu trúc như vậy có sức mạnh dự đoán nội tại cao được tìm thấy, và đúng 78% trong số chúng khi được áp dụng riêng lẻ cho các protein bên ngoài tập học. Dựa trên những liên kết này, một phương pháp dự đoán được phát triển, đạt điểm 62% trên 3 trạng thái α-helix, β-strand và loop, mà không sử dụng thêm các ràng buộc. Mặc dù điểm số này khá tốt so với điểm của các phương pháp dự đoán hiện có, nhưng vẫn thấp hơn nhiều so với dự kiến từ sức mạnh dự đoán nội tại cao của các liên kết được sử dụng. Những lý do cơ bản cho kết quả bất ngờ này, cho thấy rằng điểm dự đoán và sức mạnh dự đoán nội tại chỉ liên kết yếu, được thảo luận. Cũng đã chỉ ra rằng kích thước của cơ sở dữ liệu hiện tại vẫn nghiêm trọng hạn chế các điểm dự đoán, ngay cả khi các mẫu tính chất được sử dụng, và rằng các điểm cao hơn được mong đợi trong các cơ sở dữ liệu lớn. Những manh mối được cung cấp về ảnh hưởng tương đối của việc bỏ qua các tương tác không gian đối với hiệu quả dự đoán, gợi ý rằng trong các cơ sở dữ liệu đủ lớn, các cấu trúc bậc hai được dự đoán sẽ tương ứng với những cấu trúc hình thành sớm trong quá trình gập. Giả thuyết này được kiểm tra bằng cách đối chiếu các dự đoán hiện tại với dữ liệu thực nghiệm có sẵn về các trung gian gập protein sớm và về các peptide nhỏ có hình dạng tương đối ổn định trong nước. Mặc dù thừa nhận rằng vẫn còn quá ít dữ liệu như vậy, kết quả cho thấy giả thuyết này có thể là có cơ sở.

Từ khóa


Tài liệu tham khảo

10.1021/j100589a006

10.1016/0022-2836(76)90004-8

10.1016/0022-2836(79)90494-7

10.1016/0022-2836(71)90160-4

10.1021/bi00699a002

10.1016/0022-2836(74)90405-7

10.1016/0022-2836(78)90297-8

10.1021/bi00349a037

10.1016/0022-2836(87)90292-0

Gascuel O., 1988, A simple method for predicting the secondary structure of globular proteins: Implications and accuracy, Cabios, 4, 357

10.1016/0022-2836(88)90564-5

10.1073/pnas.86.1.152

10.1038/335045a0

10.1016/S0022-2836(05)80195-0

10.1073/pnas.81.4.1075

10.1016/0022-2836(87)90127-6

10.1016/0301-4622(75)80033-0

10.1146/annurev.bi.51.070182.002331

10.1038/335700a0

10.1021/bi00427a002

10.1038/340122a0

10.1021/bi00779a019

10.1073/pnas.79.8.2470

10.1073/pnas.82.8.2349

10.1038/326563a0

10.1038/336042a0

10.1038/338127a0

10.1002/prot.340010105

10.1073/pnas.84.24.8898

10.1073/pnas.86.14.5286

Hull W. Reed J. von der Lieth C. Kübler D. Suhai S. Kinzel V.Evidence for interlocking β‐bend secondary structure in the linear hexapeptide GRGDSP which contains the Arg‐Gly‐Asp recognition site of proteins involved in cell‐surface adhesion. In: “Abstracts of XIII International Conference on Magnetic Resonance in Biological Systems.”1988:14–1.

Wodak S., 1987, Enzyme Engineering: Protein Design and Applications in Biocatalysis, 63

Huysmans M. Richelle J. Wodak S.SESAM a relational database for structure and sequence of macromolecules.Proteins submitted 1989.

10.1016/S0022-2836(77)80200-3

10.1016/0022-2836(86)90308-6

10.1002/bip.360221211

Efron B., 1982, The Jack Knife, the Bootstrap and Other Resampling Plans, 10.1137/1.9781611970319

10.1016/0005-2795(76)90062-3

10.1016/0167-4838(82)90318-1

10.1111/j.1399-3011.1982.tb02620.x

10.1016/0141-8130(82)90053-8

Konishi Y., 1989, A highly reliable prediction of protein secondary structure, Bull. Inst. Chem. Res. Kyoto Univ., 66, 378

10.1073/pnas.85.10.3338

10.1073/pnas.85.8.2444

Richelle J. Ochagavia M.‐E. Wodak S.Structure superposition of proteins as flexible bodies. In preparation.