Mối tương quan yếu giữa khả năng dự đoán của các kiểu trình tự riêng lẻ và độ chính xác dự đoán tổng thể trong protein
Tóm tắt
Các mẫu về tính chất axit amin (cực, kỵ nước, v.v.) đặc trưng cho các mô hình cấu trúc bậc hai được rút ra từ một cơ sở dữ liệu chứa 75 cấu trúc protein, với mục tiêu vượt qua các hạn chế do kích thước cơ sở dữ liệu gây ra nhằm tăng điểm dự đoán cấu trúc. Nhiều liên kết trình tự-cấu trúc như vậy có sức mạnh dự đoán nội tại cao được tìm thấy, và đúng 78% trong số chúng khi được áp dụng riêng lẻ cho các protein bên ngoài tập học. Dựa trên những liên kết này, một phương pháp dự đoán được phát triển, đạt điểm 62% trên 3 trạng thái α-helix, β-strand và loop, mà không sử dụng thêm các ràng buộc. Mặc dù điểm số này khá tốt so với điểm của các phương pháp dự đoán hiện có, nhưng vẫn thấp hơn nhiều so với dự kiến từ sức mạnh dự đoán nội tại cao của các liên kết được sử dụng. Những lý do cơ bản cho kết quả bất ngờ này, cho thấy rằng điểm dự đoán và sức mạnh dự đoán nội tại chỉ liên kết yếu, được thảo luận. Cũng đã chỉ ra rằng kích thước của cơ sở dữ liệu hiện tại vẫn nghiêm trọng hạn chế các điểm dự đoán, ngay cả khi các mẫu tính chất được sử dụng, và rằng các điểm cao hơn được mong đợi trong các cơ sở dữ liệu lớn. Những manh mối được cung cấp về ảnh hưởng tương đối của việc bỏ qua các tương tác không gian đối với hiệu quả dự đoán, gợi ý rằng trong các cơ sở dữ liệu đủ lớn, các cấu trúc bậc hai được dự đoán sẽ tương ứng với những cấu trúc hình thành sớm trong quá trình gập. Giả thuyết này được kiểm tra bằng cách đối chiếu các dự đoán hiện tại với dữ liệu thực nghiệm có sẵn về các trung gian gập protein sớm và về các peptide nhỏ có hình dạng tương đối ổn định trong nước. Mặc dù thừa nhận rằng vẫn còn quá ít dữ liệu như vậy, kết quả cho thấy giả thuyết này có thể là có cơ sở.
Từ khóa
Tài liệu tham khảo
Gascuel O., 1988, A simple method for predicting the secondary structure of globular proteins: Implications and accuracy, Cabios, 4, 357
Hull W. Reed J. von der Lieth C. Kübler D. Suhai S. Kinzel V.Evidence for interlocking β‐bend secondary structure in the linear hexapeptide GRGDSP which contains the Arg‐Gly‐Asp recognition site of proteins involved in cell‐surface adhesion. In: “Abstracts of XIII International Conference on Magnetic Resonance in Biological Systems.”1988:14–1.
Wodak S., 1987, Enzyme Engineering: Protein Design and Applications in Biocatalysis, 63
Huysmans M. Richelle J. Wodak S.SESAM a relational database for structure and sequence of macromolecules.Proteins submitted 1989.
Konishi Y., 1989, A highly reliable prediction of protein secondary structure, Bull. Inst. Chem. Res. Kyoto Univ., 66, 378
Richelle J. Ochagavia M.‐E. Wodak S.Structure superposition of proteins as flexible bodies. In preparation.