Một phương pháp tiếp cận theo cấp bậc để dự đoán vòng xoắn protein toàn nguyên tử
Tóm tắt
Việc áp dụng các trường lực toàn nguyên tử (và các mô hình dung môi rõ ràng hoặc ngụy trang) vào các nhiệm vụ dự đoán mô hình đồng đẳng protein như dự đoán chuỗi bên và vòng xoắn vẫn còn thách thức cả do chi phí tính toán năng lượng từng cá nhân và do sự khó khăn trong việc lấy mẫu bề mặt năng lượng toàn nguyên tử gồ ghề. Tại đây, chúng tôi giải quyết thách thức này cho vấn đề dự đoán vòng xoắn thông qua việc phát triển nhiều thuật toán mới, nhấn mạnh vào các kỹ thuật đa quy mô và theo cấp bậc. Như một bước đầu tiên trong việc đánh giá hiệu suất của thuật toán dự đoán vòng xoắn của chúng tôi, chúng tôi đã áp dụng nó vào vấn đề tái tạo các vòng trong các cấu trúc bản địa; chúng tôi cũng bao gồm rõ ràng việc đóng gói tinh thể để cung cấp một so sánh công bằng với các cấu trúc tinh thể. Tóm lại, số lượng lớn vòng được tạo ra bằng cách sử dụng quy trình xây dựng dựa trên góc dihedral, theo sau là các chu kỳ lặp lại của việc phân nhóm, tối ưu hóa chuỗi bên và tối thiểu hóa năng lượng hoàn toàn của các cấu trúc vòng được chọn. Chúng tôi đánh giá phương pháp này bằng cách sử dụng tập kiểm tra lớn nhất đã được sử dụng cho việc xác thực phương pháp dự đoán vòng xoắn, với tổng cộng 833 vòng có chiều dài từ 4 đến 12 axit amin. Các sai khác trung bình/mediam độ lệch căn bậc hai (RMSDs) đối với các cấu trúc bản địa (chồng xếp thân protein, không phải vòng xoắn) lần lượt là 0.42/0.24 Å cho vòng 5 axit amin, 1.00/0.44 Å cho vòng 8 axit amin, và 2.47/1.83 Å cho vòng 11 axit amin. Các RMSD trung vị thấp hơn đáng kể so với trung bình vì có một số lượng nhỏ các giá trị ngoại lai; nguyên nhân của những thất bại này được xem xét một cách chi tiết, và nhiều trường hợp có thể được quy cho lỗi trong việc chỉ định trạng thái proton hóa của các axit amin có khả năng titratable, sự bỏ sót các ligand từ mô phỏng, và, trong một số trường hợp, có thể là lỗi trong các cấu trúc được xác định thực nghiệm. Khi các vấn đề hiển nhiên trong các tập dữ liệu này được lọc ra, các RMSD trung bình đối với các cấu trúc bản địa cải thiện thành 0.43 Å cho vòng 5 axit amin, 0.84 Å cho vòng 8 axit amin, và 1.63 Å cho vòng 11 axit amin. Trong đại đa số các trường hợp, phương pháp này xác định các điểm tối thiểu năng lượng mà thấp hơn hoặc bằng với vòng bản địa tối thiểu, điều này cho thấy rằng việc lấy mẫu hiếm khi hạn chế độ chính xác của dự đoán. Tổng thể kết quả là, theo sự hiểu biết của chúng tôi, tốt nhất được báo cáo cho đến nay, và chúng tôi ghi nhận thành công này là nhờ vào sự kết hợp của một hàm năng lượng toàn nguyên tử chính xác, các phương pháp hiệu quả cho việc xây dựng vòng và tối ưu hóa chuỗi bên, và, đặc biệt cho các vòng dài hơn, quy trình tinh chỉnh theo cấp bậc. Protein 2004;55:000–000. © 2004 Wiley‐Liss, Inc.
Từ khóa
Tài liệu tham khảo
Shenkin PS, 1987, Method for quickly generating random conformations of ring‐like structures for subsequent energy minimization or molecular‐dynamics—application to antibody hypervariable loops, Biophys J, 51, A232
Go N, 1970, Ring closure and local conformational deformations of chain molecules, Biopolymers, 3, 178
Hartigan JA, 1975, Clustering algorithms
Li X, 2003, High resolution prediction of protein helix positions and orientations, Proteins
JacobsonMP PincusDL DayTJF RappCS LiX AnY FriesnerRA.Use of all‐atom physical chemistry energy functions for comparative model construction selection and refinement. Protein Sci2003. Submitted for publication.