Một phương pháp tiếp cận theo cấp bậc để dự đoán vòng xoắn protein toàn nguyên tử

Proteins: Structure, Function and Bioinformatics - Tập 55 Số 2 - Trang 351-367 - 2004
Matthew P. Jacobson1, David L. Pincus2, Chaya S. Rapp3, Tyler Day4, Barry Honig5, David E. Shaw4, Richard A. Friesner2
1Department of Pharmaceutical Chemistry, University of California, San Francisco, California#TAB#
2Department of Chemistry, Columbia University, New York, New York
3Department of Chemistry, Stern College, Yeshiva University, New York, New York
4Schrödinger, Inc., New York, New York
5Howard Hughes Medical Institute and Department of Biochemistry and Molecular Biophysics, Columbia University, New York, New York

Tóm tắt

Tóm tắt

Việc áp dụng các trường lực toàn nguyên tử (và các mô hình dung môi rõ ràng hoặc ngụy trang) vào các nhiệm vụ dự đoán mô hình đồng đẳng protein như dự đoán chuỗi bên và vòng xoắn vẫn còn thách thức cả do chi phí tính toán năng lượng từng cá nhân và do sự khó khăn trong việc lấy mẫu bề mặt năng lượng toàn nguyên tử gồ ghề. Tại đây, chúng tôi giải quyết thách thức này cho vấn đề dự đoán vòng xoắn thông qua việc phát triển nhiều thuật toán mới, nhấn mạnh vào các kỹ thuật đa quy mô và theo cấp bậc. Như một bước đầu tiên trong việc đánh giá hiệu suất của thuật toán dự đoán vòng xoắn của chúng tôi, chúng tôi đã áp dụng nó vào vấn đề tái tạo các vòng trong các cấu trúc bản địa; chúng tôi cũng bao gồm rõ ràng việc đóng gói tinh thể để cung cấp một so sánh công bằng với các cấu trúc tinh thể. Tóm lại, số lượng lớn vòng được tạo ra bằng cách sử dụng quy trình xây dựng dựa trên góc dihedral, theo sau là các chu kỳ lặp lại của việc phân nhóm, tối ưu hóa chuỗi bên và tối thiểu hóa năng lượng hoàn toàn của các cấu trúc vòng được chọn. Chúng tôi đánh giá phương pháp này bằng cách sử dụng tập kiểm tra lớn nhất đã được sử dụng cho việc xác thực phương pháp dự đoán vòng xoắn, với tổng cộng 833 vòng có chiều dài từ 4 đến 12 axit amin. Các sai khác trung bình/mediam độ lệch căn bậc hai (RMSDs) đối với các cấu trúc bản địa (chồng xếp thân protein, không phải vòng xoắn) lần lượt là 0.42/0.24 Å cho vòng 5 axit amin, 1.00/0.44 Å cho vòng 8 axit amin, và 2.47/1.83 Å cho vòng 11 axit amin. Các RMSD trung vị thấp hơn đáng kể so với trung bình vì có một số lượng nhỏ các giá trị ngoại lai; nguyên nhân của những thất bại này được xem xét một cách chi tiết, và nhiều trường hợp có thể được quy cho lỗi trong việc chỉ định trạng thái proton hóa của các axit amin có khả năng titratable, sự bỏ sót các ligand từ mô phỏng, và, trong một số trường hợp, có thể là lỗi trong các cấu trúc được xác định thực nghiệm. Khi các vấn đề hiển nhiên trong các tập dữ liệu này được lọc ra, các RMSD trung bình đối với các cấu trúc bản địa cải thiện thành 0.43 Å cho vòng 5 axit amin, 0.84 Å cho vòng 8 axit amin, và 1.63 Å cho vòng 11 axit amin. Trong đại đa số các trường hợp, phương pháp này xác định các điểm tối thiểu năng lượng mà thấp hơn hoặc bằng với vòng bản địa tối thiểu, điều này cho thấy rằng việc lấy mẫu hiếm khi hạn chế độ chính xác của dự đoán. Tổng thể kết quả là, theo sự hiểu biết của chúng tôi, tốt nhất được báo cáo cho đến nay, và chúng tôi ghi nhận thành công này là nhờ vào sự kết hợp của một hàm năng lượng toàn nguyên tử chính xác, các phương pháp hiệu quả cho việc xây dựng vòng và tối ưu hóa chuỗi bên, và, đặc biệt cho các vòng dài hơn, quy trình tinh chỉnh theo cấp bậc. Protein 2004;55:000–000. © 2004 Wiley‐Liss, Inc.

Từ khóa


Tài liệu tham khảo

10.1016/S0022-2836(02)00470-9

10.1006/jmbi.1996.0851

10.1006/jmbi.1996.0819

10.1006/jmbi.1999.2826

10.1006/jmbi.1996.0857

10.1016/0263-7855(86)80026-1

Shenkin PS, 1987, Method for quickly generating random conformations of ring‐like structures for subsequent energy minimization or molecular‐dynamics—application to antibody hypervariable loops, Biophys J, 51, A232

10.1073/pnas.102179699

10.1110/ps.9.9.1753

10.1002/1097-0282(2001)60:2<153::AID-BIP1010>3.0.CO;2-6

10.1002/jcc.540110115

10.1002/jcc.540130307

10.1002/prot.1041

10.1002/bip.360260114

10.1002/(SICI)1097-0134(19990501)35:2<173::AID-PROT4>3.0.CO;2-2

10.1002/(SICI)1097-0134(20000701)40:1<135::AID-PROT150>3.0.CO;2-1

10.1002/prot.10285

10.1002/(SICI)1097-0282(199701)41:1<61::AID-BIP6>3.0.CO;2-0

10.1002/(SICI)1096-987X(199906)20:8<819::AID-JCC8>3.0.CO;2-Y

Go N, 1970, Ring closure and local conformational deformations of chain molecules, Biopolymers, 3, 178

10.1021/ma00154a069

10.1002/prot.340180205

10.1002/prot.10235

10.1021/jp021564n

10.1021/ja9621760

10.1021/jp003919d

10.1002/jcc.10045

10.1021/jp982533o

Hartigan JA, 1975, Clustering algorithms

10.2307/2346830

10.1006/jmbi.2001.4865

10.1137/S1052623497313642

10.1002/jcc.540080711

10.1145/146847.146921

10.4310/MRL.1994.v1.n6.a3

Li X, 2003, High resolution prediction of protein helix positions and orientations, Proteins

JacobsonMP PincusDL DayTJF RappCS LiX AnY FriesnerRA.Use of all‐atom physical chemistry energy functions for comparative model construction selection and refinement. Protein Sci2003. Submitted for publication.