Mô hình hóa các vòng trong cấu trúc protein
Tóm tắt
Dự đoán cấu trúc protein so sánh chủ yếu bị hạn chế bởi các lỗi trong việc căn chỉnh và mô hình hóa vòng. Chúng tôi giới thiệu một kỹ thuật mô hình hóa tự động mới, giúp cải thiện đáng kể độ chính xác của dự đoán vòng trong cấu trúc protein. Vị trí của tất cả các nguyên tử không hydro trong vòng được tối ưu hóa trong một môi trường cố định với một hàm năng lượng giả. Năng lượng là tổng của nhiều ràng buộc không gian, bao gồm độ dài liên kết, góc liên kết, và các thuật ngữ góc dihedral không chính xác từ miền lực CHARMM‐22, các sở thích thống kê cho các góc dihedral của chuỗi chính và chuỗi phụ, và các sở thích thống kê cho các tiếp xúc nguyên tử không liên kết, phụ thuộc vào hai loại nguyên tử, khoảng cách giữa chúng trong không gian, và khoảng cách trong chuỗi. Hàm năng lượng được tối ưu hóa bằng phương pháp gradient liên hợp kết hợp với động lực học phân tử và tôi luyện mô phỏng. Thông thường, cấu hình vòng dự đoán tương ứng với cấu hình năng lượng thấp nhất trong số 500 lần tối ưu hóa độc lập. Các dự đoán được thực hiện cho 40 vòng có cấu trúc đã biết ở mỗi chiều dài từ 1 đến 14 amino acid. Độ chính xác của các dự đoán vòng được đánh giá dựa trên mức độ đầy đủ của mẫu hình thái, chiều dài vòng, và các thuộc tính cấu trúc của các vòng tự nhiên. Khi độ chính xác được đo bằng sự chồng lấp cục bộ của mô hình lên vòng tự nhiên, 100%, 90%, và 30% của các dự đoán vòng dài 4, 8, và 12 amino acid, tương ứng, có sai số RMSD < 2 Å cho các nguyên tử N, Ca, C, và O của chuỗi chính; các độ chính xác trung bình lần lượt là 0,59 ± 0,05, 1,16 ± 0,10, và 2,61 ± 0,16 Å. Để mô phỏng các vấn đề mô hình so sánh thực tế, phương pháp này cũng được đánh giá qua việc dự đoán các vòng có cấu trúc đã biết trong chỉ các môi trường tương đối chính xác với các lỗi điển hình của mô hình so sánh mà không có sự căn chỉnh sai. Khi biến dạng RMSD của các nguyên tử thân chuỗi chính là 2,5 Å, sai số dự đoán vòng trung bình tăng thêm 180%, 25%, và 3% cho vòng dài 4, 8, và 12 amino acid, tương ứng. Độ chính xác của dự đoán năng lượng thấp nhất cho một vòng nhất định có thể được ước lượng từ sự biến thể cấu trúc giữa một số dự đoán năng lượng thấp. Giá trị tương đối của phương pháp hiện tại được đánh giá qua (1) việc so sánh với một trong các phương pháp thành công nhất đã được miêu tả trước đây, và (2) mô tả độ chính xác của nó trong các dự đoán mù gần đây về cấu trúc protein. Cuối cùng, cho thấy rằng độ chính xác trung bình của dự đoán chủ yếu bị giới hạn bởi độ chính xác của hàm năng lượng, chứ không phải là phạm vi của mẫu hình thái.
Từ khóa
Tài liệu tham khảo
Abola EE, 1987, Crystallographic data‐bases–Information, content, software systems, scientific applications, 107
WH Press SA Teukolsky WT Vetterling BP Flannery 1992 Cambridge University Press Cambridge UK
ŠaliA SánchezR BadretdinovAY FiserA MeloF OveringtonJP FeyfantE Marti RenomMA.1999. MODELLER a protein structure modeling program release 5. URLhttp://guitar.rockefeller.edu.