Mô hình hóa các vòng trong cấu trúc protein

Protein Science - Tập 9 Số 9 - Trang 1753-1773 - 2000
András Fiser1, Richard Kinh Gian1, Andrej Šali1
1Laboratories of Molecular Biophysics, Pels Family Center for Biochemistry and Structural Biology, The Rockefeller University, 1230 York Ave., New York, New York 10021

Tóm tắt

Tóm tắt

Dự đoán cấu trúc protein so sánh chủ yếu bị hạn chế bởi các lỗi trong việc căn chỉnh và mô hình hóa vòng. Chúng tôi giới thiệu một kỹ thuật mô hình hóa tự động mới, giúp cải thiện đáng kể độ chính xác của dự đoán vòng trong cấu trúc protein. Vị trí của tất cả các nguyên tử không hydro trong vòng được tối ưu hóa trong một môi trường cố định với một hàm năng lượng giả. Năng lượng là tổng của nhiều ràng buộc không gian, bao gồm độ dài liên kết, góc liên kết, và các thuật ngữ góc dihedral không chính xác từ miền lực CHARMM‐22, các sở thích thống kê cho các góc dihedral của chuỗi chính và chuỗi phụ, và các sở thích thống kê cho các tiếp xúc nguyên tử không liên kết, phụ thuộc vào hai loại nguyên tử, khoảng cách giữa chúng trong không gian, và khoảng cách trong chuỗi. Hàm năng lượng được tối ưu hóa bằng phương pháp gradient liên hợp kết hợp với động lực học phân tử và tôi luyện mô phỏng. Thông thường, cấu hình vòng dự đoán tương ứng với cấu hình năng lượng thấp nhất trong số 500 lần tối ưu hóa độc lập. Các dự đoán được thực hiện cho 40 vòng có cấu trúc đã biết ở mỗi chiều dài từ 1 đến 14 amino acid. Độ chính xác của các dự đoán vòng được đánh giá dựa trên mức độ đầy đủ của mẫu hình thái, chiều dài vòng, và các thuộc tính cấu trúc của các vòng tự nhiên. Khi độ chính xác được đo bằng sự chồng lấp cục bộ của mô hình lên vòng tự nhiên, 100%, 90%, và 30% của các dự đoán vòng dài 4, 8, và 12 amino acid, tương ứng, có sai số RMSD < 2 Å cho các nguyên tử N, Ca, C, và O của chuỗi chính; các độ chính xác trung bình lần lượt là 0,59 ± 0,05, 1,16 ± 0,10, và 2,61 ± 0,16 Å. Để mô phỏng các vấn đề mô hình so sánh thực tế, phương pháp này cũng được đánh giá qua việc dự đoán các vòng có cấu trúc đã biết trong chỉ các môi trường tương đối chính xác với các lỗi điển hình của mô hình so sánh mà không có sự căn chỉnh sai. Khi biến dạng RMSD của các nguyên tử thân chuỗi chính là 2,5 Å, sai số dự đoán vòng trung bình tăng thêm 180%, 25%, và 3% cho vòng dài 4, 8, và 12 amino acid, tương ứng. Độ chính xác của dự đoán năng lượng thấp nhất cho một vòng nhất định có thể được ước lượng từ sự biến thể cấu trúc giữa một số dự đoán năng lượng thấp. Giá trị tương đối của phương pháp hiện tại được đánh giá qua (1) việc so sánh với một trong các phương pháp thành công nhất đã được miêu tả trước đây, và (2) mô tả độ chính xác của nó trong các dự đoán mù gần đây về cấu trúc protein. Cuối cùng, cho thấy rằng độ chính xác trung bình của dự đoán chủ yếu bị giới hạn bởi độ chính xác của hàm năng lượng, chứ không phải là phạm vi của mẫu hình thái.

Từ khóa


Tài liệu tham khảo

10.1002/(SICI)1097-0134(1997)1 <29::AID-PROT5>3.0.CO;2-J

10.1006/jmbi.1994.1052

Abola EE, 1987, Crystallographic data‐bases–Information, content, software systems, scientific applications, 107

10.1002/(SICI)1097-0134(199602)24:2<152::AID-PROT2>3.0.CO;2-L

10.1006/jmbi.1993.1105

10.1038/326347a0

10.1002/jcc.540040211

10.1002/bip.360330302

10.1016/0022-2836(69)90487-2

10.1002/bip.360291415

10.1080/08927029308022163

10.1038/335564a0

10.1002/bip.360260114

10.1002/bip.360330812

10.1002/(SICI)1096-987X(199606)17:8<1002::AID-JCC9>3.0.CO;2-Y

10.1063/1.456500

10.1002/(SICI)1096-987X(199609)17:12<1453::AID-JCC6>3.0.CO;2-J

10.1016/0022-2836(87)90412-8

10.1126/science.3090684

10.1038/342877a0

10.1016/S0969-2126(96)00119-0

10.1093/protein/2.5.335

10.1002/pro.5560021213

10.1021/bi00349a037

10.1002/pro.5560020915

10.1021/ja00124a002

10.1002/(SICI)1097-0134(20000701)40:1<135::AID-PROT150>3.0.CO;2-1

10.1007/PL00010718

10.1021/jp984440c

10.1002/pro.5560051223

10.1002/(SICI)1096-987X(19980415)19:5<548::AID-JCC7>3.0.CO;2-M

10.1002/jcc.540110115

10.1002/pro.5560040618

10.1006/jmbi.1995.0540

10.1006/jmbi.1998.2061

10.1093/protein/7.8.953

10.1002/prot.340010408

10.1093/protein/5.7.617

10.1002/pro.5560021104

10.1006/jmbi.1996.0771

10.1016/0065-227X(84)90010-8

10.1073/pnas.77.6.3393

10.1016/S0092-8674(00)80417-1

10.1002/bip.360320106

10.1006/jmbi.1998.1884

10.1002/prot.340230413

10.1006/jmbi.1999.2583

10.1006/jmbi.1997.1233

10.1006/jmbi.1999.2659

10.1002/(SICI)1097-0134(1999)37:3 <30::AID-PROT6>3.0.CO;2-S

10.1002/j.1460-2075.1986.tb04287.x

10.1002/bip.360221211

10.1006/jmbi.1999.2581

10.1016/S1074-5521(97)90073-9

10.1073/pnas.92.21.9886

10.1093/protein/12.1.11

10.1006/jmbi.1998.2393

10.1038/nsb0295-163

10.1006/jmbi.1996.0363

10.1002/jcc.540100603

10.1002/jcc.540100604

10.1002/jcc.540100605

10.1093/protein/7.10.1175

10.1016/S0022-2836(83)80306-4

10.1016/0022-2836(92)90964-L

10.1016/S0959-440X(97)80112-1

10.1038/356083a0

10.1021/jp973084f

10.1038/nbt0396-323

10.1146/annurev.biophys.29.1.291

10.1002/(SICI)1097-0134(1997)1 <14::AID-PROT4>3.0.CO;2-O

10.1073/pnas.86.23.9268

10.1006/jmbi.1996.0617

10.1002/prot.340140409

10.1006/jmbi.1994.1332

10.1002/jcc.540141115

10.1006/jmbi.1996.0868

10.1093/protein/11.6.411

10.1002/prot.340230305

10.1002/(SICI)1097-0134(1999)37:3 <2::AID-PROT2>3.0.CO;2-2

10.1002/prot.340010207

10.1006/jmbi.1999.3440

10.1006/jmbi.1996.0819

10.1016/0022-2836(92)91008-D

10.1016/S0006-3495(97)78266-3

10.1002/pro.5560040301

10.1016/0022-2836(87)90358-5

WH Press SA Teukolsky WT Vetterling BP Flannery 1992 Cambridge University Press Cambridge UK

10.1016/S0022-2836(63)80023-6

10.1093/protein/6.8.837

10.1002/(SICI)1097-0134(19990501)35:2<173::AID-PROT4>3.0.CO;2-2

10.1093/protein/8.4.389

10.1002/ijch.199400028

10.1016/0022-2836(92)90553-V

10.1073/pnas.90.8.3583

10.1016/0079-6107(85)90002-1

10.1002/pro.5560040316

10.1006/jmbi.1993.1607

10.1006/jmbi.1996.0851

10.1006/jmbi.1998.2043

10.1016/S1359-0278(98)00034-0

10.1038/4136

10.1006/jmbi.1993.1626

ŠaliA SánchezR BadretdinovAY FiserA MeloF OveringtonJP FeyfantE Marti RenomMA.1999. MODELLER a protein structure modeling program release 5. URLhttp://guitar.rockefeller.edu.

10.1006/jmbi.1998.1689

10.1002/(SICI)1097-0134(1997)1 <50::AID-PROT8>3.0.CO;2-S

10.1016/S0959-440X(97)80027-9

10.1073/pnas.95.23.13597

10.1093/bioinformatics/15.12.1060

10.1002/prot.340090107

10.1002/bip.360261207

10.1110/ps.8.5.1045

10.1016/0022-2836(89)90583-4

10.1016/S0022-2836(05)80269-4

10.1002/prot.340170404

10.1002/prot.340180205

10.1002/pro.5560040715

10.1016/S0022-2836(99)80016-3

10.1002/bip.360320105

10.1093/protein/10.2.159

10.1006/jmbi.1993.1018

10.1002/prot.340060405

10.1002/prot.340130306

10.1002/bip.360291408

10.1006/jmbi.1996.0857

10.1002/bip.360341211

10.1002/(SICI)1097-0134(19990701)36:1<1::AID-PROT1>3.0.CO;2-T

10.1016/S0969-2126(99)80085-9

10.1006/jmbi.1996.0020

10.1006/jmbi.1999.2826

10.1006/jmbi.1996.0052

10.1074/jbc.271.40.24711

10.1002/prot.340190407

10.1002/(SICI)1097-0134(199602)24:2<209::AID-PROT7>3.0.CO;2-D

10.1002/pro.5560030315

10.1002/pro.5560020806

10.1002/jcc.540140508