Hàm điểm cho đánh giá tự động chất lượng mẫu cấu trúc protein

Proteins: Structure, Function and Bioinformatics - Tập 57 Số 4 - Trang 702-710 - 2004
Yang Zhang1, Jeffrey Skolnick1
1Center of Excellence in Bioinformatics, University at Buffalo, Buffalo, New York

Tóm tắt

Tóm tắt

Chúng tôi đã phát triển một hàm điểm mới, gọi là điểm mô hình mẫu (TM‐score), để đánh giá chất lượng của các mẫu cấu trúc protein và các mô hình toàn đoạn được dự đoán bằng cách mở rộng các phương pháp đã sử dụng trong bài kiểm tra khoảng cách toàn cầu (GDT)1 và MaxSub.2 Đầu tiên, một thang độ phụ thuộc kích thước protein được khai thác để loại bỏ sự phụ thuộc kích thước protein vốn có của các điểm số trước đây và tính toán phù hợp cho các cặp cấu trúc protein ngẫu nhiên. Thứ hai, thay vì thiết lập các ngưỡng khoảng cách cụ thể và chỉ tính toán các phần có lỗi dưới ngưỡng đó, tất cả các cặp dư lượng trong sự liên kết/mô hình đều được đánh giá trong điểm số đề xuất. Để so sánh các hàm điểm khác nhau, chúng tôi đã xây dựng một bộ kiểm tra quy mô lớn của các mẫu cấu trúc cho 1489 protein cỡ nhỏ đến cỡ trung bình bằng cách sử dụng chương trình đánh chỉ mục PROSPECTOR_3 và xây dựng các mô hình toàn đoạn bằng MODELLER và TASSER. Điểm TM của các sự liên kết đánh chỉ mục ban đầu, so với các hàm điểm GDT và MaxSub, cho thấy một mối tương quan mạnh mẽ hơn nhiều với chất lượng của các mô hình toàn đoạn cuối cùng. Điểm TM còn được khai thác như một đánh giá cho tất cả các mục tiêu 'mới gấp' trong thí nghiệm CASP5 gần đây và cho thấy sự trùng lặp gần gũi với kết quả đánh giá bằng mắt của chuyên gia con người. Những dữ liệu này cho thấy rằng điểm TM là một bổ sung hữu ích cho việc đánh giá hoàn toàn tự động các dự đoán cấu trúc protein. Chương trình có thể thực thi của điểm TM có thể tải xuống miễn phí tại http://bioinformatics.buffalo.edu/TM‐score. Proteins 2004. © 2004 Wiley‐Liss, Inc.

Từ khóa


Tài liệu tham khảo

10.1002/(SICI)1097-0134(1999)37:3 <22::AID-PROT5>3.0.CO;2-W

10.1093/bioinformatics/16.9.776

10.1126/science.1853201

10.1038/358086a0

10.1016/0959-440X(95)80082-4

10.1002/prot.20106

10.1006/jmbi.1993.1626

10.1002/(SICI)1097-0134(19980901)32:4<475::AID-PROT6>3.0.CO;2-F

10.1016/S0006-3495(03)74551-2

10.1110/ps.9.9.1753

10.1107/S0567739476001873

10.1107/S0567739478001680

10.1093/nar/gkg571

10.1186/1471-2105-2-5

10.1002/prot.10535

10.1002/prot.10556

10.1093/nar/28.1.235

10.1073/pnas.95.11.5913

10.1110/ps.0215902

10.1002/1097-0282(20011015)59:5<305::AID-BIP1027>3.0.CO;2-6

10.1110/ps.690101

10.1016/S0968-0004(00)89105-7

10.1016/S1359-0278(98)00019-4

Gerstein M, 1996, Using iterative dynamic programming to obtain accurate pairwise and multiple alignments of protein structures, Proc Int Conf Intell Syst Mol Biol, 4, 59

10.1016/j.jmb.2003.10.027

10.1016/S1359-0278(96)00048-X

10.1002/pro.5560020413

10.1016/0022-2836(91)90603-4

10.1093/protein/6.5.501

10.1002/(SICI)1097-0134(1999)37:3 <2::AID-PROT2>3.0.CO;2-2

10.1002/prot.10054

10.1002/prot.10543

10.1002/prot.10557

10.1002/prot.10546

10.1146/annurev.biophys.29.1.291

10.1073/pnas.0305695101