Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Cải thiện ước lượng chất lượng các dự đoán cấu trúc
Tóm tắt
Các phương pháp có thể tự động đánh giá chất lượng của các cấu trúc protein được dự đoán thông qua tính toán là rất quan trọng, vì chúng cho phép lựa chọn cấu trúc chính xác nhất từ một tập hợp các dự đoán. Các phương pháp đánh giá xác định chất lượng của một cấu trúc dự đoán bằng cách so sánh nó với các cấu trúc khác được dự đoán bởi các máy chủ khác nhau đã được chứng minh là vượt trội hơn những phương pháp dựa vào các đặc điểm nội tại của chính cấu trúc đó. Chúng tôi đã xem xét các kỹ thuật ước lượng chất lượng của một cấu trúc protein dự đoán dựa trên sự đồng thuận trong dự đoán. LGA được sử dụng để điều chỉnh cấu trúc cần thẩm định với các cấu trúc cho cùng một protein đã được dự đoán bởi các máy chủ khác nhau. Chúng tôi xem xét cả phương pháp tĩnh (ví dụ: trung bình) và phương pháp động (ví dụ: máy vector hỗ trợ) để tổng hợp các khoảng cách này trên hai tập dữ liệu. Chúng tôi phát hiện rằng một cách tiếp cận hồi quy có ràng buộc cho thấy hiệu suất tốt một cách nhất quán. Mặc dù nó không phải lúc nào cũng là phương pháp tốt nhất tuyệt đối, nhưng nó luôn hoạt động tương đồng với các phương pháp tốt nhất trên nhiều tập dữ liệu khác nhau. Công trình được trình bày ở đây cung cấp cơ sở cho việc xây dựng một mô hình hồi quy được đào tạo dựa trên dữ liệu từ các máy chủ dự đoán cấu trúc hiện có.
Từ khóa
#đánh giá chất lượng dự đoán #cấu trúc protein #LGA #hồi quy #máy vector hỗ trợTài liệu tham khảo
Kryshtafovych A, Venclovas Č, Fidelis K, Moult J: Progress over the first decade of CASP experiments. Proteins 2005, 61 Suppl 7: 225–236.
A Kryshtafovych KF, Moult J: Progress from CASP6 to CASP7. Proteins 2007, 69 Suppl 8: 194–207.
Cozzetto D, Kryshtafovych A, Ceriani M, Tramontano A: Assessment of predictions in the model quality assessment category. Proteins 2007, 69 Suppl 8: 175–183.
Wallner B, Elofsson A: Can correct protein models be identified? Protein Science 2003, 12: 1073–1086.
Tosatto S: The Victor/FRST function for model quality estimation. Journal of Computational Biology 2005, 12: 1316–1327.
Shi J: Modeling and Quality Assessment using HARMONY3 and QUAD. CASP7 Proceedings 2006, 1: 118.
Wallner B, Elofsson A: Identification of correct regions in protein models using structural, alignment, and consensus information. Protein Sci 2006, 15(4):900–913.
Chen H, Yang YF, Kihara D: Quality assessment using the diversity of suboptimal alignments. CASP7 Proceedings 2006, 1: 25.
Boniecki Mea: Identification and refinement of potential errors in protein structures. CASP7 Proceedings 2006, 1: 50–51.
Wallner B, Elofsson A: Prediction of global and local model quality in CASP7 using Pcons and ProQ. Proteins 2007, 69 Suppl 8: 184–193.
Cristobal S, Zemla A, Fischer D, Rychlewski L, Elofsson A: A study of quality measured for protein threading models. BMC Bioinformatics 2001., 2(5):
Levitt M, Gerstein M: A unified statistical framework for sequence comparison and structure comparison. Proc Natl Acad Sci U S A 1998, 95(11):5913–5920.
Zemla A: LGA: a method for finding 3D similarities in protein structures. Nucleic Acids Research 2003, 31(13):3370–3374.
Sarwar B, Karypis G, Konstan J, Riedl J: Analysis of Recommendation Algorithms for E-Commerce. Proceedings of ACM E-Commerce 2000, 1: 158–167.
Sarwar B, Karypis G, Konstan J, Riedl J: Item-based Collaborative Filtering Recommendation Algorithms. WWW10 Proceedings 2001, 1: 285–295.
Deshpande M, Karypis G: Item-Based Top- N Recommendation Algorithms. ACM Transactions on Information Systems 2004, 22: 143–177.
Rosenblatt F: The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Review 1958, 65: 386–407.
Joachims T: Advances in Kernel Methods: Support Vector Learning. Cambridge, MA: MIT-Press 1999 chap. Making large-Scale SVM Learning Practical;
Vapnik V: The Nature of Statistical Learning Theory. New York: Springer Verlag; 1995.