Xếp chồng một cơ sở dữ liệu các lõi protein
Tóm tắt
Chúng tôi trình bày một phân tích về 10 dự đoán mù được chuẩn bị cho một hội nghị gần đây, “Đánh giá cơ bản các kỹ thuật dự đoán cấu trúc protein.”1 Các chuỗi của những protein này không có sự tương đồng dễ phát hiện với bất kỳ protein nào trong cơ sở dữ liệu cấu trúc khi đó còn tồn tại, nhưng chúng tôi đã cố gắng sử dụng phương pháp xếp chồng để nhận diện sự tương đồng với các cấu trúc miền đã biết. Bốn trong số 10 protein, như chúng tôi đã biết sau đó, thực sự cho thấy sự tương đồng đáng kể với các cấu trúc đã biết vào thời điểm đó. Đối với 2 trong số những protein này, các dự đoán là chính xác, ở chỗ một cấu trúc tương tự nằm ở hoặc gần đầu danh sách các điểm số xếp chồng, và sự căn chỉnh xếp chồng đồng ý tốt với sự căn chỉnh cấu trúc tương ứng. Đối với mô hình dự đoán tốt nhất, lỗi căn chỉnh trung bình so với sự căn chỉnh cấu trúc tối ưu là 2.7 dư chất, hoàn toàn phát sinh từ các “sự dịch chuyển đăng ký” nhỏ của các sợi hoặc xoắn. Trong phân tích, chúng tôi cố gắng xác định các yếu tố chịu trách nhiệm cho những thành công và thất bại này. Bởi vì phương pháp xếp chồng của chúng tôi không sử dụng các hình phạt khoảng trống, chúng tôi có thể dễ dàng phân biệt giữa các lỗi phát sinh từ định nghĩa trước đó của chúng tôi về các “lõi” của các cấu trúc đã biết và các lỗi phát sinh từ những hạn chế nội tại trong tiềm năng xếp chồng. Kết quả cho thấy rằng sự nhận diện cấu trúc con thành công phụ thuộc một cách quyết định vào định nghĩa chính xác của “cấu trúc” của một protein trong cơ sở dữ liệu. Định nghĩa này phải phân định chính xác các cấu trúc con có khả năng được bảo tồn và không được bảo tồn trong quá trình tiến hóa protein.
Từ khóa
Tài liệu tham khảo
Moult J. Pedersen J. Fidelis K. Balhor R. Judson R. Stevens W.(organizers) Meeting on the Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center California December 4–8 1994.
Bryant S. H.In preparation.
Lathrop R. H. Smith T. F.A branch and bound algorithm for optimal protein threading with pairwise (contact potential) amino acid interactions. In: “Proceedings of the 27th Hawaii International Conference on System Sciences ” Vol. 5. Hunter L. (ed.). Los Alamitos CA: IEEE Computer Society Press 1994:365–376
Abola E. E., 1987, Crystallographic Databases: Information Content, Software Systems, Scientific Applications, 107
Gibrat J.‐F. Madej T. Bryant S. H.Finding the most surprising structural similarities. In preparation.