Xếp chồng một cơ sở dữ liệu các lõi protein

Proteins: Structure, Function and Bioinformatics - Tập 23 Số 3 - Trang 356-369 - 1995
Thomas Madej1, Jean‐François Gibrat2, Stephen H. Bryant2
1Computational Biology Branch, National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, Maryland 20894, USA.
2Computational Biology Branch, National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, Maryland 20894

Tóm tắt

Tóm tắt

Chúng tôi trình bày một phân tích về 10 dự đoán mù được chuẩn bị cho một hội nghị gần đây, “Đánh giá cơ bản các kỹ thuật dự đoán cấu trúc protein.”1 Các chuỗi của những protein này không có sự tương đồng dễ phát hiện với bất kỳ protein nào trong cơ sở dữ liệu cấu trúc khi đó còn tồn tại, nhưng chúng tôi đã cố gắng sử dụng phương pháp xếp chồng để nhận diện sự tương đồng với các cấu trúc miền đã biết. Bốn trong số 10 protein, như chúng tôi đã biết sau đó, thực sự cho thấy sự tương đồng đáng kể với các cấu trúc đã biết vào thời điểm đó. Đối với 2 trong số những protein này, các dự đoán là chính xác, ở chỗ một cấu trúc tương tự nằm ở hoặc gần đầu danh sách các điểm số xếp chồng, và sự căn chỉnh xếp chồng đồng ý tốt với sự căn chỉnh cấu trúc tương ứng. Đối với mô hình dự đoán tốt nhất, lỗi căn chỉnh trung bình so với sự căn chỉnh cấu trúc tối ưu là 2.7 dư chất, hoàn toàn phát sinh từ các “sự dịch chuyển đăng ký” nhỏ của các sợi hoặc xoắn. Trong phân tích, chúng tôi cố gắng xác định các yếu tố chịu trách nhiệm cho những thành công và thất bại này. Bởi vì phương pháp xếp chồng của chúng tôi không sử dụng các hình phạt khoảng trống, chúng tôi có thể dễ dàng phân biệt giữa các lỗi phát sinh từ định nghĩa trước đó của chúng tôi về các “lõi” của các cấu trúc đã biết và các lỗi phát sinh từ những hạn chế nội tại trong tiềm năng xếp chồng. Kết quả cho thấy rằng sự nhận diện cấu trúc con thành công phụ thuộc một cách quyết định vào định nghĩa chính xác của “cấu trúc” của một protein trong cơ sở dữ liệu. Định nghĩa này phải phân định chính xác các cấu trúc con có khả năng được bảo tồn và không được bảo tồn trong quá trình tiến hóa protein.

Từ khóa


Tài liệu tham khảo

Moult J. Pedersen J. Fidelis K. Balhor R. Judson R. Stevens W.(organizers) Meeting on the Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center California December 4–8 1994.

10.1016/0958-1669(94)90045-0

10.1038/nbt0493-479

10.1016/S0959-440X(05)80160-5

10.1016/0959-440X(95)80082-4

10.1002/pro.5560030405

Bryant S. H.In preparation.

10.1002/j.1460-2075.1986.tb04288.x

10.1016/0958-1669(94)90043-4

10.1002/pro.5560030416

10.1038/358086a0

10.1016/0022-2836(92)90693-E

10.1007/978-1-4684-6831-1_12

10.1002/prot.340190206

10.1073/pnas.89.19.9029

10.1006/jmbi.1993.1323

10.1093/protein/6.8.811

10.1006/jmbi.1993.1433

10.1002/prot.340160110

Lathrop R. H. Smith T. F.A branch and bound algorithm for optimal protein threading with pairwise (contact potential) amino acid interactions. In: “Proceedings of the 27th Hawaii International Conference on System Sciences ” Vol. 5. Hunter L. (ed.). Los Alamitos CA: IEEE Computer Society Press 1994:365–376

Abola E. E., 1987, Crystallographic Databases: Information Content, Software Systems, Scientific Applications, 107

10.1002/prot.340030202

10.1002/prot.340190309

10.1002/pro.5560031117

Gibrat J.‐F. Madej T. Bryant S. H.Finding the most surprising structural similarities. In preparation.

10.1006/jmbi.1993.1074

10.1038/ng0294-119

10.1021/bi00480a009

10.1016/0022-2836(91)90665-S

10.1038/362219a0

10.1073/pnas.89.19.9257

10.1016/0022-2836(87)90315-9

10.1016/S0021-9258(19)50471-9

10.1093/oxfordjournals.jbchem.a123935

10.1002/prot.340150206

10.1002/prot.340190302

10.1038/372631a0

10.1126/science.8211139

10.1038/354105a0

10.1002/prot.340110407

10.1002/prot.340050307

10.1002/jcc.540130407