Cơ sở dữ liệu các cấu trúc protein được suy diễn từ tính đồng cấu và ý nghĩa cấu trúc của việc căn chỉnh trình tự
Tóm tắt
Cơ sở dữ liệu các cấu trúc ba chiều protein đã biết có thể được mở rộng đáng kể nhờ vào việc sử dụng tính đồng cấu trình tự, dựa trên những quan sát sau. (1) Cơ sở dữ liệu các trình tự đã biết, hiện có hơn 12.000 protein, lớn hơn hai bậc so với cơ sở dữ liệu các cấu trúc đã biết. (2) Phương pháp hiện tại mạnh nhất để dự đoán cấu trúc protein là xây dựng mô hình dựa trên tính đồng cấu. (3) Tính đồng cấu cấu trúc có thể được suy luận từ mức độ tương đồng trình tự. (4) Ngưỡng về mức độ tương đồng trình tự đủ để đạt được tính đồng cấu cấu trúc phụ thuộc mạnh vào độ dài của sự căn chỉnh. Ở đây, chúng tôi trước tiên định lượng mối quan hệ giữa tương đồng trình tự, tương đồng cấu trúc và độ dài của sự căn chỉnh bằng cách khảo sát toàn diện các sự căn chỉnh giữa các protein đã biết có cấu trúc và báo cáo một đường cong ngưỡng đồng cấu như một hàm của độ dài sự căn chỉnh. Sau đó, chúng tôi tạo ra một cơ sở dữ liệu về cấu trúc bậc hai protein suy diễn từ đồng cấu (HSSP) bằng cách căn chỉnh tất cả các trình tự được coi là đồng cấu dựa trên đường cong ngưỡng đến mỗi protein có cấu trúc đã biết. Đối với mỗi cấu trúc protein đã biết, cơ sở dữ liệu suy diễn chứa các trình tự đã được căn chỉnh, cấu trúc bậc hai, biến thể trình tự, và hồ sơ trình tự. Các cấu trúc ba chiều của các trình tự đã căn chỉnh được ngụ ý nhưng không được mô hình hóa một cách cụ thể. Cơ sở dữ liệu này tăng đáng kể số lượng các cấu trúc protein đã biết lên gấp năm lần, đạt hơn 1800. Kết quả có thể hữu ích trong việc đánh giá ý nghĩa cấu trúc của các sự khớp trong các tìm kiếm cơ sở dữ liệu trình tự, trong việc suy diễn các sở thích và mẫu cho dự đoán cấu trúc, trong việc làm rõ vai trò cấu trúc của các dư lượng bảo tồn, và trong việc mô hình hóa chi tiết ba chiều thông qua đồng cấu.
Từ khóa
Tài liệu tham khảo
Protein Identification Resource National Biomedical Research Foundation. Georgetown University Medical Center 3900 Reservoir Road N. W. Washington D. C.
SWISS‐PROT Protein Sequence Database. EMBL Data Library D‐6900 Heidelberg FRG and Amos Bairoch Department de Biochimie Medicale Centre Medical Universitaire 1211 Geneva 4 Switzerland.
Saul F. A., 1978, Preliminary refinement and structural analysis of the fab fragment from human immunoglobulin new at 2.0 Ångstroms resolution, J. Biol. Chem., 253, 585, 10.1016/S0021-9258(17)38249-2
Dayhoff M. O., 1978, Atlas of Protein Sequence and Structure
Pierrot M., 1982, Crystal structure and electron transfer properties of cytochrome C3, J. Biol. Chem., 257, 14341, 10.1016/S0021-9258(19)45386-6
Vingron M., 1989, A fast and sensitive multiple sequence alignment algorithm, CABIOS, 5, 115
Staden R., 1988, Methods to define and locate patterns of motifs in sequences, CABIOS, 4, 53