Cơ sở dữ liệu các cấu trúc protein được suy diễn từ tính đồng cấu và ý nghĩa cấu trúc của việc căn chỉnh trình tự

Proteins: Structure, Function and Bioinformatics - Tập 9 Số 1 - Trang 56-68 - 1991
Chris Sander1, Reinhard Schneider2
1European Molecular Biology Laboratory, Heidelberg, Federal Republic of Germany.
2European Molecular Biology Laboratory, D‐6900 Heidelberg, Federal Republic of Germany

Tóm tắt

Tóm tắt

Cơ sở dữ liệu các cấu trúc ba chiều protein đã biết có thể được mở rộng đáng kể nhờ vào việc sử dụng tính đồng cấu trình tự, dựa trên những quan sát sau. (1) Cơ sở dữ liệu các trình tự đã biết, hiện có hơn 12.000 protein, lớn hơn hai bậc so với cơ sở dữ liệu các cấu trúc đã biết. (2) Phương pháp hiện tại mạnh nhất để dự đoán cấu trúc protein là xây dựng mô hình dựa trên tính đồng cấu. (3) Tính đồng cấu cấu trúc có thể được suy luận từ mức độ tương đồng trình tự. (4) Ngưỡng về mức độ tương đồng trình tự đủ để đạt được tính đồng cấu cấu trúc phụ thuộc mạnh vào độ dài của sự căn chỉnh. Ở đây, chúng tôi trước tiên định lượng mối quan hệ giữa tương đồng trình tự, tương đồng cấu trúc và độ dài của sự căn chỉnh bằng cách khảo sát toàn diện các sự căn chỉnh giữa các protein đã biết có cấu trúc và báo cáo một đường cong ngưỡng đồng cấu như một hàm của độ dài sự căn chỉnh. Sau đó, chúng tôi tạo ra một cơ sở dữ liệu về cấu trúc bậc hai protein suy diễn từ đồng cấu (HSSP) bằng cách căn chỉnh tất cả các trình tự được coi là đồng cấu dựa trên đường cong ngưỡng đến mỗi protein có cấu trúc đã biết. Đối với mỗi cấu trúc protein đã biết, cơ sở dữ liệu suy diễn chứa các trình tự đã được căn chỉnh, cấu trúc bậc hai, biến thể trình tự, và hồ sơ trình tự. Các cấu trúc ba chiều của các trình tự đã căn chỉnh được ngụ ý nhưng không được mô hình hóa một cách cụ thể. Cơ sở dữ liệu này tăng đáng kể số lượng các cấu trúc protein đã biết lên gấp năm lần, đạt hơn 1800. Kết quả có thể hữu ích trong việc đánh giá ý nghĩa cấu trúc của các sự khớp trong các tìm kiếm cơ sở dữ liệu trình tự, trong việc suy diễn các sở thích và mẫu cho dự đoán cấu trúc, trong việc làm rõ vai trò cấu trúc của các dư lượng bảo tồn, và trong việc mô hình hóa chi tiết ba chiều thông qua đồng cấu.

Từ khóa


Tài liệu tham khảo

10.1016/S0022-2836(77)80200-3

Protein Identification Resource National Biomedical Research Foundation. Georgetown University Medical Center 3900 Reservoir Road N. W. Washington D. C.

SWISS‐PROT Protein Sequence Database. EMBL Data Library D‐6900 Heidelberg FRG and Amos Bairoch Department de Biochimie Medicale Centre Medical Universitaire 1211 Geneva 4 Switzerland.

10.1002/j.1460-2075.1985.tb03943.x

10.1038/341209a0

10.1073/pnas.81.4.1075

10.1101/SQB.1972.036.01.016

Saul F. A., 1978, Preliminary refinement and structural analysis of the fab fragment from human immunoglobulin new at 2.0 Ångstroms resolution, J. Biol. Chem., 253, 585, 10.1016/S0021-9258(17)38249-2

10.1002/j.1460-2075.1986.tb04288.x

10.1016/0022-2836(81)90087-5

10.1016/0022-2836(71)90390-1

10.1107/S0567739478001680

10.1002/bip.360221211

10.1073/pnas.85.8.2444

Dayhoff M. O., 1978, Atlas of Protein Sequence and Structure

10.1017/CBO9780511810817

10.1073/pnas.81.13.4037

10.1016/0022-2836(87)90410-4

Pierrot M., 1982, Crystal structure and electron transfer properties of cytochrome C3, J. Biol. Chem., 257, 14341, 10.1016/S0021-9258(19)45386-6

10.1016/0022-2836(84)90417-0

10.1016/0022-2836(84)90472-8

10.1073/pnas.81.19.6014

10.1016/0022-2836(78)90207-3

10.1093/protein/2.8.589

10.1016/0006-291X(76)90972-4

Vingron M., 1989, A fast and sensitive multiple sequence alignment algorithm, CABIOS, 5, 115

10.1016/0022-2836(87)90226-9

10.1016/0022-2836(88)90058-7

10.1016/0014-5793(89)81194-9

10.1002/prot.340050105

10.1107/S0567740882006153

10.1107/S0108768187007559

10.1021/bi00307a035

10.1016/S0022-2836(83)80328-3

10.1093/nar/13.2.645

10.1093/nar/12.1Part1.387

10.1021/bi00571a023

10.1038/335045a0

10.1016/0022-2836(87)90292-0

10.1073/pnas.84.13.4355

10.1016/0022-2836(87)90521-3

10.1073/pnas.87.1.118

Staden R., 1988, Methods to define and locate patterns of motifs in sequences, CABIOS, 4, 53