Gán cấu trúc thứ cấp protein dựa trên tri thức
Tóm tắt
Chúng tôi đã phát triển một thuật toán tự động STRIDE để gán cấu trúc thứ cấp protein từ các tọa độ nguyên tử dựa trên việc sử dụng kết hợp năng lượng liên kết hydro và thông tin góc xoay thân được suy ra từ thống kê. Các tham số của quy trình nhận dạng mẫu đã được tối ưu hóa bằng cách sử dụng các chỉ định do các nhà tinh thể học cung cấp như một tiêu chuẩn tham chiếu. So sánh với kỹ thuật đang được sử dụng rộng rãi nhất hiện nay DSSP của Kabsch và Sander (Biopolymers 22:2577‐2637, 1983) cho thấy STRIDE và DSSP gán trạng thái cấu trúc thứ cấp cho 58% và 31% trong số 226 chuỗi protein trong mẫu dữ liệu của chúng tôi, tương ứng, với sự đồng ý cao hơn với các định nghĩa chi tiết từng dư lượng do những người phát hiện ra các cấu trúc cung cấp, trong khi 11% số chuỗi có sự gán giống nhau. STRIDE chỉ ra mỗi chuỗi xoắn thứ 11 và mỗi chuỗi sợi thứ 32 nhiều hơn so với các gán đã được công bố. © 1995 Wiley‐Liss, Inc.
Từ khóa
Tài liệu tham khảo
Heringa J., 1992, OBSTRUCT: A program to obtain largest cliques from a protein sequence set according to structural resolution and sequence similarity, Comput. Appl. Biosci., 8, 599
Chou P. Y., 1978, Prediction of the secondary structure of. proteins from their amino acid sequences, Adv. Enzym., 47, 45