Công cụ cải tiến cho việc so sánh chuỗi sinh học.

William R. Pearson1, David J. Lipman1
1Department of Biochemistry, University of Virginia, Charlottesville 22908.

Tóm tắt

Chúng tôi đã phát triển ba chương trình máy tính để so sánh các chuỗi protein và DNA. Chúng có thể được sử dụng để tìm kiếm cơ sở dữ liệu chuỗi, đánh giá điểm tương đồng, và xác định cấu trúc định kỳ dựa trên sự tương đồng chuỗi cục bộ. Chương trình FASTA là một biến thể nhạy cảm hơn của chương trình FASTP, có thể được sử dụng để tìm kiếm cơ sở dữ liệu chuỗi protein hoặc DNA và có thể so sánh một chuỗi protein với một cơ sở dữ liệu chuỗi DNA bằng cách dịch cơ sở dữ liệu DNA trong quá trình tìm kiếm. FASTA bao gồm một bước bổ sung trong việc tính toán điểm tương đồng cặp ban đầu cho phép nhiều vùng tương đồng được kết hợp lại để tăng điểm số của các chuỗi liên quan. Chương trình RDF2 có thể được sử dụng để đánh giá mức độ ý nghĩa của các điểm tương đồng bằng cách sử dụng phương pháp xáo trộn mà vẫn giữ gìn được thành phần chuỗi cục bộ. Chương trình LFASTA có thể hiển thị tất cả các vùng tương đồng cục bộ giữa hai chuỗi với các điểm số lớn hơn ngưỡng, sử dụng cùng các tham số chấm điểm và một thuật toán căn chỉnh tương tự; các sự tương đồng cục bộ này có thể được hiển thị dưới dạng một đồ thị “ma trận đồ họa” hoặc dưới dạng các căn chỉnh riêng lẻ. Ngoài ra, các chương trình này còn được tổng quát hóa để cho phép so sánh các chuỗi DNA hoặc protein dựa trên nhiều ma trận chấm điểm thay thế khác nhau.

Từ khóa


Tài liệu tham khảo