ConSurf: Sử dụng Dữ liệu Tiến hóa để Nêu Ra Các Giả Thuyết Có Thể Kiểm Chứng về Chức Năng Protein

Israel Journal of Chemistry - Tập 53 Số 3-4 - Trang 199-206 - 2013
Gershon Celniker1,2,3, Guy Nimrod4,1, Haim Ashkenazy2, Fabian Glaser5, Eric Martz6, Itay Mayrose3, Tal Pupko2, Nir Ben‐Tal1
1The Department of Biochemistry and Molecular Biology, Tel Aviv University, 69978 Tel Aviv (Israel)
2The Department of Cell Research and Immunology, Tel Aviv University, 69978 Tel Aviv (Israel)
3The Department of Molecular Biology and Ecology of Plants, Tel Aviv University, 69978 Tel Aviv (Israel)
4Present address: Biolojic Design, Akiva Aria 25, Tel Aviv 6215425 (Israel)
5Bioinformatics Knowledge Unit, The Lorry I. Lokey Interdisciplinary Center for Life Sciences and Engineering, Technion – Israel Institute of Technology, Haifa 32000 (Israel)
6Department of Microbiology, University of Massachusetts Amherst, MA, USA.

Tóm tắt

Tóm tắt

Nhiều đột biến biến mất khỏi quần thể vì chúng làm tổn thương chức năng và/hoặc ổn định của protein. Do đó, các vị trí amino acid thiết yếu cho chức năng chính xác tiến hóa chậm hơn so với các vị trí khác, hay nói cách khác, tốc độ tiến hóa chậm của một vị trí phản ánh tầm quan trọng của nó. ConSurf (http://consurf.tau.ac.il), được xem xét trong tài liệu này, khai thác điều này để tiết lộ các vị trí amino acid quan trọng cho việc duy trì hình dạng (hình dạng) tự nhiên và chức năng của protein, cho dù là liên kết, xúc tác, vận chuyển, v.v. Dựa trên chuỗi hoặc cấu trúc 3D của protein truy vấn được nhập vào, một tìm kiếm các chuỗi tương tự được thực hiện và các chuỗi được căn chỉnh. Sự căn chỉnh nhiều chuỗi sau đó được sử dụng để tính toán tốc độ tiến hóa của từng vị trí amino acid, sử dụng các thuật toán Bayesian hoặc độ khả năng cực đại. Cả hai thuật toán đều xem xét mối quan hệ tiến hóa giữa các chuỗi, được phản ánh trong các cây phát sinh loài, để giảm thiểu các vấn đề do lấy mẫu không đồng đều (thiên lệch) trong không gian chuỗi. Điều này đặc biệt quan trọng khi số lượng chuỗi là thấp. ConSurf-DB, một bản phát hành mới được trình bày ở đây, cung cấp phân tích bảo tồn ConSurf đã được tính trước cho gần như tất cả các cấu trúc có sẵn trong Ngân hàng Dữ liệu Protein (PDB). Tính hữu ích của ConSurf cho việc nghiên cứu các protein và đột biến cá nhân, cũng như một loạt các ứng dụng quy mô lớn, toàn hệ gen, được xem xét.

Từ khóa


Tài liệu tham khảo

A. Kessel N. Ben‐Tal Introduction to Proteins: Structure Function and Motion CRC Press Boca Raton 2010.

 

10.1093/bioinformatics/18.suppl_1.S71

10.1006/jmbi.2000.4474

10.1093/bioinformatics/bth070

10.1093/molbev/msh194

10.1093/nar/gkq399

10.1093/bioinformatics/bts622

10.1093/nar/25.17.3389

10.1093/bioinformatics/btq003

10.1093/bioinformatics/btq224

10.1073/pnas.0409137102

10.1006/jmbi.2000.4042

10.1093/nar/gkh340

10.1093/bioinformatics/btm404

Saitou N., 1987, Mol. Biol. Evol., 4, 406

See Ref. [2d].

See Ref. [2a].

N. D. Rubinstein I. Mayrose A. Doron‐Faigenboim T. Pupko Mol. Biol. Evol.2011 28 3297‐3308.

 

10.1006/jmbi.2000.4092

10.1006/jmbi.1996.0167

10.1073/pnas.93.15.7507

10.1006/jmbi.1997.1395

10.1006/jmbi.2001.4540

10.1016/S0022-2836(02)01451-1

10.1002/prot.10146

10.1002/prot.340090107

10.1016/S0076-6879(96)66026-1

10.1073/pnas.0807142105

10.1038/nature05114

10.1038/nature06956

 

10.1093/bioinformatics/bti1023

10.1016/j.str.2008.10.017

10.1038/nature11683

10.1016/j.sbi.2012.03.010

10.1093/nar/gkq528

10.1093/nar/gkm238

10.1093/nar/gkn822

10.1093/bioinformatics/btg224

10.1093/nar/gkr981

10.1093/bioinformatics/btm098

10.1093/bioinformatics/8.3.275

10.1186/gb-2008-9-8-r121

10.1093/nar/gkn860

10.1093/nar/gkr468

10.1093/molbev/msm088

10.1093/nar/gkm382

 

10.1016/j.sbi.2006.06.003

10.1002/9780470882207.ch17

10.1093/bioinformatics/btq114

Jaroszewski L., 2009, PloS Biol., 7

 

10.1093/nar/gki482

10.1016/j.jmb.2008.12.072

10.1016/S0022-2836(03)00750-2

The PyMOL Molecular Graphics System Version 1.3 Schrödinger LLC. Taken from http://www.pymol.org/citing.