Genome and proteome annotation: organization, interpretation and integration

Journal of the Royal Society Interface - Tập 6 Số 31 - Trang 129-147 - 2009
Gabrielle A. Reeves1, David Talavera2, Janet M. Thornton2
1EMBL-EBI, Wellcome Trust Genome Campus, Hinxton, Cambridge CB10 1SD, UK
2EMBL-EBI, Wellcome Trust Genome CampusHinxton, Cambridge CB10 1SD, UK

Tóm tắt

Recent years have seen a huge increase in the generation of genomic and proteomic data. This has been due to improvements in current biological methodologies, the development of new experimental techniques and the use of computers as support tools. All these raw data are useless if they cannot be properly analysed, annotated, stored and displayed. Consequently, a vast number of resources have been created to present the data to the wider community. Annotation tools and databases provide the means to disseminate these data and to comprehend their biological importance. This review examines the various aspects of annotation: type, methodology and availability. Moreover, it puts a special interest on novel annotation fields, such as that of phenotypes, and highlights the recent efforts focused on the integrating annotations.

Từ khóa


Tài liệu tham khảo

10.1126/science.2047873

10.1093/nar/gkl172

10.1093/nar/25.17.3389

10.1126/science.1155472

10.1093/nar/gkh039

10.1038/75556

10.1093/bib/3.3.252

10.1093/nar/gkl972

10.1093/nar/gkm611

10.1016/j.jmb.2004.05.028

10.1186/1471-2180-5-58

10.1186/1471-2105-6-167

10.1093/nar/gkm929

10.1107/S0907444902003451

10.1038/nsb1203-980

10.1126/science.1103388

10.1038/nature05874

10.1016/j.cell.2006.06.023

10.1002/pro.5560051107

10.1006/jmbi.1999.3310

10.1002/pmic.200300771

10.1093/nar/gkg095

10.1038/35093574

10.1038/nrg2220

10.1038/ng803

10.1093/nar/gkm238

10.1093/nar/gki034

10.1093/nar/gkm881

10.1038/80697

10.1093/nar/gkh021

10.1093/bioinformatics/btl423

10.1126/science.1112014

10.1093/bfgp/eln003

10.1093/bioinformatics/btn113

10.1073/pnas.95.21.12185

10.1126/science.1108625

10.1038/nature04072

10.1093/nar/gkj090

10.1002/j.1460-2075.1986.tb04288.x

10.1093/nar/gkh033

10.1093/hmg/11.4.451

10.1101/gr.217702

10.1371/journal.pcbi.0040020

10.1093/nar/gkh438

10.1093/nar/gki476

10.1093/nar/gkl071

10.1016/S1359-6446(05)03481-1

10.1101/gr.1858004

10.1002/prot.21636

10.1093/nar/gkm791

10.1073/pnas.151268698

10.1186/1471-2105-2-7

10.1093/protein/gzh013

10.1038/990031

10.1016/S0959-440X(96)80056-X

10.1186/gb-2005-6-5-r44

10.1110/ps.8.5.978

10.1038/nprot.2007.131

10.1093/nar/gkl940

10.1002/prot.20252

10.1093/bioinformatics/bti486

10.1002/prot.20664

10.1093/nar/gkm960

10.1016/S0168-9525(00)02005-9

10.1098/rstb.2005.1802

10.1093/nar/gkm988

10.1038/35076585

Forbes S. A. et al . 2008 The catalogue of somatic mutations in cancer (COSMIC). Current Protocols in Human Genetics ch. 10 unit 10.11. Somerset NJ: John Wiley & Sons.

10.1038/nrc1299

10.1016/S1476-9271(02)00094-4

10.1016/j.tig.2003.08.009

10.1186/gb-2007-8-12-r263

10.1006/jmbi.2001.5080

10.1016/S0022-2836(03)00670-3

10.1093/nar/gkl959

10.1038/nature05610

Grollman A.P, 1990, Site specific mutagenesis, Prog. Clin. Biol. Res. A, 340, 61

10.1093/nar/gkj068

Gupta R, 2002, Prediction of glycosylation across the human proteome and the correlation to protein function, Pac. Symp. Biocomput, 7, 310

10.1093/glycob/9.10.1009

10.1186/1471-2164-5-72

10.1093/nar/gkg128

10.1093/nar/30.1.52

10.1101/gr. 183801

10.1098/rsta.2003.1224

10.1038/ng1469

10.1186/gb-2005-6-7-r58

10.1093/nar/gkl774

10.1158/0008-5472.CAN-07-6778

10.1042/BC20050002

10.1093/nar/gkl320

10.1093/nar/gkj063

10.1016/j.tig.2005.03.007

10.1093/bioinformatics/btm020

10.1093/bioinformatics/btn387

10.1093/glycob/cwl009

10.1093/bioinformatics/btl677

10.1007/978-1-59745-398-1_19

10.1146/annurev.genom.7.080505.115745

10.1093/glycob/cwm050

10.1093/glycob/cwh151

10.1110/ps.0303703

10.1101/gr.155001

10.1093/nar/gkm882

10.1093/nar/gki007

10.1371/journal.pcbi.0010001

Kappler M.A, 2008, Software for rapid prototyping in the pharmaceutical and biotechnology industries, Curr. Opin. Drug Discov. Dev, 11, 389

10.1093/bioinformatics/bti442

10.1093/nar/gkm966

10.1093/nar/gkl958

10.1186/1741-7007-5-44

10.1186/1471-2105-5-72

10.1093/bioinformatics/bti130

10.1093/nar/gkl884

10.1093/bioinformatics/17.10.920

10.1016/j.jmb.2007.05.022

10.1006/jmbi.2000.4315

10.1126/science.1089427

10.1093/nar/gkl913

10.1093/nar/gkm291

10.1093/protein/gzh062

10.1038/35057062

10.1093/nar/gki001

10.1093/nar/gki414

10.1371/journal.pbio.0050254

10.1073/pnas.0136770100

10.1099/mic.0.2008/018549-0

10.1093/nar/gkm884

10.1371/journal.pone.0000651

10.1093/nar/gkl897

10.1093/nar/gkm297

10.1007/s00335-006-0070-2

10.1016/j.tig.2007.12.007

10.1146/annurev.biophys.29.1.291

10.1093/nar/gkh043

10.1002/pmic.200700592

10.1038/sj.emboj.7601023

10.1093/nar/29.13.2850

10.1093/nar/gkl197

10.1038/nbt0808-864

10.1098/rstb.2005.1798

10.1093/nar/gkl841

10.1093/bioinformatics/btm189

10.1186/gb-2004-5-4-218

10.1016/S1359-6446(05)03621-4

10.1038/nature01266

10.1093/nar/gkj111

10.1016/S0969-2126(97)00260-8

10.1517/14728222.8.6.587

10.1093/nar/gkl995

Petsko G.A, 2001, Homologuephobia, Genome Biol, 2, 1

10.1093/nar/gkj059

10.1371/journal.pbio.0020393

10.1016/j.tig.2007.12.006

10.1093/nar/gkh028

10.1093/bioinformatics/bti1106

10.1186/1471-2105-8-333

10.1093/nar/29.1.137

10.1093/nar/gkl842

10.1101/gr.4200206

10.1186/1471-2105-8-S1-S18

10.1038/nrg1769

10.1093/bioinformatics/btn528

10.1093/nar/gki086

10.1186/1471-2164-8-24

10.1093/nar/gkm975

10.1016/j.tcm.2006.04.003

10.1073/pnas.0605534104

10.1073/pnas.95.11.5857

10.1093/nar/gkg520

10.1038/nbt0308-256b

10.1126/science.1133427

10.1093/nar/28.1.352

10.1007/s00335-005-0112-1

10.1002/pmic.200300700

10.1093/nar/gkm956

10.1093/bfgp/elm025

10.1093/nar/gkj031

10.1093/nar/29.1.82

10.1101/gr.403602

10.1016/j.tibs.2005.07.001

10.1093/nar/26.1.8

10.1073/pnas.0400782101

10.1093/nar/gkm965

10.1093/nar/gkj163

10.1038/sj.ejhg.5201470

10.1126/science.1105136

10.1093/nar/gkm895

10.1101/gr.772403

10.1016/j.jmb.2005.01.044

10.1073/pnas.0700800104

10.1126/science.1107851

10.1093/nar/gkl988

10.1016/j.neuroscience.2008.03.018

10.1038/ng1840

10.1126/science.1093857

10.1016/j.sbi.2005.04.003

10.1016/j.tig.2004.03.005

10.1093/nar/gkl1031

10.1038/nature06884

10.1093/bioinformatics/bth938

10.1093/nar/gkm987

10.1006/jmbi.2000.3550

10.1101/gr.202401

10.1126/science.1145720

10.1016/j.compbiolchem.2003.10.003

10.1002/mc.20261

10.1016/j.pbi.2007.07.006

10.1139/O07-061

10.1093/nar/gkm1019

10.1016/j.jbi.2007.11.008

10.1093/bib/bbm045