Nguồn tài nguyên Gene Ontology: Làm giàu một mỏ vàng

Nucleic Acids Research - Tập 49 Số D1 - Trang D325-D334 - 2021
Seth Carbon, Eric Douglass, Benjamin M. Good, Deepak Unni, Nomi L. Harris, Chris Mungall, Siddhartha Basu, Rex L. Chisholm, Robert J. Dodson, Eric C Hartline, Petra Fey, Paul D Thomas, Laurent‐Philippe Albou, Dustin Ebert, Michael J Kesling, Huaiyu Mi, Anushya Muruganujan, Xiaosong Huang, Tremayne Mushayahama, Sandra LaBonte, Deborah A. Siegele, Giulia Antonazzo, Helen Attrill, Nicholas H. Brown, Phani Garapati, Steven J Marygold, Vítor Trovisco, Gilberto dos Santos, Kathleen Falls, Christopher J Tabone, Pinglei Zhou, Joshua L. Goodman, Victor Strelets, Jim Thurmond, Penelope Garmiri, Rizwan Ishtiaq, M. Rodríguez-López, Márcio Luís Acencio, Martin Kuiper, Astrid Lægreid, Colin Logie, Ruth C. Lovering, Barbara Kramarz, Shirin C C Saverimuttu, Sandra De Miranda Pinheiro, Heather Gunn, Renzhi Su, Kate E. Thurlow, Marcus C. Chibucos, Michelle Giglio, Suvarna Nadendla, James B. Munro, Rebecca Jackson, Margaret Duesbury, Noemi del-Toro, Kay-Martin Hanschmann, Kalpana Panneerselvam, Livia Perfetto, Pablo Porras, Sandra Orchard, Anjali Shrivastava, Hsin-Yu Chang, ROBERT FINN, Alex Mitchell, Neil D. Rawlings, Lorna Richardson, Amaia Sangrador‐Vegas, Judith A. Blake, Karen Christie, M. Eileen Dolan, Harold J. Drabkin, David P. Hill, Li Ni, Dmitry Sitnikov, Midori A. Harris, Stephen G. Oliver, Kim Rutherford, Valerie Wood, Jacqueline Hayles, Jürg Bähler, Elizabeth R. Bolton, Jeffrey L De Pons, Melinda R. Dwinell, G. Thomas Hayman, Mary L. Kaldunski, Anne E. Kwitek, Stanley J. F. Laulederkind, Cody Plasterer, Marek Tutaj, Mahima Vedi, Shur‐Jen Wang, Peter D’Eustachio, Lisa Matthews, James P. Balhoff, Suzi Aleksander, Michael J. Alexander, Robert Mortimer, Stacia R. Engel, Felix Gondwe, Kalpana Karra, Stuart R. Miyasato, Robert S Nash, Matt Simison, Marek S. Skrzypek, Shuai Weng, Edith D. Wong, Marc Feuermann, Pascale Gaudet, Anne Morgat, Erica Bakker, Tanya Berardini, Leonore Reiser, Sabarinath Subramaniam, Eva Huala, Cecilia Arighi, Andrea Auchincloss, Kristian B. Axelsen, Ghislaine Argoud‐Puy, Alex Bateman, Marie-Claude Blatter, Emmanuel Boutet, Emily Bowler-Barnett, Lionel Breuza, Alan Bridge, Ramona Britto, Hema Bye‐A‐Jee, Cristina Casals Casas, Elisabeth Coudert, Paul Denny, Anne Estreicher, Maria Livia Famiglietti, George P. Georghiou, Arnaud Gos, Nadine Gruaz-Gumowski, Emma Hatton-Ellis, Chantal Hulo, Alex Ignatchenko, Florence Jungo, Kati Laiho, Philippe Le Mercier, Damien Lieberherr, Antonia Lock, Yvonne Lussi, Alistair MacDougall, Michele Magrane, María Martin, Patrick Masson, Darren A. Natale, Nevila Hyka‐Nouspikel, Ivo Pedruzzi, Lucille Pourcel, Sylvain Poux, Sangya Pundir, Catherine Rivoire, Elena Speretta, Shyamala Sundaram, Nidhi Tyagi, Kate Warner, Rossana Zaru, Cathy Wu, Alexander D. Diehl, Juancarlos Chan, Christian A Grove, Raymond Lee, Hans‐Michael Müller, Daniela Raciti, Kimberly Van Auken, Paul W. Sternberg, Matthew Berriman, Michael Paulini, Kevin Howe, Sibyl Gao, A. Jordan Wright, Lincoln Stein, Douglas G. Howe, Sabrina Toro, Monte Westerfield, Pankaj Jaiswal, Laurel Cooper, Justin Elser

Tóm tắt

Tóm tắt

Consortium Gene Ontology (GOC) cung cấp nguồn tài nguyên toàn diện nhất hiện nay về tri thức có thể tính toán liên quan đến chức năng của gen và sản phẩm gen. Trong bài báo này, chúng tôi báo cáo những tiến bộ của consortium trong hai năm qua. Khung chú thích GO-CAM mới được cải tiến đáng kể, và chúng tôi đã chuẩn hóa mô hình với một lược đồ tính toán để kiểm tra và xác thực kho lưu trữ đang gia tăng nhanh chóng của 2838 GO-CAMs. Ngoài ra, chúng tôi mô tả những tác động của một số hợp tác để hoàn thiện GO và báo cáo sự gia tăng 10% trong số lượng chú thích GO, gia tăng 25% trong sản phẩm gen được chú thích, và hơn 9.400 bài báo khoa học mới được chú thích. Khi dự án phát triển, chúng tôi tiếp tục nỗ lực xem xét lại các chú thích cũ dưới ánh sáng của những phát hiện mới và để duy trì sự nhất quán với các hệ thống phân loại khác. Kết quả là 20.000 chú thích từ dữ liệu thực nghiệm đã được xem xét, tương ứng với 2.5% các chú thích GO thực nghiệm. Trang web (http://geneontology.org) đã được tái thiết kế để truy cập nhanh chóng vào tài liệu, tải xuống và công cụ. Để duy trì một nguồn tài nguyên chính xác và hỗ trợ tính truy xuất và tái tạo, chúng tôi đã công bố một kho lưu trữ lịch sử phủ 15 năm qua của dữ liệu GO với định dạng và cấu trúc tệp nhất quán cho cả hệ thống phân loại và chú thích.

Từ khóa

#Gene Ontology #GO-CAM #chú thích gen #hợp tác nghiên cứu #tăng trưởng dữ liệu

Tài liệu tham khảo

Giglio, 2019, ECO, the evidence & conclusion ontology: community standard for evidence information, Nucleic Acids Res., 47, D1186, 10.1093/nar/gky1036

Thomas, 2019, Gene Ontology Causal Activity Modeling (GO-CAM) moves beyond GO annotations to structured descriptions of biological functions and systems, Nat. Genet., 51, 1429, 10.1038/s41588-019-0500-1

Mi, 2019, PANTHER version 14: more genomes, a new PANTHER GO-slim and improvements in enrichment analysis tools, Nucleic Acids Res., 47, D419, 10.1093/nar/gky1038

Carbon, 2009, AmiGO: online access to ontology and annotation data, Bioinformatics, 25, 288, 10.1093/bioinformatics/btn615

Gene Ontology Consortium, 2015, Gene Ontology Consortium: going forward, Nucleic Acids Res., 43, D1049, 10.1093/nar/gku1179

Gaudet, 2017, Primer on the gene ontology, Methods Mol. Biol. Clifton NJ, 1446, 25, 10.1007/978-1-4939-3743-1_3

The Gene Ontology Consortium, 2019, The Gene Ontology Resource: 20 years and still GOing strong, Nucleic Acids Res., 47, D330, 10.1093/nar/gky1055

Consortium, T.A. of G.R., 2020, Alliance of Genome Resources Portal: unified model organism research platform, Nucleic Acids Res., 48, D650, 10.1093/nar/gkz813

James-Zorn, 2018, Navigating xenbase: an integrated xenopus genomics and gene expression database, Methods Mol. Biol. Clifton NJ, 1757, 251, 10.1007/978-1-4939-7737-6_10

Harris, 2020, WormBase: a modern model organism information resource, Nucleic Acids Res., 48, D762

Bult, 2019, Mouse genome database (MGD) 2019, Nucleic Acids Res., 47, D801, 10.1093/nar/gky1056

Koopmans, 2019, SynGO: an evidence-based, expert-curated knowledge base for the synapse, Neuron, 103, 217, 10.1016/j.neuron.2019.05.002

Hastings, 2016, ChEBI in 2016: improved services and an expanding collection of metabolites, Nucleic Acids Res., 44, D1214, 10.1093/nar/gkv1031

Lombardot, 2019, Updates in Rhea: SPARQLing biochemical reaction data, Nucleic Acids Res., 47, D596, 10.1093/nar/gky876

Morgat, 2020, Enzyme annotation in UniProtKB using Rhea, Bioinforma. Oxf. Engl., 36, 1896, 10.1093/bioinformatics/btz817

Gaudet, 2011, Phylogenetic-based propagation of functional annotations within the Gene Ontology consortium, Brief. Bioinform., 12, 449, 10.1093/bib/bbr042

Huntley, 2017, Annotation Extensions, Methods Mol. Biol. Clifton NJ, 1446, 233, 10.1007/978-1-4939-3743-1_17

Wood, 2020, Term Matrix: a novel Gene Ontology annotation quality control system based on ontology term co-annotation patterns, Open Biol., 10, 200149, 10.1098/rsob.200149

Deegan (née Clark), 2010, Formalization of taxon-based constraints to detect inconsistencies in annotation and ontology development, BMC Bioinformatics, 11, 530, 10.1186/1471-2105-11-530

Haendel, 2014, Unification of multi-species vertebrate anatomy ontologies for comparative biology in Uberon, J. Biomed. Semant., 5, 21, 10.1186/2041-1480-5-21

Diehl, 2016, The Cell Ontology 2016: enhanced content, modularization, and ontology interoperability, J. Biomed. Semant., 7, 44, 10.1186/s13326-016-0088-7

Hasnain, 2017, BioFed: federated query processing over life sciences linked open data, J. Biomed. Semant., 8, 13, 10.1186/s13326-017-0118-0

Dillen, 2019, Zenodo, an Archive and Publishing Repository: A tale of two herbarium specimen pilot projects, Biodiversity Information Science and Standards, 3, e37080, 10.3897/biss.3.37080

Wilkinson, 2016, The FAIR Guiding Principles for scientific data management and stewardship, Sci. Data, 3, 160018, 10.1038/sdata.2016.18