Nguồn tài nguyên Gene Ontology: Làm giàu một mỏ vàng
Tóm tắt
Consortium Gene Ontology (GOC) cung cấp nguồn tài nguyên toàn diện nhất hiện nay về tri thức có thể tính toán liên quan đến chức năng của gen và sản phẩm gen. Trong bài báo này, chúng tôi báo cáo những tiến bộ của consortium trong hai năm qua. Khung chú thích GO-CAM mới được cải tiến đáng kể, và chúng tôi đã chuẩn hóa mô hình với một lược đồ tính toán để kiểm tra và xác thực kho lưu trữ đang gia tăng nhanh chóng của 2838 GO-CAMs. Ngoài ra, chúng tôi mô tả những tác động của một số hợp tác để hoàn thiện GO và báo cáo sự gia tăng 10% trong số lượng chú thích GO, gia tăng 25% trong sản phẩm gen được chú thích, và hơn 9.400 bài báo khoa học mới được chú thích. Khi dự án phát triển, chúng tôi tiếp tục nỗ lực xem xét lại các chú thích cũ dưới ánh sáng của những phát hiện mới và để duy trì sự nhất quán với các hệ thống phân loại khác. Kết quả là 20.000 chú thích từ dữ liệu thực nghiệm đã được xem xét, tương ứng với 2.5% các chú thích GO thực nghiệm. Trang web (http://geneontology.org) đã được tái thiết kế để truy cập nhanh chóng vào tài liệu, tải xuống và công cụ. Để duy trì một nguồn tài nguyên chính xác và hỗ trợ tính truy xuất và tái tạo, chúng tôi đã công bố một kho lưu trữ lịch sử phủ 15 năm qua của dữ liệu GO với định dạng và cấu trúc tệp nhất quán cho cả hệ thống phân loại và chú thích.
Từ khóa
#Gene Ontology #GO-CAM #chú thích gen #hợp tác nghiên cứu #tăng trưởng dữ liệuTài liệu tham khảo
Giglio, 2019, ECO, the evidence & conclusion ontology: community standard for evidence information, Nucleic Acids Res., 47, D1186, 10.1093/nar/gky1036
Thomas, 2019, Gene Ontology Causal Activity Modeling (GO-CAM) moves beyond GO annotations to structured descriptions of biological functions and systems, Nat. Genet., 51, 1429, 10.1038/s41588-019-0500-1
Mi, 2019, PANTHER version 14: more genomes, a new PANTHER GO-slim and improvements in enrichment analysis tools, Nucleic Acids Res., 47, D419, 10.1093/nar/gky1038
Carbon, 2009, AmiGO: online access to ontology and annotation data, Bioinformatics, 25, 288, 10.1093/bioinformatics/btn615
Gene Ontology Consortium, 2015, Gene Ontology Consortium: going forward, Nucleic Acids Res., 43, D1049, 10.1093/nar/gku1179
Gaudet, 2017, Primer on the gene ontology, Methods Mol. Biol. Clifton NJ, 1446, 25, 10.1007/978-1-4939-3743-1_3
The Gene Ontology Consortium, 2019, The Gene Ontology Resource: 20 years and still GOing strong, Nucleic Acids Res., 47, D330, 10.1093/nar/gky1055
Consortium, T.A. of G.R., 2020, Alliance of Genome Resources Portal: unified model organism research platform, Nucleic Acids Res., 48, D650, 10.1093/nar/gkz813
James-Zorn, 2018, Navigating xenbase: an integrated xenopus genomics and gene expression database, Methods Mol. Biol. Clifton NJ, 1757, 251, 10.1007/978-1-4939-7737-6_10
Harris, 2020, WormBase: a modern model organism information resource, Nucleic Acids Res., 48, D762
Koopmans, 2019, SynGO: an evidence-based, expert-curated knowledge base for the synapse, Neuron, 103, 217, 10.1016/j.neuron.2019.05.002
Hastings, 2016, ChEBI in 2016: improved services and an expanding collection of metabolites, Nucleic Acids Res., 44, D1214, 10.1093/nar/gkv1031
Lombardot, 2019, Updates in Rhea: SPARQLing biochemical reaction data, Nucleic Acids Res., 47, D596, 10.1093/nar/gky876
Morgat, 2020, Enzyme annotation in UniProtKB using Rhea, Bioinforma. Oxf. Engl., 36, 1896, 10.1093/bioinformatics/btz817
Gaudet, 2011, Phylogenetic-based propagation of functional annotations within the Gene Ontology consortium, Brief. Bioinform., 12, 449, 10.1093/bib/bbr042
Huntley, 2017, Annotation Extensions, Methods Mol. Biol. Clifton NJ, 1446, 233, 10.1007/978-1-4939-3743-1_17
Wood, 2020, Term Matrix: a novel Gene Ontology annotation quality control system based on ontology term co-annotation patterns, Open Biol., 10, 200149, 10.1098/rsob.200149
Deegan (née Clark), 2010, Formalization of taxon-based constraints to detect inconsistencies in annotation and ontology development, BMC Bioinformatics, 11, 530, 10.1186/1471-2105-11-530
Haendel, 2014, Unification of multi-species vertebrate anatomy ontologies for comparative biology in Uberon, J. Biomed. Semant., 5, 21, 10.1186/2041-1480-5-21
Diehl, 2016, The Cell Ontology 2016: enhanced content, modularization, and ontology interoperability, J. Biomed. Semant., 7, 44, 10.1186/s13326-016-0088-7
Hasnain, 2017, BioFed: federated query processing over life sciences linked open data, J. Biomed. Semant., 8, 13, 10.1186/s13326-017-0118-0
Dillen, 2019, Zenodo, an Archive and Publishing Repository: A tale of two herbarium specimen pilot projects, Biodiversity Information Science and Standards, 3, e37080, 10.3897/biss.3.37080