Thiết lập và ứng dụng nguồn thông tin về chuột đột biến tại Trung tâm Nghiên cứu Tài nguyên Sinh học RIKEN

Springer Science and Business Media LLC - Tập 37 - Trang 1-11 - 2021
Hiroshi Masuya1, Daiki Usuda1, Hatsumi Nakata2, Naomi Yuhara1, Keiko Kurihara1, Yuri Namiki1, Shigeru Iwase1, Toyoyuki Takada1, Nobuhiko Tanaka1, Kenta Suzuki1, Yuki Yamagata3, Norio Kobayashi1,4, Atsushi Yoshiki2, Tatsuya Kushida1
1Integrated Bioresource Information Division, RIKEN BioResource Research Center, Tsukuba-shi, Japan
2Experimental Animal Division, BioResource Research Center, RIKEN, Tsukuba, Japan
3Laboratory for Developmental Dynamics, Center for Biosystems Dynamics Research, RIKEN, Kobe, Japan
4Data Knowledge Organization Unit, Head Office for Information Systems and Cybersecurity, RIKEN, Wako, Japan

Tóm tắt

Các cơ sở dữ liệu trực tuyến đóng vai trò cơ sở hạ tầng quan trọng để tạo điều kiện cho việc sử dụng tài nguyên chuột đột biến trong khoa học đời sống một cách hiệu quả và hiệu suất cao. Số lượng và loại tài nguyên chuột đang phát triển nhanh chóng nhờ sự phát triển của công nghệ chỉnh sửa gen cùng với thông tin liên quan về trình tự gen và kiểu hình. Do đó, công nghệ tích hợp dữ liệu nhằm cải thiện khả năng tìm kiếm, tiếp cận, tương tác và tái sử dụng dữ liệu về các dòng chuột trở nên cần thiết cho các kho lưu trữ dòng chuột. Năm 2020, Trung tâm Nghiên cứu Tài nguyên Sinh học RIKEN đã phát hành một cơ sở dữ liệu tích hợp về tài nguyên sinh học bao gồm các dòng chuột thí nghiệm, Arabidopsis thaliana như một loại thực vật thí nghiệm, dòng tế bào, vi sinh vật và vật liệu di truyền, sử dụng công nghệ liên quan đến Khung Mô tả Tài nguyên. Cơ sở dữ liệu tích hợp này thể hiện nhiều tính năng tiên tiến nhằm phổ biến thông tin tài nguyên sinh học. Phiên bản hiện tại của danh mục trực tuyến về các dòng chuột, hoạt động như một phần của cơ sở dữ liệu tích hợp tài nguyên sinh học, có sẵn từ các thanh tìm kiếm trên trang của Trung tâm (https://brc.riken.jp) và trang web của Phòng Thí nghiệm Động vật Thí nghiệm (https://mus.brc.riken.jp/). Trung tâm Nghiên cứu Tài nguyên Sinh học cũng đã phát hành một cơ sở dữ liệu về sự biến đổi gen của các dòng chuột được thiết lập tại Nhật Bản và Tây Âu, MoG+ (https://molossinus.brc.riken.jp/mogplus/), và một cơ sở dữ liệu cho các mối liên hệ kiểu hình-kiểu hình trong toàn bộ kiểu hình chuột, sử dụng dữ liệu từ Nền tảng Phân loại Kiểu hình Chuột Quốc tế. Trong bài đánh giá này, chúng tôi mô tả các tính năng của phiên bản cơ sở dữ liệu hiện tại liên quan đến tài nguyên dòng chuột tại Trung tâm Nghiên cứu Tài nguyên Sinh học RIKEN và thảo luận về những triển vọng trong tương lai.

Từ khóa

#cơ sở dữ liệu trực tuyến #tài nguyên chuột đột biến #công nghệ chỉnh sửa gen #RIKEN BioResource Research Center #MoG+ #kiểu hình chuột

Tài liệu tham khảo

Eppig JT, Richardson JE, Kadin JA, Ringwald M, Blake JA, Bult CJ. Mouse genome informatics (MGI): reflecting on 25 years. Mamm Genome. 2015;26:272–84. https://doi.org/10.1007/s00335-015-9589-4. Law M, Shaw DR. Mouse genome informatics (MGI) is the international resource for information on the laboratory mouse. Methods Mol Biol. 1757;2018:141–61. https://doi.org/10.1007/978-1-4939-7737-6_7. Maltais LJ, Blake JA, Eppig JT, Davisson MT. Rules and guidelines for mouse gene nomenclature: a condensed version. International committee on standardized genetic nomenclature for mice. Genomics. 1997;45:471–6. Wain HM, Lush M, Ducluzeau F, Povey S. Genew: the human gene nomenclature database. Nucleic Acids Res. 2002;30:169–71. Twigger SN, Shimoyama M, Bromberg S, Kwitek AE, Jacob HJ, RGD team. The rat genome database, update 2007--easing the path from disease to data and back again. Nucleic Acids Res. 2007;35:D658–62. Sayers EW, Barrett T, Benson DA, Bryant SH, Canese K, Chetvernin V, Church DM, DiCuccio M, Edgar R, Federhen S, et al. Database resources of the National Center for biotechnology information. Nucleic Acids Res. 2009;37:D5–15. Hubbard TJ, Aken BL, Ayling S, Ballester B, Beal K, Bragin E, Brent S, Chen Y, Clapham P, Clarke L, et al. Ensembl 2009. Nucleic Acids Res. 2009;37:D690–7. Eppig JT, Motenko H, Richardson JE, Richards-Smith B, Smith CL. The international mouse strain resource (IMSR): cataloging worldwide mouseand ES cell line resources. Mamm Genome. 2015;26:448–55. https://doi.org/10.1007/s00335-015-9600-0. Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Ireland A, Mungall CJ, et al. The OBO foundry: coordinated evolution of ontologies to support biomedical data integration. Nat Biotechnol. 2007;25:1251–5. Ashburner, et al. Gene ontology: tool for the unification of biology. Nat Genet. 2000;25:25–9. Hayamizu TF, Baldock RA, Ringwald M. Mouse anatomy ontologies: enhancements and tools for exploring and integrating biomedical data. Mamm Genome. 2015;26(9–10):422–30. https://doi.org/10.1007/s00335-015-9584-9. Smith CL, Eppig JT. The mammalian phenotype ontology: enabling robust annotation and comparative analysis. Wiley Interdiscip Rev Syst Biol Med. 2009;1:390–9. https://doi.org/10.1002/wsbm.44. Mallon A-M, Iyer V, Melvin D, Morgan H, Parkinson H, Brown SDM, Flicek P, William C. Skarnes. Accessing data from the International Mouse Phenotyping Consortium: state of the art and future plans. Mamm Genome. 2012;23:641–52. https://doi.org/10.1007/s00335-012-9428-9. Robinson PN, Mundlos S. The human phenotype ontology. Clin Genet. 2010;77(6):525–34. https://doi.org/10.1111/j.1399-0004.2010.01436.x Epub 2010 Feb 11. PMID: 20412080 Review. Washington NL, Haendel MA, Mungall CJ, Ashburner M, Westerfield M, Lewis SE. Linking human diseases to animal models using ontology-based phenotype annotation. PLoS Biol. 2009;7:e1000247. https://doi.org/10.1371/journal.pbio.1000247. Hoehndorf R, Schofield PN, Gkoutos GV. PhenomeNET: a whole-phenome approach to disease gene discovery. Nucleic Acids Res. 2011;39:e119. https://doi.org/10.1093/nar/gkr538. Mungall CJ, Torniai C, Gkoutos GV, Lewis SE, Haendel MA. Uberon, an integrative multi-species anatomy ontology. Genome Biol. 2012;13:R5. https://doi.org/10.1186/gb-2012-13-1-r5. Köhler S, Doelken SC, Ruef BJ, Bauer S, Washington N, Westerfield M, Gkoutos G, Schofield P, Smedley D, Lewis SE, Robinson PN, Mungall CJ. Construction and accessibility of a cross-species phenotype ontology along with gene annotations for biomedical research. F1000Res. 2013;2:30. https://doi.org/10.12688/f1000research.2-30.v2. Smedley D, Oellrich A, Köhler S. Ruef B; sanger mouse genetics project, Westerfield M, Robinson P, Lewis S, Mungall C. PhenoDigm: analyzing curated annotations to associate animal models with human diseases. Database (Oxford). https://doi.org/10.1093/database/bat025. Bandrowski A, Brush M, Grethe JS, Haendel MA, Kennedy DN, Hill S, Hof PR, Martone ME, Pols M, Tan SS, Washington N, Zudilova-Seinstra E. Vasilevsky N; RINL resource identification initiative. The resource identification initiative: A cultural shift in publishing. Neuroinformatics. 2016;14:169–82. https://doi.org/10.1007/s12021-015-9284-3. Berners-Lee T, Hendler J, Lassila O. The Semantic Web. Sci Am. 2001;284:34–43. World Wide Web Consortium. Resource Description Framework (RDF) Model and Syntax Specification W3C Proposed Recommendation 05 January 1999. 1999. https://www.w3.org/TR/PR-rdf-syntax/Overview.html Accessed 29 May 2020. Wilkinson MD, Dumontier M, Aalbersberg IJ, Appleton G, Axton M, Baak A, Blomberg N, Boiten JW, da Silva Santos LB, Bourne PE, Bouwman J, Brookes AJ, Clark T, Crosas M, Dillo I, Dumon O, Edmunds S, Evelo CT, Finkers R, Gonzalez-Beltran A, Gray AJ, Groth P, Goble C, Grethe JS, Heringa J, 't Hoen PA, Hooft R, Kuhn T, Kok R, Kok J, Lusher SJ, Martone ME, Mons A, Packer AL, Persson B, Rocca-Serra P, Roos M, van Schaik R, Sansone SA, Schultes E, Sengstag T, Slater T, Strawn G, Swertz MA, Thompson M, van der Lei J, van Mulligen E, Velterop J, Waagmeester A, Wittenburg P, Wolstencroft K, Zhao J, Mons B. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 2016; 15;3:160018. doi: https://doi.org/10.1038/sdata.2016.18. Yoshiki A, Ike F, Mekada K, Kitaura Y, Nakata H, Hiraiwa N, Mochida K, Ijuin M, Kadota M, Murakami A, Ogura A, Abe K, Moriwaki K, Obata Y. The mouse resources at the RIKEN BioResource center. Exp Anim. 2009;58:85–96. Masuya H, Makita Y, Kobayashi N, Nishikata K, Yoshida Y, Mochizuki Y, Doi K, Takatsuki T, Waki K, Tanaka N, Ishii M, Matsushima A, Takahashi S, Hijikata A, Kozaki K, Furuichi T, Kawaji H, Wakana S, Nakamura Y, Yoshiki A, Murata T, Fukami-Kobayashi K, Mohan S, Ohara O, Hayashizaki Y, Mizoguchi R, Obata Y, Toyoda T. The RIKEN integrated database of mammals. Nuc leic Acids Res. 2011;39:D861–70. https://doi.org/10.1093/nar/gkq1078. Kobayashi N, Kume S, Lenz K, Masuya H. RIKEN MetaDatabase: A Database Platform for Health Care and Life Sciences as a Microcosm of Linked Open Data Cloud. Int J Semant Web Inf Syst. 2018;14:140–64. Jupp S, Malone J, Bolleman J, Brandizi M, Davies M, Garcia L, Gaulton A, Gehant S, Laibe C, Redaschi N, Wimalaratne SM, Martin M, Le Novère N, Parkinson H, Birney E, Jenkinson AM. The EBI RDF platform: linked open data for the life sciences. Bioinformatics. 2014;30:1338–9. https://doi.org/10.1093/bioinformatics/btt765 Epub 2014 Jan 11. Piñero J, Ramírez-Anguita JM, Saüch-Pitarch J, Ronzano F, Centeno E, Sanz F, Furlong LI. The DisGeNET knowledge platform for disease genomics: 2019 update. Nucleic Acids Res. 2020;48(D1):D845–55. https://doi.org/10.1093/nar/gkz1021 PMID: 31680165. Saul MC, Philip VM, Reinholdt LG, Center for Systems Neurogenetics of addiction, Chesler EJ. High-diversity mouse populations for complex traits. Trends Genet. 2019;35:501–14. https://doi.org/10.1016/j.tig.2019.04.003 Epub 2019 May 24. Takada T, Ebata T, Noguchi H, Keane TM, Adams DJ, Narita T, Shin-I T, Fujisawa H, Toyoda A, Abe K, Obata Y, Sakaki Y, Moriwaki K, Fujiyama A, Kohara Y, Shiroishi T. The ancestor of extant Japanese fancy mice contributed to the mosaic genomes of classical inbred strains. Genome Res. 2013;23(8):1329–38. https://doi.org/10.1101/gr.156497.113 Epub 2013 Apr 19. Takada T, Yoshiki A, Obata Y, Yamazaki Y, Shiroishi T. NIG_MoG: a mouse genome navigator for exploring intersubspecific genetic polymorphisms. Mamm Genome. 2015;26(7–8):331–7. https://doi.org/10.1007/s00335-015-9569-8. Brown SDM, Holmes CC, Mallon AM, Meehan TF, Smedley D, Wells S. High-throughput mouse phenomics for characterizing mammalian gene function. Nat Rev Genet. 2018;19:357–70. https://doi.org/10.1038/s41576-018-0005-2. Wakana S, Suzuki T, Furuse T, Kobayashi K, Miura I, Kaneda H, Yamada I, Motegi H, Toki H, Inoue M, Minowa O, Noda T, Waki K, Tanaka N, Masuya H, Obata Y. Introduction to the Japan mouse clinic at the RIKEN BioResource center. Exp Anim. 2009;58:443–50. https://doi.org/10.1538/expanim.58.443. Mandillo S, Tucci V, Hölter SM, Meziane H, Banchaabouchi MA, Kallnik M, Lad HV, Nolan PM, Ouagazzal AM, Coghill EL, Gale K, Golini E, Jacquot S, Krezel W, Parker A, Riet F, Schneider I, Marazziti D, Auwerx J, Brown SD, Chambon P, Rosenthal N, Tocchini-Valentini G, Wurst W. Reliability, robustness, and reproducibility in mouse behavioral phenotyping: a cross-laboratory study. Physiol Genomics. 2008;34:243–55. https://doi.org/10.1152/physiolgenomics.90207. Karp NA, Speak AO, White JK, et al. Impact of temporal variation on design and analysis of mouse knockout phenotyping studies. PLoS One. 2014;9:e111239. https://doi.org/10.1371/journal.pone.0111239. Tanaka N, Masuya H., Mouse phenome as a biological resource., Impact. 2018; 12: 93–95. DOI: https://doi.org/10.21820/23987073.2018.12.93. Tanaka N, Masuya H. An atlas of evidence-based phenotypic associations across the mouse phenome. Sci Rep. 2020;10:3957 https://www.nature.com/articles/s41598-020-60891-w. Japan Science and Technology Agency, JST releases 'TogoVar', an integrated database for Japanese genome variants/variations, EurekAlert Public Release. 2018; 10-JUL-2018 (https://www.eurekalert.org/pub_releases/2018-07/jsat-jr071018.php). Altenhoff AM, Glover NM, Train CM, et al. The OMA orthology database in 2018: retrieving evolutionary relationships among all domains of life through richer web and programmatic interfaces. Nucleic Acids Res. 2018;46(D1):D477–85. https://doi.org/10.1093/nar/gkx1019. Suzuki K, Nagaoka S, Fukuda S and Masuya H, Energy landscape analysis of ecological communities elucidates the phase space of community assembly dynamics. Ecological Monographs 2020; in review. Ohta T, Tanjo T, Ogasawara O. Accumulating computational resource usage of genomic data analysis workflow to optimize cloud computing instance selection. Gigascience. 2019;8:giz052. https://doi.org/10.1093/gigascience/giz052.