Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Phân loại chức năng từ chuỗi gen của gấu trúc khổng lồ
Tóm tắt
Gấu trúc khổng lồ là một trong những loài bị đe dọa nghiêm trọng nhất do sự phân mảnh và mất mát môi trường sống. Do đó, việc nghiên cứu chức năng của các protein trong loài động vật này, đặc biệt là các protein có liên quan đến các đặc điểm riêng biệt, là rất cần thiết để bảo vệ loài này. Trong công trình này, chức năng của các protein đã được nghiên cứu bằng cách sử dụng chuỗi gen của gấu trúc khổng lồ. Dữ liệu về 21,001 protein và chức năng của chúng đã được lưu trữ trong Cơ sở dữ liệu Protein Gấu Trúc Khổng Lồ, trong đó các protein được chia thành hai nhóm: nhóm chức năng đã biết gồm 20,179 protein mà chức năng có thể được dự đoán bởi GeneScan, trong khi nhóm chức năng chưa biết gồm 822 protein mà chức năng không thể được dự đoán bởi GeneScan. Đối với nhóm chức năng đã biết, chúng tôi đã phân loại thêm các protein theo chức năng phân tử, quá trình sinh học, thành phần tế bào và tính đặc hiệu mô. Đối với nhóm chức năng chưa biết, chúng tôi đã phát triển một chiến lược trong đó các protein được lọc qua cross-Blast để xác định các protein đặc trưng cho gấu trúc dựa trên giả thuyết rằng có các protein liên quan đến các đặc điểm đặc trưng của gấu trúc tồn tại trong nhóm chức năng chưa biết. Sau quy trình lọc này, chúng tôi đã xác định được 32 protein (trong đó có 2 protein màng) đặc trưng cho chuỗi gen gấu trúc khổng lồ so với chuỗi gen của chó và ngựa. Dựa trên chuỗi axit amin của chúng, 32 protein này đã được phân tích thêm bằng phân loại chức năng sử dụng SVM-Prot, dự đoán motif bằng MyHits, và dự đoán protein tương tác bằng Cơ sở dữ liệu Protein Tương tác. Mười chín protein được dự đoán là protein liên kết kẽm, do đó tác động đến các hoạt động của axit nucleic. 32 protein đặc trưng của gấu trúc sẽ được điều tra thêm bằng phân tích cấu trúc và chức năng.
Từ khóa
#gấu trúc khổng lồ #protein #chuỗi gen #phân loại chức năng #cơ sở dữ liệu protein #protein đặc trưngTài liệu tham khảo
Birney, E., Clamp, M., and Durbin, R. (2004). GeneWise and Genomewise. Genome Res 14, 988–995.
Bocca, S. N., Magioli, C., Mangeon, A., Junqueira, R. M., Cardeal, V., Margis, R., Sachetto-Martins, G. (2005). Survey of glycine-rich proteins (GRPs) in the Eucalyptus expressed sequence tag database (ForEST). Genet Mole Biol 28, 608–624.
Burge, C., and Karlin, S. (1997). Prediction of complete gene structures in human genomic DNA. J Mol Biol 268, 78–94.
Cai, C.Z., Han, L.Y., Ji, Z.L., Chen, X., and Chen, Y.Z. (2003). SVM-Prot: Web-based support vector machine software for functional classification of a protein from its primary sequence. Nucleic Acids Res 31, 3692–3697.
Hao, Y.Z., Hou, W.R., Hou, Y.L., Du, Y.J., Zhang, T., and Peng, Z.S. (2009). cDNA, genomic sequence cloning and overexpression of ribosomal protein S25 gene (RPS25) from the Giant Panda. Mol Biol Rep 36, 2139–2145.
Hama, N., Kanemitsu, H., Tanikawa, M., Shibaya, M., Sakamoto, K., Oyama, Y., Acosta, T.J., Ishikawa, O., Pengyan, W., and Okuda, K. (2009). Development of an enzyme immunoassay for urinary pregnanediol-3-glucuronide in a female giant panda (Ailuropoda melanoleuca). J Vet Med Sci 71, 879–884.
Krause, J., Unger, T., Nocon, A., Malaspinas, A.S., Kolokotronis, S.O., Stiller, M., Soibelzon, L., Spriggs, H., Dear, P.H., Briggs, A.W., et al. (2008). Mitochondrial genomes reveal an explosive radiation of extinct and extant bears near the Miocene-Pliocene boundary. BMC Evol Biol 8, 220.
Krogh, A., Larsson, B., von Heijne, G., and Sonnhammer, E.L. (2001). Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes. J Mol Biol 305, 567–580.
Li, R., Fan, W., Tian, G., Zhu, H., He, L., Cai, J., Huang, Q., Cai, Q., Li, B., Bai, Y., et al. (2010). The sequence and de novo assembly of the giant panda genome. Nature 463, 311–317.
Magrane, M., and Consortium, U. (2011). UniProt Knowledgebase: a hub of integrated protein data. Database (Oxford) 2011, bar009.
Nash, W.G., Wienberg, J., Ferguson-Smith, M.A., Menninger, J.C., and O’Brien, S.J. (1998). Comparative genomics: tracking chromosome evolution in the family ursidae using reciprocal chromosome painting. Cytogenet Cell Genet 83, 182–192.
Pages, M., Calvignac, S., Klein, C., Paris, M., Hughes, S., and Hanni, C. (2008). Combined analysis of fourteen nuclear genes refines the Ursidae phylogeny. Mol Phylogenet Evol 47, 73–83.
Pagni, M., Ioannidis, V., Cerutti, L., Zahn-Zabal, M., Jongeneel, C.V., Hau, J., Martin, O., Kuznetsov, D., and Falquet, L. (2007). MyHits: improvements to an interactive resource for analyzing protein sequences. Nucleic Acids Res 35, W433–437.
She, R., Chu, J.S., Wang, K., Pei, J., and Chen, N. (2009). Gen-BlastA: enabling BLAST to identify homologous gene sequences. Genome Res 19, 143–149.
Stanke, M., and Waack, S. (2003). Gene prediction with a hidden Markov model and a new intron submodel. Bioinformatics 19Suppl 2, ii215–ii225.
Williamson, M.P. (1994). The structure and function of proline-rich regions in proteins. Biochem J 297(Pt 2), 249–260.
Xenarios, I., Salwinski, L., Duan, X.J., Higney, P., Kim, S.M., and Eisenberg, D. (2002). DIP, the database of interacting proteins: a research tool for studying cellular networks of protein interactions. Nucleic Acids Res 30, 303–305.
Zhan, X., Li, M., Zhang, Z., Goossens, B., Chen, Y., Wang, H., Bruford, M.W., and Wei, F. (2006). Molecular censusing doubles giant panda population estimate in a key nature reserve. Curr Biol 16, R451–452.