Khám Phá Tính Đều Đặn Cấu Trúc Trong Mạng Đa Chiều Qua Suy Diễn Bayesian

Neural Computing and Applications - Tập 29 - Trang 413-424 - 2017
Yi Chen1, Xiaolong Wang1,2, Buzhou Tang1
1Department of Computer Science and Technology, Shenzhen Graduate School, Harbin Institute of Technology, Shenzhen, China
2School of Computer Science and Technology, Harbin Institute of Technology, Harbin, China

Tóm tắt

Mạng đa chiều, mạng có nhiều loại quan hệ khác nhau, tồn tại rộng rãi trong nhiều lĩnh vực trong thế giới thực, như xã hội học, hóa học, sinh học và kinh tế. Một nhiệm vụ cơ bản của phân tích mạng là khám phá cấu trúc mạng, bao gồm cấu trúc assortative (tức là, cấu trúc cộng đồng), cấu trúc disassortative (ví dụ, cấu trúc hai phần) và cấu trúc hỗn hợp, đó là tìm ra những quy luật cấu trúc trong các mạng. Có hai khía cạnh của việc khám phá quy luật cấu trúc: (1) phân bổ nhóm—cách phân bổ các nút trong mạng vào các nhóm khác nhau, và (2) số nhóm—số lượng nhóm trong mạng. Hầu hết các phương pháp khám phá quy luật cấu trúc hiện có cho mạng đa chiều cần giả định trước loại cấu trúc (ví dụ, cấu trúc cộng đồng) và cung cấp số lượng nhóm của mạng, trong đó loại cấu trúc là hướng dẫn cho việc phân bổ nhóm. Tuy nhiên, loại cấu trúc và số lượng nhóm thường không có sẵn trước. Để khám phá tốt các quy luật cấu trúc trong mạng đa chiều mà không cần giả định trước loại cấu trúc của chúng, chúng tôi đề xuất một phương pháp tổng hợp đặc điểm mới dựa trên mô hình hỗn hợp và lý thuyết Bayesian, được gọi là mô hình hỗn hợp Bayesian đa chiều (MBM). Để xác định tự động số lượng nhóm của các mạng đa chiều, chúng tôi tiếp tục mở rộng mô hình MBM bằng cách sử dụng lý thuyết không tham số Bayesian thành một mô hình mới, được gọi là mô hình hỗn hợp không tham số Bayesian đa chiều (MBNPM). Các thí nghiệm được thực hiện trên một số mạng đa chiều tổng hợp và thực tế cho thấy mô hình MBM vượt trội hơn các mô hình liên quan khác trên hầu hết các mạng và mô hình MBNPM có khả năng so sánh với mô hình MBM.

Từ khóa


Tài liệu tham khảo

de Franciscis S, Caravagna G, d’Onofrio A (2016) Gene switching rate determines response to extrinsic perturbations in a transcriptional network motif. Sci Rep 6:26980. doi:10.1038/srep26980 Newman M, Clauset A (2015) Structure and inference in annotated networks. Nat Commun 7:11863. doi:10.1038/ncomms11863 Coyte KZ, Schluter J, Foster KR (2015) The ecology of the microbiome: networks, competition, and stability. Science 350(6261):663–666. doi:10.1126/science.aad2602 Neftci E et al (2013) Synthesizing cognition in neuromorphic electronic systems. Proc Natl Acad Sci 110(37):E3468–E3476. doi:10.1073/pnas.1212083110 Newman ME, Leicht EA (2007) Mixture models and exploratory analysis in networks. Proc Natl Acad Sci 104(23):9564–9569. doi:10.1073/pnas.0610537104 Chai B-F et al (2013) Combining a popularity-productivity stochastic block model with a discriminative-content model for general structure detection. Phys Rev E 88(1):012807. doi:10.1103/PhysRevE.88.012807 Zhu G, Li K (2014) A unified model for community detection of multiplex networks. In: International conference on web information systems engineering. Springer. doi:10.1007/978-3-319-11749-2_3 Tang L, Liu H (2009) Uncovering cross-dimension group structures in multi-dimensional networks. In: SDM workshop on analysis of dynamic networks. Sparks, NV Boden B et al (2013) RMiCS: a robust approach for mining coherent subgraphs in edge-labeled multi-layer graphs. In: Proceedings of the 25th international conference on scientific and statistical database management. ACM. doi:10.1007/s10618-012-0272-z Mucha PJ et al (2010) Community structure in time-dependent, multiscale, and multiplex networks. Science 328(5980):876–878. doi:10.1126/science.1184819 DuBois C, Smyth P (2010) Modeling relational events via latent classes. In: Proceedings of the 16th ACM SIGKDD international conference on knowledge discovery and data mining. ACM. doi:10.1145/1835804.1835906 Sinkkonen J et al (2008) A simple infinite topic mixture for rich graphs and relational data. In: Proceedings of the NIPS workshop on analyzing graphs: theory and applications. Citeseer Xu Z, Kersting K, Tresp V (2009) Multi-relational learning with Gaussian processes. In: IJCAI. doi:10.1145/1390334.1390380 Gershman SJ, Blei DM (2012) A tutorial on Bayesian nonparametric models. J Math Psychol 56(1):1–12. doi:10.1016/j.jmp.2011.08.004 Battiston F, Nicosia V, Latora V (2014) Structural measures for multiplex networks. Phys Rev E 89(3):032804. doi:10.1103/PhysRevE.89.032804 Tang L, Wang X, Liu H (2010) Community detection in multi-dimensional networks. Computer Science and Engineering, Arizona State University, Tempe Berlingerio M, Pinelli F, Calabrese F (2013) Abacus: frequent pattern mining-based community discovery in multidimensional networks. Data Min Knowl Disc 27(3):294–320. doi:10.1007/s10618-013-0331-0 Wu Z et al (2013) Community detection in multi-relational social networks. In: International conference on web information systems engineering. Springer. doi:10.1007/978-3-642-41154-0_4 Carchiolo V et al (2011) Communities unfolding in multislice networks. In: Complex networks. Springer, pp 187–195. doi:10.1007/978-3-642-25501-4_19 Shen H-W, Cheng X-Q, Guo J-F (2011) Exploring the structural regularities in networks. Phys Rev E 84(5):056111. doi:10.1103/PhysRevE.84.056111 Chen Y et al (2014) Overlapping community detection in networks with positive and negative links. J Stat Mech Theory Exp 2014(3):P03021. doi:10.1088/1742-5468/2014/03/P03021 Khoshneshin M, Street N (2013) A graphical model for multi-relational social network analysis. Relation 4(K3):K4 Kemp C et al (2006) Learning systems of concepts with an infinite relational model. In: AAAI. doi:10.1145/1102351.1102407 Dempster AP, Laird NM, Rubin DB (1977) Maximum likelihood from incomplete data via the EM algorithm. J R Stat Soc Ser B (Methodological) 1–38 Palla K, Knowles DA, Ghahramani Z (2012) An infinite latent attribute model for network data. In: International conference on machine learning Andrieu C et al (2003) An introduction to MCMC for machine learning. Mach Learn 50(1–2):5–43. doi:10.1023/A:1020281327116 Neal RM (2003) Slice sampling. Ann Stat. doi:10.1214/aos/1056562461 Rodriguez A, Laio A (2014) Clustering by fast search and find of density peaks. Science 344(6191):1492–1496. doi:10.1126/science.1242072 Ana L, Jain AK (2003) Robust data clustering. In: Proceedings of 2003 IEEE computer society conference on computer vision and pattern recognition, 2003. IEEE. doi:10.1109/CVPR.2003.1211462 Coleman J, Katz E, Menzel H (1957) The diffusion of an innovation among physicians. Sociometry 20(4):253–270. doi:10.2307/2785979 Nooy W (2006) Interlock formation an actor-oriented approach. In: Politics and interlocking directorates conference. MIT Press Snijders TA et al (2006) New specifications for exponential random graph models. Sociol Methodol 36(1):99–153. doi:10.1111/j.1467-9531.2006.00176.x Handcock MS et al (2003) statnet: an R package for the statistical modeling of social networks. http://www.csde.washington.edu/statnet Ulanowicz RE, DeAngelis DL (2005) Network analysis of trophic dynamics in South Florida ecosystems. US Geological Survey Program on the South Florida Ecosystem, vol 114 Jacob Y, Denoyer L, Gallinari P (2011) Classification and annotation in social corpora using multiple relations. In: Proceedings of the 20th ACM international conference on information and knowledge management. ACM. doi:10.1016/j.ins.2009.01.007