PSON: Hệ thống chia sẻ tệp P2P có khả năng mở rộng với hỗ trợ truy vấn phức tạp hiệu quả

Yan Li1, Jyoti Ahuja2, Li Lao3, Jun-Hong Cui1, Shigang Chen4
1Computer Science & Engineering, University of Connecticut, Storrs, USA
2Yahoo Software Development India PVt Ltd, Bangalore, India
3Google Santa Monica, Santa Monica, USA
4Department of CISE, University of Florida, Gainesville, USA

Tóm tắt

Một hệ thống chia sẻ tệp P2P mong muốn được kỳ vọng đạt được ba mục tiêu thiết kế sau: khả năng mở rộng, hiệu quả định tuyến và hỗ trợ truy vấn phức tạp. Trong bài báo này, chúng tôi đề xuất một hệ thống chia sẻ tệp P2P mạnh mẽ, mang tên PSON, có thể đáp ứng tất cả ba thuộc tính mong muốn. PSON về bản chất là một mạng chồng ngữ nghĩa của các nút logic. Mỗi nút logic đại diện cho một cụm người dùng ngang hàng gần gũi với nhau. Một người dùng mạnh mẽ được chọn trong mỗi cụm để hỗ trợ định tuyến truy vấn trên mạng chồng, trong khi các người dùng ít mạnh hơn chịu trách nhiệm duy trì các nội dung được chia sẻ. Để tạo điều kiện thuận lợi cho việc định tuyến truy vấn, các siêu nút được tổ chức theo dạng cây tìm kiếm nhị phân cân bằng. Bằng cách khai thác khái niệm ngữ nghĩa, PSON có thể hỗ trợ các truy vấn phức tạp một cách mở rộng và hiệu quả. Trong bài báo này, chúng tôi trình bày thiết kế hệ thống cơ bản như cấu trúc chồng ngữ nghĩa, định tuyến truy vấn và động học hệ thống. Một sơ đồ cân bằng tải được đề xuất để cải thiện thêm hiệu suất hệ thống. Qua các thí nghiệm mô phỏng, chúng tôi cho thấy rằng PSON có khả năng mở rộng, hiệu quả và có khả năng hỗ trợ các truy vấn phức tạp.

Từ khóa

#P2P #chia sẻ tệp #hệ thống mở rộng #hỗ trợ truy vấn phức tạp #mạng chồng ngữ nghĩa #cây tìm kiếm nhị phân #cân bằng tải.

Tài liệu tham khảo

Aberer K, Cudré-Mauroux P, Hauswirth M, Pelt TV (2004) Gridvine: building internet-scale semantic overlay networks. In: International semantic web conference, pp 107–121 Barabasi A-L, Albert R (1999) Emergence of scaling in random networks. Science 286:509–512 Bharambe AR, Agrawal M, Seshan S (2004) Mercury: supporting scalable multi-attribute range queries. ACM SIGCOMM Comput Commun Rev 34(4):353–366 Chen Y, Xu Z, Zhai C (2005) A scalable semantic indexing framework for peer-to-peer information retrieval. In: SIGIR 2005 workshop: heterogeneous and distributed information retrieval Cohen E, Fiat A, Kaplan H (2003) Associative search in peer-to-peer networks: harnessing latent semantics. IEEE INFOCOM 2:1261–1271 Crespo A, Garcia-Molina H (2004) Semantic overlay networks for P2P systems. In: International workshop on agents and Peer-to-Peer computing (AP2PC’04), pp 1–13 Doulkeridis C, Norvag K, Vazirgiannis M (2007) Desent: decentralized and distributed semantic overlay generation in P2P networks. IEEE J Sel Areas Commun 25(1):25–34 Huang Y, Fu TZ, Chiu D-M, Lui JC, Huang C (2008) Challenges, design and analysis of a large-scale P2P-VOD system. SIGCOMM Comput Commun Rev 38(4):375–388 Li M, Lee W-C, Sivasubramaniam A (2004) Semantic small world: an overlay network for Peer-to-Peer search. In: ICNP, pp 228–238 Li Y, Lao L, Cui J-H (2006) SDC: a distributed clustering protocol for Peer-to-Peer networks. In: The fifth IFIP networking conference, vol 3976, pp 1234–1239 Mockapetris PV (1987) Domain names—concepts and facilities. Request for Comments 1034. Internet Engineering Task Force Mockapetris PV (1987) Domain names—implementation and specification. Request for Comments 1035. Internet Engineering Task Force Qiu D, Srikant R (2004) Modeling and performance analysis of bittorrent-like Peer-to-Peer networks. SIGCOMM Comput Commun Rev 34(4):367–378 Ramaswamy L, Gedik B, Liu L (2005) A distributed approach to node clustering in decentralized Peer-to-Peer networks. IEEE Trans Parallel Distrib Syst 16(9):814–829 Ratnasamy S, Francis P, Handley M, Karp R, Schenker S (2001) A scalable content-addressable network. In: ACM SIGCOMM, pp 161–172 Ratnasamy S, Handley M, Karp RM, Shenker S (2002) Topologically-aware overlay construction and server selection. In: INFOCOM Rowstron A, Druschel P (2001) Pastry: scalable, decentralized object location, and routing for large-scale Peer-to-Peer systems. Lect Notes Comput Sci 2218:329–350 Sahin OD, Gulbeden A, Emekci F, Agrawal D, Abbadi AE (2005) Prism: indexing multi-dimensional data in P2P networks using reference vectors. In: MULTIMEDIA ’05: proceedings of the 13th annual ACM international conference on multimedia. ACM, New York, pp 946–955 Silaghi B, Bhattacharjee B, Keleher P (2002) Query routing in the terradir distributed directory. In: SPIE ITCOM, vol 4868, pp 299–309 Silaghi B, Gopalakrishnan V, Bhattacharjee B, Keleher P (2004) Hierarchical routing with soft-state replicas in terradir. In: The 18th international parallel and distributed processing symposium Sripanidkulcha K, Maggs B, Zhang H (2003) Efficient content location using interest-based locality in Peer-to-Peer systems. IEEE INFOCOM 3:2166–2176 Stoica I, Morris R, Karger D, Kaashoek MF, Balakrishnan H (2001) Chord: a scalable peer-to-peer lookup service for internet applications. In: ACM SIGCOMM, pp 149–160 Tang C, Xu Z, Dwarkadas S (2003) Peer-to-Peer information retrieval using self-organizing semantic overlay networks. In: ACM SIGCOMM, pp 175–186 Terpstra WW, Kangasharju J, Leng C, Buchmann AP (2007) Bubblestorm: resilient, probabilistic, and exhaustive Peer-to-Peer search. SIGCOMM Comput Commun Rev 37(4):49–60 Waldvogel M, Rinaldi R (2003) Efficient topology-aware overlay network. SIGCOMM Comput Commun Rev 33(1):101–106 Waxman BM (1988) Routing of multipoint connections. IEEE J Sel Areas Commun 6:1617–1622 Zegura EW, Calvert KL, Bhattacharjee S (1996) How to model an internetwork. IEEE INFOCOM 2:594–602 Zhang R, Hu YC (2005) Assisted Peer-to-Peer search with partial indexing. IEEE INFOCOM 3:1514–1525 Zhao BY, Kubiatowicz JD, Joseph AD (2001) Tapestry: an infrastructure for fault-tolerant wide-area location and routing. UC Berkeley, Tech. Rep. UCB/CSD-01-1141