首页 > 范文大全 > 正文

基于云中心的集中式目录P2P模型研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于云中心的集中式目录P2P模型研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:随着集中式对等网络(P2P)模型软件在网络中的广泛应用,涉及到P2P的一些弊端也逐步显露出来,特别是对宽带的要求、数据的处理能力以及文件的版权费用产生纠纷等问题。为了解决以上问题,该文提出了基于云计算服务的集中式P2P模型。该模型以云为中心,采取分级的超级结点管理机制,各级之间使用令牌进行信息传递。系统结构分层使得每个结点不会因为某一时刻的大量结点同时访问而导致网络瘫痪。与此同时,新型结点加入策略的采用使得某些超级结点不会因挂载较多结点导致网络堵塞。

关键词:云中心;P2P;集中式P2P

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)27-6054-05

集中式对等网络(Peer-to-Peer Network, P2P)模型的核心部件是中心服务器,它主要用于网络资源的索引信息和结点的基本信息存储[9]。该模型通过对位于中心服务器的存储资源的索引信息进行搜索,进而得到数据资源存放的具置(中心服务器本身并不存储具体的数据资源)。第一代MP3共享软件Napster和我们常使用的eMule都是集中式P2P模型结构的典型应用。传统的集中式目录P2P的优点主要有数据资源索引维护简单、查询效率高、算法灵活且易于实现复杂查询。

但是集中式对等网络模型的缺点也不容忽视,主要表现为以下几个方面:因为采用中央服务器管理各节点首先,该模型对索引服务器的处理能力和带宽的要求很高,其次,该模型对索引服务器的安全性要求比较高,易遭受DoS等攻击而瘫痪,容易造成单点故障[5]。第三,随着网络规模的不断扩大,网络中的数据会不断增加,与之相对应的冗余备份也会产生,导致维护成本将会变高[6]。最后,索引服务器容易引起版权纠纷,比如说Napster技术使得未经授权传输音乐作品的行为[7]。

云计算(Cloud Computing)一词用来同时描述一个系统平台或者一种类型的应用程序[8],其正成为学术与工业界研究的热点。云存储是在云计算技术基础上延伸和发展出来的一个新兴技术,它通过使用集群应用、网格技术或分布式文件系统等功能,将网络中大量的、不同类型的存储设备以应用软件形式集合起来协同工作,进而形成一个共同对外提供数据存储和业务访问功能的系统[8]。云存储系统的实质就是将大量数据的存储管理作为云计算系统核心的模型。云存储模型安全性高、带宽处理能力强、扩展性好、方便知识产权的保护等优点。

综合集中式P2P模型和云存储模型的优缺点,该文提出基于云中心存储的集中式目录P2P模型。基于云中心的集中式P2P模型以云中心服务为核心,采取分层结构模型,综合了集中式P2P模型资源索引快捷和云应用的中心数据处理能力强的有点,并采取分层结构能够降低大量结点同时访问带来的访问拥塞的问题。

1 基于云中心的集中式P2P模型概述

图1给出了本文提出的基于云中心的集中式P2P模型。在该图中,端结点是指在整个系统中处于最末端的结点,即用户结点,其特点是加入和离开的不确定性,如图1中的结点E和G。需求端结点是指向云中心发出需求请求的端接点,如图中的结点E、G。资源端结点是指可以为需求端接点提供资源的端接点,如图中的结点E、G。超级结点主要用于扩充整个系统,如图中的结点A、B、C、D、F。端超级结点指的是其子结点是端结点的超级结点,如图中的结点C和F。一级超级结点是直接与云中心相连的超级结点,如图中的结点A和B。二级超级结点是指父结点是一级超级结点的超级结点。三级超级结点等类推,如图中的结点C、D、F都是二级超级结点。亲密值用于表示结点之间关系的数值,同属于一个超级结点的两个子结点的亲密值为1,两个结点父结点的父结点是同一个超级结点的子结点的亲密值为2,以此类推。不是同系结点群结点物理直接相连的亲密度值为1, 如图1中AB和DF亲密值都为1,CD亲密值为1,CF亲密度为2,EG亲密值为3。同系结点群是指从需求结点到需求结点所在的一级超级结点路径中所经过的所有结点的集合,如图1中ACE和BFG是两个同系结点群。

如图2所示,本模型工分三个层次。其中,第一层为云中心,其功能为用于存储全部用户信息和部分资源信息,并用于提供相对应的云应用服务。位于第二层的为各级超级结点,用于存储部分用户信息和部分数据资源。如果网络规模庞大,可以划分成,一级超级结点、二级超级结点、三级超级结点等。位于第三层的为端结点,是提供给用户的接口,分为需求端接点和资源端结点。

系统工作过程:

2 资源查找的过程

1)当某个需求端点搜索资源时,向端超级结点发出请求,端超级结点递归到云中心,云中心找到对于该结点传输质量较高(判断传输质量的算法补在后面)的资源结点信息或者是包含此资源的超级结点的信息。

2)云中心将所有包含此资源的资源结点信息发送到对应的端超级结点上,将包含此资源的超级结点信息发送到对应父超级结点上。

3)以资源结点为例(含有该资源的超级结点类似),

当端超级结点得到资源结点信息后,使用Pastry路由算法查找到该资源结点所对应的的端超级结点,得到对应资源结点信息,然后将信息全部给其父超级结点,该父超级结点将信息通过同系结点群上传给云中心,云中心汇总全部资源的信息,选择出传输质量较高的足够数目的资源结点信息给需求端接点,开始文件传输。

4 结点策略

当前流行的P2P路由算法(以CAN、Chord、Pastry和Tapestry为代表)为P2P网络结点之间提供了一种规模可扩充、错误自愈合的互连机制。它们的共同特征是采用了一种分布式哈希表(DHT)的映射机制,各结点和共享资源的关键词均映射到同一个命名空间。在所映射的空间中,共享资源存储在离其映射序列最近的结点上。路由算法就是通过各种不同的探测方法,在映射空间中逐步逼近资源所存储的结点,最终获取所需的资源。以Pastry算法为例,每个网络结点都拥有一个全局惟一的由DHT映射的nodeld,而网络中的资源由相同的机制映射成惟一的key值,两者处于统一命名空间。路由过程中,Pastry把所要求的查询请求路由到与其键值最为接近的结点上。这其中的优点是:分布式,便于结点的加入和离开,适用于P2P在实际中的使用情况。[9][10]缺点是:只依靠nodeId匹配对于实际中的地域、网络情况、资源的优劣等没有进行演算,会造成实际的路由效果偏差。使用云中心后结点的加入和离开由云中心直接参与调度可以避免上述的缺点。

4.1加入策略

端结点发出的请求加入信息直接送达到云中心,云中心将通过分析地域位置和网络状况通过DHT的映射给该结点一个全局惟一的nodeld,确定该节点属于的超级结点的位置。

当一个端结点请求加入时,递归向上层的超级结点汇报自身信息,直到云存储应用中心。每层的超级结点直接传递信息使用令牌传递——以一级超级节点为例,每个超级结点都有一个表示为自己信息的令牌,令牌中附件每次要更新的端结点信息,当有信息要更新的时候,该超级结点的令牌就按圆的逆时针或者顺时针的顺序依次将令牌中的信息传递给其他的同级的超级结点。当令牌回到该超级节点的时候,表示同级的超级结点已经全部通知完毕。这样的好处是,当若干个该层的超级结点都要更新时,可以同步更新,一个令牌可以设定更新n秒之内的全部结点信息,这样一个令牌也可以更新多个信息。当某个结点发出的令牌在规定的时间内没有返回的时候,认定网络出现故障,该结点试图重新发出信息,来保证更新数据的成功。

某一级的超级结点加入的时候,试该超级结点为底层节点,加入方法不变

4.2 离开策略

1)当端结点试图正常离开,递归向上级发送离开请求,各级之间采用令牌传送离开信息(这里不采用删除信息的方法,而是接收到离开请求的时候将结点的在线状态标记为0,下次该结点进入时载标记回1,这样可以加快请求发送的速度)——可能会产生几秒的下线等待时间

2)当结点突然离开时(或者网络延迟突然一段时间过高),若恰有搜索找寻该节点或者搜索结果返回,接受结果延迟过高上一级超级结点发出该节点离开信息,类似正常离开的时候

3)某一级的超级结点正常离开的时候,向上通知的策略不变,由云中心将该超级节点所连接的子超级结点和端结点更换至权值较高的其他该机超级结点

4)某一级的超级结点非正常离开的时候,该级超级节点的下一级超级结点向云中心发送请求更换该层超结点

5 路由策略

当需求端结点向云中心发出搜索请求后,云中心先进行资源的搜索,然后按照资源从在同系结点群,在限定的亲密度值内和在全局的优先级来进行路径信息的通知和相应资源的下载。

6 结束语

本文介绍了基于云中心的集中式目录模型结构,阐述了其中相应的资源质量判断、资源搜索、结点的加入和离开策略以及路由选择的方式,该模型不仅保留了集中式目录结构的优点,其中使用云作为管理中心可以方便的做到用户验证来实现版权的费用的纠纷,而其中的分层搜索和传输机制对于使得网络更加健壮,多级超结点能够应付大量数据的处理而不会出现网络瘫痪。未来的工作将是逐步实现该网络模型,并在具体的实验中通过数据验证该模型的实际处理能力。

参考文献:

[1] Hassana M,McClatehey R,willers I.A scalable evidence based self-managing framework for trust management.Electronic Notes in Theoretical Computer Science(Elsevier),2007.

[2] Figueiredo D R,Shapiro J K,Towsley D.A public good model of availability in peer-to-peer systems,Technical Report 04-27. CSE Dept,Michigan State University,2004.

[3] Standard Performance Evaluation Corporation.SPECpower_ssj2008Benchmark[EB/OL].http:///power_ssj2008/

[4] HVLick A ,Sohan R Rice A et .An Analysis of Hard Drive Energy Consumption[C]//Proc·of IEEE InternationalSymposium on Modeling,Analysis and Simulation of Computer and Telecommunication Systems.Baltimore,USA[s.n],2008.

[5] 王嵩,凌青,吴刚,郑烩.多级p2p架构VOD系统中分布式节点的设计与实现[J].小型微型计算机系统,2011(4).

[6] 陈贵海,吴帆,李宏兴,等.基于DHT的P2P系统中高可用数据冗余机制[J].计算机学报,2008(10).

[7] 刘家瑞.NAPsTER案与文件共享技术的版权责任[J].科技与法律,2004(4).

[8] 陈康 郑纬民 云计算:系统实例与研究现状[J].软件学报,2009(5).

[9] 梁礼斌,张军,罗喜伶. 一种基于位置信息的P2P路由算法[J].计算机工程与设计,2005(9).

[10] 王晓斌,卢显良,侯孟书,周旭.基于邻近度的P2P路由算法[J].计算机科学,2008,35.

[11] 陈康,郑纬民.云计算:系统实例与研究现状[J].软件学报,2009(5).