首页 > 文章中心 > 交集与并集

交集与并集

开篇:润墨网以专业的文秘视角,为您筛选了八篇交集与并集范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

交集与并集范文第1篇

关键词:简单多边形; 多边形交并差; 孔洞

中图分类号:TP391.41文献标志码:A

0 引 言

两个任意简单多边形的求交问题是计算机图形学以及计算几何的基本问题.简单多边形是指多边形的边与边只在顶点处相交且边界封闭,多边形内部可以包含孔洞.由于求含有孔洞多边形交集需要进行不带孔洞多边形的交、并、差运算,所以先要设计合理的简单多边形交并差算法,国内外有很多相关文献:RIVERO等[1]和朱雅音等[2]的算法过于复杂且最坏情况下复杂度较高;樊建华等[3]的算法不能处理任意简单的多边形;周培德等[4]的算法比较可行,复杂度为O(n2log n).本文提出1种新的简单可行的任意简单多边形交、并、差算法,复杂度略好于周培德等的算法;并在此基础上又提出1种带孔洞多边形的求交算法;对所有算法均给予实现,从效果看,算法可行、性能良好.

1 简单多边形的交集、并集和差集

为便于叙述,作如下约定:

设有两多边形P={p0,p1,…,pm-1},Q={q0,q1,…,qn-1},顶点按逆时针有序,m和n分别表示多边形的边数.用pe表示P多边形的一条边,qe表示Q多边形的一条边.

1.1 简单多边形

通常将满足下面条件的多边形称为简单多多边形边形:

(1)边和边只在顶点处相交,即多边形不是自相交的;

(2)边界封闭,复杂的简单多边形可以带有多个孔洞,见图1.

1.2 不带孔洞简单多边形的交集、差集和并集统一算法1.2.1 数据结构

算法主要使用2种数据结构:点和多边形.其中点结构可以表示顶点、交点或被跟踪过的交点,由1个标志位控制,孔洞和多边形采用同一结构,见图2和3.

1.2.2 求交算法

1.2.2.1 算法步骤

求2个多边形的交点.

(1)建立P和Q多边形的节点,并创建各自的顶点循环链表.依次求出两多边形的xmin,xmax,ymin,ymax值,记录到P和Q节点中.

(2)检查P和Q是否完全分离.方法是求出P和Q的矩形包围盒(即第(1)步所求的最大和最小值),若2个矩形没有交点,则说明是完全分离的,求交算法结束.

(3)遍历P多边形的每条边,求该边与Q多边形中每条边的交点,将求出的交点分别插入到P和Q多边形的顶点链表中,同时在交点之间建立双向指针.

为减少计算交点的次数,可在真正求交运算之前进行是否存在交点的测试,具体按顺序分成以下几种情况:

如果P的当前边pe明显位于Q多边形的一侧,则pe与Q的边没有交点.判断方法是将pe的端点坐标与Q的最大和最小值比较.

如果pe与qe完全分离,则两者没有交点.判断方法是计算出qe两个端点的xmin,xmax,ymin,ymax,然后查看满足下列情况之一的视为完全分离(pe的两个端点是(x0,y0),(x1,y1)):

x0

x0>xmax且x1>xmax

y0

y0>ymax且y1>ymax

pe和qe不是完全分离的,但没有交点(见图4).判断方法是:为qe建立隐式直线方程,位于qe直线上的点f(x,y)=0;位于直线上方的点f(x,y)>0;位于直线下方的点f(x,y)0,则pe在qe的一侧.得出结论:若f(x0,y0)×f(x1,y1)>0或g(x2,y2)×g(x3,y3)>0(g是pe的隐式方程,(x2,y2),(x3,y3)是pe的端点坐标),则两线段没有交点.

线段的1个端点落在另一个线段上,是否作为交点处理要视具体情况而定.若与该端点相关的两条边在另一个多边形的某条边的一侧,则认为不相交,见图5(qe和t位于pe的一侧).若在异侧则认为相交,见图6.端点落在另一条线段上的判断方法是将端点坐标带入上面介绍的隐式方程看f(x,y)是否等于0,见图7.两条线段是否在另一条线段的同侧的判定方法与前述方法类似,以图5为例,可将t和qe的右端点坐标分别代入pe的隐式方程,将得到的结果相乘,大于0为同侧,小于0为异侧.

1.2.2.2 整理位于P多边形中每条边上的交点顺序

经过求交点运算之后,插入到P多边形中任一条边上的多个交点之间是无序的,为了给后面的遍历算法做准备,需要对P多边形中的交点数大于等于2的边上的交点进行排序,排序前计算交点到起始顶点之间的距离,填入到点的结构中作为排序依据.

为减少排序次数,应当在求交算法开始时比较P和Q的边数,若mn.由于P多边形的1条边至多与Q多边形的n条边相交,所以在总交点数不变的情况下,需要排序的交点数减少.

1.2.2.3 从P多边形开始遍历得到P与Q的交集

P和Q相交形成的交点可以分为2类:入点和出点,它们成对交替出现.[5]若以P为主,从P多边形的边进入Q多边形内部形成的交点称为入点;反之,从Q多边形内部出来与Q的边相交形成的交点称为出点.某交点是入点还是出点可以通过向量的叉乘结果判定.假定有2个二维向量A和B,A表示P的边,B表示Q的边,A和B的起点是两条边的交点,A×B=A0×B1-A1×B0[6],若小于0,交点是入点(图8中的交点k0就是入点),反之是出点.

执行以下步骤完成多边形的求交.

(1)新建1个多边形PR作为求交的结果多边形;

(2)从P多边形的起点开始遍历找到第1个交点,将其输出到PR的顶点序列中;

(3)若该交点为入点,则跟踪P多边形的边界;若为出点,跟踪Q多边形的边界;

(4)跟踪多边形的边界,遇到多边形的顶点,继续跟踪,遇到交点,则根据交点处的双向指针变换跟踪(PQ或QP),无论是顶点还是交点都需要将其输出到PR的顶点序列中.交点被遍历之后需要更改交点结构的标志位,标志交点已被跟踪过;

(5)如果跟踪过程中遇到的是1个已经被跟踪过的交点,说明已经遍历得到1个完整的多边形;

(6)继续跟踪P多边形,若遇到未被跟踪的交点,则需要再建立1个结果多边形,链接到结果多边形序列中,然后重复第(3)~(6)步.若遇到P多边形的起点,算法结束.

1.2.2.4 奇异情况

P和Q除了是相交、分离的关系,还可以是包含,P在Q内部或Q在P内部,此时P和Q没有交点,交集就是P或Q.判断这种情况的方法是首先查看P和Q是否完全分离,若不是,则P和Q可能存在包含关系,也可能是分离的.判定方法:先取P的1个顶点,调用点是否在1个多边形内部的算法来判定该顶点是否在Q内部,若在,则说明交集是P;否则,取Q的1个顶点,调用算法判断该点是否在P的内部,若在内部,交集为Q,若不在内部,说明P和Q是分离的,交集为空.

1.2.3 求差集

求差集的算法只是遍历过程,与求交集算法不太一样,但前面步骤均相同.遍历时先找到P的第1个出点,跟踪P多边形,遇交点变换跟踪,跟踪Q边界时是顺时针的(逆序).若P和Q存在包含关系,那么被包含的多边形将作为另一个多边形的孔洞插入到多边形结构中.同求交集的算法一样,求差集的结果也可能是多个多边形.

1.2.4 求并集

求并集要根据P和Q的位置关系分成3种:

(1)线段相交产生交点,这种情况须采用遍历的方式得到结果多边形,遍历过程与求交集的遍历过程相似,从P中先找到第1个出点,跟踪P,遇到交点变换跟踪,跟踪Q时也是逆时针的.求并集的结果可以是多个多边形,这其中有1个是结果多边形的外环,其余均为孔洞,区分的方法是多边形方向为逆时针的是外环,顺时针为孔洞.可使用简便方法判定多边形的方向,将多边形的相邻两个线段表示成向量,将两向量进行叉乘,大于0为逆时针,小于0为顺时针.

(2)P和Q存在包含关系,结果是显然的.

(3)P和Q分离,没有交点,并集的结果是两个多边形且均为逆时针.

总之,P和Q的并集结果可以是带孔洞的多边形,也可以是多边形序列.

2 带孔洞多边形的求交算法

带孔洞多边形的求交算法相对比较复杂,结合前面的多边形交、并、差算法,提出下面的算法.

(1)首先求P和Q两多边形的交集,其结果是1个多边形的序列,记为T.

(2)对P和Q当中的所有孔洞求并集,由于孔洞是顺时针的,所以求并集时要对第1节提到的算法稍作改动,在此不作细述.对孔洞求并集,可能会出现“洞中有洞”的情况,对于整个多边形,这仍然是多边形的孔洞,所以,在孔洞求并集时抛弃它.所有孔洞求并之后得到1个孔洞序列H.

(3)从T中取1个多边形对H中的孔洞逐一作差集,然后从T中再取下一个重复,直至T为空.在求差集的过程中根据多边形与孔洞的位置关系不同可以采取不同的策略:①完全分离,判定方法见第1.2.2节,处理方式为抛弃;②相交有交点,处理方式是求差集;③存在包含关系,判定方法见第1.2.2节,处理方式是作为孔洞加入到结果多边形中;④分离但不是明显完全分离,这种情况尚没有直接区分的方法,只能使用排除法,处理方式为抛弃.

(4)最后的求交结果是1个多边形序列,每个多边形可能含有0或多个孔洞.

3 结 论

求简单多边形的交、并、差集问题是计算几何的基本问题,本文提出1种简易可行的算法,并对算法给予实现.算法复杂度分析如下:求交点过程为O(mn);排序过程最坏情况下,P多边形的1个边与Q多边形的n个边都相交,所以为O(mn log n);遍历过程O(mk+n),k为P多边形1条边上的交点个数,最多为n;所以整个复杂度为O(mn log n),m>n.在算法中,由于采用许多减少计算的措施,综合性能良好.在求交、并、差算法的基础上,又提出1种简化的带孔洞多边形的求交算法,经过测试,算法具有较好的可行性.

参考文献:

[1] RIVERO M, FEITO F R. Boolean operations on general planar polygons[J]. Computers & Graphics, 2000, 24(6): 881-898.

[2] 朱雅音, 王化文, 万丰, 等. 确定两个任意简单多边形交、并、差的算法[J]. 计算机研究与发展, 2003, 40(4): 576-583.

[3] 樊建华, 黄有群, 刘嘉敏. 带孔洞的多边形求交集算法[J]. 沈阳工业大学学报, 2001, 23(5): 429-431.

[4] 周培德, 卢开澄. 计算几何[M]. 北京: 清华大学出版社, 2000: 144-146.

交集与并集范文第2篇

方案要点: 1、对现有商品进行促销销售,保证成本的前提下,达到消库之目的。 2、对外宣传: A、对外宣传联华已控股原解百生鲜超市 B、江城超市更名为世纪联华 主题: 清仓大甩卖 告别解百生鲜 迎接世纪联华 时间:2004.10.15----10.18 促销思路: 针对现江城店滞销商品、库存商品、抵价商品,结合现有的商品结构,借助特价商品、惊爆商品提升销售。 促销活动 一、“一、二元”搞定----均一价 利用低价商品吸引人流。对部分非交集商品实行一元、二元区进行销售,提升活动效应。 建议: 1、一元区选择30个单品: 百货:15个

食品:15个 2、二元区选择50只: 百货:25个 食品:25个 3、五元区商品:30个 4、10元区商品:30个 作价建议: 特价 原价 一元区 1---2.5元商品 二元区 2.6---3.5元商品 三元区 3.6---6元商品 五元区 6.1---12元商品 10元区 12.1---20元商品 此部份商品共计140个,具体清单见附件(一)。 二、敏感商品-----牺牲特价 思路:借助高敏感度的生鲜与民生商品提升人流,商品采取特价形式,对部分非 集商品采用保本销售的形式销售。 商品选择建议:15个单品 生鲜4—5个 油、米 2—3个 护肤、洗化3—4个 非交集商品:2—3个 宣传: 《都市快报》 10.14日整版 商品作价清单请见附件(二) 三、特价销售 针对非交集商品中20—100元之间的商品,利用一定的商品折扣作现场直接销售,消化此商品的库存。 作价建议: 20---50元(进价):作价折扣为7折 50---80元(进价):作价折扣为6.5折 80—100元(进价):作价折扣为5.5折 商品作价清单请见附件(三) 四、拍卖活动 活动时间:10.15—18 每天 17:00---18:00 19:00---20:00 拍卖商品:(1)1300多个非交集商品中,单价在100元以上商品

(2)抵债商品(以家电为主) 拍卖作价:(1)非交集商品起拍价为商品进价的2成

(2)抵债商品起拍价为进价的1.5成 拍卖商品数量: (每天每时间段) 品种数:15个单品,每个单品一件 商品分配(建议):(1)非交集商品5个 (2)抵债商品10个 具体视拍卖情况而定,每日拍卖的单品应有区别. 五、清仓大放送 结合全场商品,执行与销售相捆绑的买赠活动,提升其他商品销售。并结合现库存商品做费用转换支出。 活动时间:10.15—18 活动规则: 一次性购全场商品(除拍卖商品)50元,送赠品一份,送完为止。 操作: (1) 门店对全场商品在电脑小票上累计金额(拍卖商品)。 (2) 专设赠品兑换区,由专人负责。 (3) 消费者凭电脑小票到指定地点兑换,单张小票限兑换三份。 (4) 赠品是非交集商品中1—3元的商品,具体请见附件(四)。 宣传 1、小区宣传: 采用20条横幅在附近小区进行宣传,小区名单由门店提供。 2、整体对外宣传(牺牲商品) 2004.10.14 《都市快报》整版宣传 3、卖场宣传 (1)门店广播对活动进行一次/10分钟播报. (2)门店POP海报 陈列 1、设立“均一价”专卖区,分别形成“一元区、二元区、三元区、五元区、10元区”,建议在一楼收银通道与现二楼地堆区。 2、特价专区 主要针对20—100元特价商品 3、门店拍卖专区 建议:在现招商区 装饰 1、对相应的专卖区配以相应的特价区指示牌 2、一楼卖场面地区的装饰:包括柱子、主通道等 3、货架:特价指示插卡

交集与并集范文第3篇

——地域特征明显、民族特色浓郁的食品品牌怎样走向全国?简言之,一招鲜,何以吃遍天?

——《说牌》认为,就朝鲜族传统风味泡菜及调味酱等特色产品、品牌的全国化营销而言,除了在战略思维、组织架构、销售政策方面进行调整与提升外,企业要紧紧依托近年来韩流文化流行这一大势,从产品创意、包装创新、场景细分、活动推广等方面借势并落地,尽快实现全国化营销。

上周,应吉林省驻沪办邀请,前去为来沪的吉林企业家班授课。 活动结束后,该班班长——吉林延边金刚山食品公司老总赵勇哲先生热情相邀,让我择时前往延吉为吉林大学延边企业家班及延边朝鲜族民俗特色食品行业协会的会员们授课(赵总还兼该会协会的会长)。延边,没去过;再一个,上海至延吉,直飞航班十分方便,便欣然应承了。

打开赵总公司网站,首页上一行文字赫然醒目:“我们有信心让朝鲜族民族特色食品走向中国人每天的餐桌。” 企业愿景宏伟而令人怦然心动!

网站资料显示,延边金刚山食品有限公司成立于2003年4月,主营生产朝鲜族传统风味泡菜及调味酱等系列产品,有辣白菜、萝卜块、苏子叶、桔梗、辣椒酱等一百余种产品。产品已经覆盖东三省,并打入全国各地大型商场、超市。公司打造的直营店、加盟连锁店、专卖店已达600余家,2014年以来,公司的电商业务也在逐步成长。

吃泡菜,获得了什么?

2012年6月,我曾随团前往韩国首尔讲学,住在酒吧、咖啡店遍布的江南区。每次用餐,基本都在江南区的各式小饭店完成的。令人印象深刻的是,饭店的格局、摆设、陈列与装潢可能各异,但有一点是共同的,无论走进哪家饭店,用餐前,餐桌上都会摆上一大罐泡菜让你免费品尝。令人惊奇的是,那些沾满鲜红色辣椒酱的、长长的泡菜都是“半成品”!需要食客自己动手,用饭店提供的专用剪刀一段段剪断才可享用。长短?宽窄?您自便得了,自己满意就行!满桌的食客们面对鲜红的泡菜,在一片“咔嚓”、“咔嚓”.的声音中实现了对韩国饮食文化的初次体验。

还令人惊奇的是,在韩国饮食中,大小、形状、功能各异的剪刀作为一种重要的餐具,其发挥的作用可谓是出神入化、登峰造极。除了泡菜外,烤肉的肉片要剪刀剪、黑乎乎的冷面要剪刀剪、济州岛过来的海鲜搁上烤架前,要用剪刀剪、那种类似于饼状的点心,要化整为零,还是用剪刀剪......嘿,整个就是一花样百出的剪刀世界!

在首尔期间,类似于开胃菜的泡菜所呈现出的红红的颜色、酸辣的味道及店堂中时时的咔嚓声,让我们从中的获得了较为完整的韩式饮食文化体验。

寻找交集,做大交集

从何时起,韩流吹拂了华夏大地?没人说得清楚。但其对娱乐界、影视界、传媒界的影响是深刻的,腊肉、鲜肉们也纷纷活跃在中国的影视界、娱乐界,陆陆续续、绵延不断。当年的《大长今》,除了剧情有些吸睛外,其中的韩式食品至今仍有人对其津津乐道。

最近,因扮演《太阳的后裔》主角而火爆起来的这位小鲜肉——宋仲基,更是呼风唤雨,在中国内地的影响远远超过了他的韩国前辈了。

充分利用韩流文化的辐射与影响,借势营销,做大类似延边金刚山食品有限公司生产的各类朝鲜族传统产品,这已经没人怀疑。

但是,在实际操作中,有两点需要厘清并引发重视:

交集与并集范文第4篇

【关键词】中职生;数学课堂阅读;宁静

2012年4月和7月,我分别参加了南京市、江苏省职业学校信息化教学设计大赛,备赛中饱尝了酸甜苦乐,寻找一个合适的课题令我大伤脑筋,我发现并不是每个课题都适合用信息技术来展示。而目前在中职数学课堂,信息技术呼声很高,似乎每节课都用上多媒体,才能算是一个合格的、有时代气息的老师。殊不知,老师们在追求信息技术表面繁华时,似乎也渐渐把数学学习之根本――宁静的数学课堂阅读给忽略了。

数学是研究现实世界的空间形式和数量关系的一门学科,是自然科学、工程技术等领域不可缺少的基础和工具,是中职校的一门重要的公共文化基础课。经过中考的分流,中职生较普高学生数学基础相对薄弱、数学学习习惯相对较差;他们不善于主动阅读数学教材,常常连数学符号都不能正确书写,甚至根本就不认识某些数学符号,在数学课堂上常常被老师牵着鼻子走,渐渐对数学学习发展到游离状态,产生了畏学心理。

英国著名的哲学家和科学家培根说:“读史使人明智,读诗使人灵秀,数学使人周密,科学使人深刻,伦理学使人庄重,逻辑修辞使人善辩,凡有所学,皆成性格。”我认为,读数学将使人宁静。在中职数学课堂开展数学阅读,引领学生读数学:阅读数学教材中的数学符号、函数图象、数学公式、数学概念……数学教材外的数学发展史、数学与专业联系的相关资料……对中职生的终身发展,必将受益匪浅。

借主持江苏省第一期省级课题《中职形象设计专业学生数学阅读素养培养的研究》研究的契机,笔者对“在中职数学课堂开展数学阅读”进行了有益的尝试。下面挑选两个课例进行简单诠释。

课例1:在《函数的奇偶性》中研究偶函数的定义。

教材中关于偶函数的定义非常抽象,根据中职生的数学学习现状,直接阅读概念肯定是行不通的。教学中引导学生先来研究f(x)=x2,f(x)=x4,f(x)=x6,f(x)=x8这类函数。以f(x)=x2为重点,解剖一个“麻雀”。首先借助“几何画板”作f(x)=x2;然后引导学生观察图象,读图象,得出其图象特征(关于y轴对称);接着讨论关于y轴对称的函数的数量关系上的特征,这是数学阅读的难点。教学中通过以下几种方式突破难点:1.取特殊值,让学生填表;2.根据点的对称;3.借助于形。基于学生的形象思维强于逻辑思维,通过演示x取±1,±2,±2.5几个特殊值,演示平移,得出f(1)=f(-1),f(2)=f(-2),f(2.5)=f(-2.5)之后,在图象上构造动点并运动动点,观察动点及其关于y轴对称点坐标的变化规律,通过演示帮助学生读图;然后展示y=x4,y=x6,y=x8的图象,设问:给具有这一特点的函数起个什么名字好呢?(偶函数!――受2,4,6,8,-2等都是偶数的启发。)你能说说什么样的函数叫做偶函数吗?逐步抽象、概括出偶函数的一般定义及图象特征。然后布置学生阅读教材中偶函数的定义,并进行变式教学引导,强化对偶函数定义的理解。在这个过程中,老师的“导”为数学概念的阅读、数学的抽象概括起到了辅助作用。接着请学生根据阅读偶函数定义的体会,再举出几个偶函数的例子,通过这些活动,把学生卷入到教学过程中,卷入到数学课堂阅读中,从而加深对偶函数内涵的把握。并可以进一步追问“你为什么举这个例子”,努力挖掘背后的思维过程,迫使学生用概念思维,回到数学教材中来,回到阅读偶函数的定义上来,充分利用数学教材,让学生在数学阅读中产生愉快的情绪,激发学习兴趣。

课例2:在《集合的运算中》中研究交集、并集的定义。

根据本人多年的教学实践经验,学生学完《集合》这一章后,往往连交集、并集的符号都会混淆,甚至不会书写,而且还易和包含、包含于的符号相混淆。为防范于未然,在研究交集、并集的定义时,我着重启发学生进行数学符号的阅读、记忆和书写。

首先请学生思考集合C的元素与集合A,B元素间的关系?比如:1.A={2,4,6,8,10},B={2,3,5,8,12},C={2,8};2.A={1,3,5},B={2,4,6},C={1,2,3,4,5,6}等,然后引导学生结合韦恩图,阅读数学教材中交集、并集的文字定义,并尝试用数学语言表述交集、并集的概念:A∩B={x|x∈A且x∈B};A∪B={x|x∈A或x∈B},体会“交集”与“并集”的实质。老师在课堂教学中,要注意充分留白,给学生看书时间,并请学生在阅读中思考如何记忆这两个符号。实际教学中,我提示学生在阅读中注意“∩”、“∪”与汉字的“交”、“并”在形上的联系。“交”下面大,“∩”开口朝下,即为交;同理,开口朝上即为并。同时包含、包含于也有类似的特点,开口对着大的集合。此时,让学生将数学符号反复咀嚼,准确理解,排疑解难,这样学生便会很快内化为自己的知识,最终形成数学阅读能力,提升数学阅读素养。

历时近两年的研究下来,我发现学生的数学阅读兴趣增强了,数学课堂学习气氛活跃了,同时数学学习成绩也有了较大的突破。老师数学课堂上的有效导读,改善了师生关系,有效激发了学生的正面情绪,去除了中职生普遍存在的虚浮,取出了老师们表面呈现的繁华,读数学真的使孩子们宁静了。

【参考文献】

[1]高文君等.数学阅读能力构成及阅读教学原则的研究[J].教育管理,2005,12

[2]高瑞卿.阅读学概论[M].长春:吉林人民教育出版社,1987:65

[3]韩秀鹏.提高学生数学素养探析[J].黄冈师范学院学报,2007,12

交集与并集范文第5篇

关键词:电路与系统;无线传感器网络;预测;滤波;移动定位算法

中图分类号:TP311.13 文献标识码:A 文章编号:1007-9599 (2012) 11-0000-03

一、引言

无线传感器定位算法主要分为基于测距的算法和无需测距的算法两大类。基于测距的定位算法通过测量节点之间的距离、角度等信息实现定位,常用的方法有三边测量法、三角测量法或最大似然估计法等。无需测距的定位算法则不需要距离、角度等信息,利用节点之间的相邻关系和连通性实现定位,缺点是定位精度较低,典型的无需测距的定位算法有基于节点跳数信息的DV-Distance算法和Amorphous算法、求解几何重心的质心算法等。计算移动的节点的位置,当结果计算出来以后,节点置信息。也已经因为移动离开了那个位置,这样得出的将永远是已经过期的无效的位置信息。在某些特定应用场合中,虽然可以通过高频率的运行为静态无线传感器网络设的定位算法来近似实时的确定移动节点的位置,并且可以取得一定的效果,但是会引起比较严重的信息衰减。

所以,在设计针对无线传感器网络移动节点的定位算法时,移动性应该被直接考虑到定位结果不应该因为移动性降低,而是应该通过利用移动性这一特点来帮助提高定位精度和定位效率。例如,可以通过已经获得的现有位置信息,比较精确的预测接下来的时刻的节点位置,以提供比较实时的有效的当前位置信息。

二、传统移动定位算法

Monte Carlo移动定位算法(MCL)是1988年Rubin提出的采样/重采样算法的一个演化,关键想法是使用一个包含N个带权值的样点的集合来代替后验概用表示样点集中的样点,其中为质点所在位置为这个样点的权值,类似于离散概率。通过假设保持归一性

移动定位算法分为预测和滤波两个阶段。

(一)在预测阶段

因为约定待定位节点的运动速度不会超过某个最大值Vmax,所以,是若待定位节点在t-1时刻的可能位置,那么在t时刻,该节点的位置就只可能在以为圆心Vmax为半径的一个圆内。

(二)在滤波阶段

待定为节点根据当前时刻接收到的观测值和约束条件丢弃那些不可能的预测位置。最后的得到的样点平均即为节点的定点位置。

图(1)直观的表示了移动定位算法的效果,质点从已知位置的某点,(图中A点)出发,沿实线所示轨迹运动。随着时间的推移,样点集的不确定性增强。

三、新移动定位算法

(一)初始位置预测

在初始化阶段,即时刻,待定位的无线传感器节点对自己的位置未知。待定位的无线传感器节点记录下自己的一跳范围内的所有锚节为集合OS,再记录一跳范围内邻居节点的一跳范围内的所有锚节点集合(即邻居节点的OS集合)为集合TS。

分别以OS集合中的锚节点为圆心、通信半径R为半径作圆,取所作的几个圆的交集,并作交集的外接矩形;再分别以TS集合中的锚节点为圆心、二倍通信半径为半径作圆,取所作的几个圆的交集,并作交集的外接矩形。取上述两个矩形的交集为trustbox0例如,假设有待定位节点P,在它的一跳范围内监听到两个锚节点和一个邻居节点,分别锚节点A、锚节点B和普通节点Y,即待定位节点P的OS集合为锚节点A和锚节点B。邻居节点Y在它的一跳范围内也监听到两个锚节点,分别为锚节点a和锚节点b,即待定位节点P的TS集合为锚节点a和锚节点b。如下图2所示。

分别作OS集合中锚节点的外接圆,即分别以锚节点A和锚节点B为圆心、通信半径R为半径作圆,并取两个圆相交部分的外接矩形。如下图3所示。

分别作TS集合中锚节点的外接圆,即分别以锚节点a和锚节点b为圆心、二倍通信半径2R为半径作圆,并取两个圆相交部分的外接矩形,再取新作矩形与上一步所作矩形的交集,即为trustbox0。如图4中所示灰色区域。

在trustbox0中随机取20个样点,将20个点的平均位置作为节点在初始时刻的初始预测位置P0。

(二)选取样本空间

经过一个时隙后,即时刻,无线传感器节点移动到了一个新的未知的位置P‘,用上述方法作当前时刻的trustbox1作以样点为圆心、节点最大移动速度Vmax为半径的圆的外接正方形,与当前trustbox1作交集,得到的矩形为samplebox。如下图5所示橙色区域。

trustbox0中随机取的20个样点均这样做,这样可以得到20个samplebox。

(三)下一时刻节点预测

在samplebox里随机取一个点,通过做矢量的运算判断该点是否符合预测的运动轨迹若符合条件,则将该点储存在trustbox1中,否则丢弃该点,重新在samplebox里随机选取一个点进行上述滤波判断。直到得到符合条件的样点或达到最大尝试次数。若达到最大尝试次数后还是无法得到符合条件的样点,则放弃这个samplebox,直接在trustbox1中随机得到一个样点储存在trustbox1‘中依次判断20个样点,得到有20个新的样点的trustbox1‘,取20个样点的均值,即为时刻的节点定位位置P1。

循环往复预测阶段和滤波阶段,则可得到所有时刻对节点定位的位置结果。

交集与并集范文第6篇

一、列举法

列举法就是把集合中的所有有限集合列举出来,我们一般三步走,第一步定集合中的元素;第二步运算类型;第三步定运算结果。可以简称“三定”。

例1、设集合A={-2,-1,0,1,2},集合B={0,1,2}定义A@B={(x,y)|x∈A∩B,y∈A∪B},则A@B中元素的个数是()

A. 15 B. 10C.35D.53

思维路径:求解(x,y)求解x,y定A∩B,A∪B

解:因为集合A={-2,-1,0,1,2},集合B={0,1,2},则A∩B={-2,-1,0,1,2}∩{0,1,2}={0,1,2};那么x就可以取0,1,2;

同理y∈A∪B={-2,-1,0,1,2}∪{0,1,2}={-2,-1,0,1,2};所以元素(x,y)可能的结果有:(0,-2)、(0,-1)、(0,0)、(0,1)、(0,2)、(1,-2)、(1,-1)、(1,0)、(1,1)、(1,2)、(2,-2)、(2,-1)、(2,0)、(2,1)、(2,2)等,所以A@B中的元素有15个。

答案:A

小结:这类题是简单的集合运算,只要我们确定新运算中元素是什么,即一对有序实数;再求出元素即可。

二、数学结合法

数学结合法就是用数轴、韦恩图表示集合,然后我们直观的观察求解交集、并集、补集等。跟列举法一样三步走。第一步:定集合(确定集合元素是什么,或者用不等式表示出);第二步:定图,(在本上画出数轴或者韦恩图表示所求集合);第三步:定结论(根据题中集合间的关系或者对应法则运算出结果)。

例2、设集合A=x|x216+3y216=1,B={y|y=x2},则A∩B=()

A.[-4,4]B. (0,4)C.[-4,0]D.[0,4]

思维路径:首先认清楚集合内表示的关系,集合A表示椭圆上点的横坐标的取值范围,我们有x216≤1,解得-4≤x≤-4,所以A=[-4,4]。集合B表示函数y=2x2的值域,由y=2x2≥0可知,B=[0,+∞)。

我们用数轴分别表示集合A,B.则由图可知,A∩B=[0,4],即选择D。

小结:首先判断每个集合所表示的元素指的是什么,再算出元素的取值范围在数轴上表示出来,其中公共的那一部分就是集合的交集。

三、特殊值法

集合运算一般出现在选择题,当我们高考的时候,为了拿高分,那么做这类题就需要用技巧来解而节省时间。我们在做这些题的时候,根据选项选择几个特殊的值来判断选项的对错。我们同样采取三步走。第一步:辩差定特,意思是我们先辨别选项,除了共同点还有什么差异,我们又这些差异选取符合题意的特殊元素;第二步:验证排除,将选取的特殊元素带入题中检验是否符合条件,从而排除不符合的选项;第三步:确定结果,根据排除选项后确定答案。

例3、已知U为全集,集合

A={x|x2-2x-15>0},B={x|3

A.{x|-3≤x≤6} B.{x|3

思维路径:

比较选项异同去共同求异找特殊值检验排降选项定选项

解:看A.D选项中-3,6是否能够取到,B,C选项中3,5是否能够取到。A,D与B,C可以看0,用0我们排除A,D。又因为3B,所以3B∩(CUA),则可以排除C,答案就是B。

交集与并集范文第7篇

关键词:集合;元素;解题方法

中图分类号:G633.6 文献标识码:A 文章编号:1992-7711(2014)10-0109

集合一直都是高考的必考点,一般来说,解决集合的创新问题常分三步:(1)信息提取,确定化归的方向;(2)对所提取的信息进行加工,探求解决方法;(3)将涉及到的知识进行转换,有效地输出,其中信息的提取和转化与化归是解题的关键,也是解题的难点。

案例一:(2012・重庆高考)设平面点集A={(x,y)|(y-x)(y-■)≥0},B={(x,y)|(x-1)2+(y-1)2≤1},则A∩B所表示的平面图形的面积为()

A. ■πB. ■πC. ■πD. ■

[解析]不等式(y-x)(y-■)≥0可化为y-x≥0y-■≥0或y-x≤0y-■≤0集合B表示圆(x-1)2+(y-1)2=1上以及圆内部的点所构成的集合,A∩B所表示的平面区域如图所示。曲线y=■,圆(x-1)2+(y-1)2=1均关于直线y=x对称,所以阴影部分占圆面积的一半。

[答案]D

评注:

1. 本题具有以下创新点

(1)命题方式的创新:题目并不是直接求解不等式组

(y-x)(y-■)≥0(x-1)2+(y-1)2≤1所表示的平面区域的面积,而是以求集合交集的形式考查。

(2)考查内容的创新:本题通过集合A,B考查了一元一次函数y=x、反比例函数y=■的图像和圆的方程(x-1)2+(y-1)2=1,以及圆和函数y=■的图像的对称性、不等式所表示的平面区域等内容。

2. 解决本题的关键有以下两点

(1)正确识别集合A与集合B中元素的几何性质,并正确画出各自所表示的区域;

(2)注意到圆(x-1)2+(y-1)2=1与函数y=■(x>0)的图像都关于直线y=x对称。

3. 在解决以集合为背景的创新交汇问题时,应重点关注以下两点

(1)认真阅读,准确提取信息,是解决此类问题的前提。如本题应首先搞清集合A与B的性质,即不等式表示的点集。

(2)剥去集合的外表,将陌生转化为熟悉是解决此类问题的关键,如本题去掉集合的外表,将问题转化为求解不等式组表示的平面区域问题.

案例二:已知A={(x,y)|y=|lnx|},B={(x,y)|■+■=1},则A∩B的子集个数为()

A. 3B. 4C. 2D. 8

评注:选B。A∩B中元素的个数就是函数y=|lnx|的图像与椭圆■+■=1的交点个数,如图所示。由图可知,函数图像和椭圆有两个交点,即A∩B中有两个元素,故A∩B的子集有22=4个。

案例三:设集合M={y|y=|cos2x-sin2x|,x∈R},N={x-■|

A. (0,1)B. (0,1]C. [0,1)D. [0,1]

评注:选C。y=|cos2x-sin2x|=|cos2x|,且x∈R,

y∈[0,1],M=[0,1].

在N中,x∈R且|x-■|< ■,

|x+i|

x2+1

N=(-1,1),

交集与并集范文第8篇

关键词: 分布式索引; 局部索引; 全局索引; 海量数据

中图分类号:TP392 文献标志码:A 文章编号:1006-8228(2013)08-01-04

0 引言

信息检索系统(IRS:Information Retrieval System)已成为人们日常生活和学习中经常会使用到的工具(如文献检索、网页检索等)。随着数据规模的增大,信息检索系统开始采用分布式系统架构来解决所面临的大数据问题。由此而引出的索引如何在分布式系统之中组织与分布的问题即是分布式索引架构问题。全局索引架构(Global Index)与局部索引架构(Local Index)是两种最主要的分布式索引架构,几十年以来,大量的研究和实验对它们的优缺点进行了详细分析与比较。

全局索引架构针对整个数据集建立一个统一的索引,然后根据索引关键字的顺序将索引切分成多个索引片段,每个索引片段存放在一个单独的索引节点上。全局索引架构在执行一个检索时所需要访问的索引节点相对较少,但这也导致其每次读取的数据量较大;由于数据的处理需要集中在中间节点上进行,全局索引架构网络传输的数据量更大;所有的数据处理操作集中在中间节点上执行,在面对海量数据时这将成为全局索引架构不能满足用户需求的关键瓶颈;由于是针对整个数据集建立倒排索引,因此在全局索引架构在面对索引的更新与增量时相比局部索引架构难度更大。

分布式局部索引架构即是将大的数据集随机或者按照一定的规则划分成多个小数据集,针对每个小数据集建立单独的索引块,一般一个索引块会存放在一个单独的索引节点上。局部索引架构的每个索引节点独立的完成检索,因此具有较好的容灾容错性能;在索引更新及增量时,由于其每个索引节点相互独立,因此更新与增量的影响范围较小;由于索引节点返回给中间节点的数据都是经过处理的,因此相比全局索引架构而言局部索引架构网络传输的数据量更小。局部索引架构的缺点在于检索的开销较大,其每一个检索条件都会被发送到所有索引节点上去执行。

混合索引架构结合了全局索引架构与局部索引架构的优点,但高度的数据冗余造成了极大的数据膨胀,在大多数的应用当中这一点通常无法被用户接受;同时副本数量过多也导致数据的更新与增量难度更大。由于混合索引架构的明显缺陷,我们在后面的文章中将不再对其进行分析。

1 相关工作

分布式索引架构的研究从上世纪九十年代初开始,但早期有关分布式索引架构[1,2,5,7,9]的研究由于存在数据量较少、硬件环境限制、应用场景不同等问题,导致大家的研究结果有很大的分歧,对于当前海量数据背景下分布式索引架构研究的参考意义不大。Cambazoglu等在2006年通过实验结果[8]说明局部索引架构有较快的响应速度,而全局索引架构的吞吐率较好,这和我们的观点是一致的,但实验的结果是在较少的数据集上取得的(30GB),因此没有说明全局索引架构在响应时间上问题的严重性。

文献[3,4,7]等都是针对全局索引架构进行优化,他们或者考虑如何减少网络传输的数据量[3,6],或者使用新的数据处理方式[4],但都没有从根本上解决全局索引架构的时间延迟问题,而且用于实验的数据量都相对偏小,没有以海量数据为应用背景。

2 理论及分析

在介绍本文方法之前,先说明将用到的数据结构。倒排索引记录是Key-Value结构的,其中Key是检索关键字,Value是由数据项组成的有序集合。数据项的格式为(ID,score),其中ID表示某个检索对象的编号(例如文档编号),该检索对象中含有检索关键字Key,Value中的数据项都是依据ID排序的;score表示检索关键字Key在该检索对象中相关性的大小。实际应用之中检索关键字在一个检索对象中的相关性信息比较复杂,我们在模拟实验中简单的使用一个浮点型的非负数值score表示。

2.1 实现全局索引的关键步骤

在全局索引架构下对用户检索的处理步骤如下。

⑴ 用户提交检索条件,检索条件中含有一个或多个检索关键字Key,中间节点分析检索条件并将各个不同的检索关键字Key发到其相对应的索引节点;

⑵ 收到检索关键字Key的索引节点即在倒排索引中检索对应的倒排记录并将检索结果返回给中间节点,检索结果即是倒排记录中Value;

⑶ 中间节点会收到多个检索结果(Value),这些检索结果都是以ID排序的数据项集合,中间节点以ID对这些数据项集合求交集,交集中数据项的相关性值(score)是原来各个集合中有相同ID的数据项的相关性值(score)之和;

⑷ 检索对象返回给用户时一般需要分页,中间节点依据相关性值(score)的大小对交集中的数据项进行排序,相关性值(score)大的数据项对应的检索对象会先返回给用户,具体返回的检索对象需要依据数据项中的ID查找得到。

磁盘读取、网络传输等不是本文研究的重点。本文主要的关注点在于数据的处理过程,全局索引架构对数据的处理主要是在中间节点上完成的。假设:

A.在一个用户检索里面会有m个检索关键字(k1、k2…km);

B.每个关键字ki所对应的Value是由ni个数据项组成的串,设;

C.最终的交集里面有R个数据项。

根据假设,可知中间节点上求交集过程的计算操作次数约为n。如果对交集依据相关性大小进行全排序的话,其时间复杂度为o(Rlog2R),但是一般情况下R较大,而用户可能只需要查看最相关的几个文档,这样我们既可以将相关性值(score)大的结果找出来并先返回给用户,而不需要对全部的结果集进行排序。具体操作上可以在求交集的过程中将相关性值(score)大于某个阈值的数据项存在一个桶里,求交集完成后只要先将桶里面的数据项依据其相关性值(score)的大小进行排序即可,桶里面的数据项数量是应用通过阈值控制的,一般远小于R。阈值一般由数据的规模和每次返回给用户的检索对象数量决定。

假设:

D.桶里面等待排序的数据项数量为R'。

则可以将全局索引架构中间节点的计算操作次数tgm表示为:tgm=m+n+R'log2R'。

关键字的个数m大多数情况下都是个位数,相比较而言可以忽略不计;在海量数据背景下,n的大小可能是几千万、几亿,而存在桶里等待排序的数据项的个数一般只有几百、几千,因而n要远大于R'log2R',因此也可以简单地认为:tgm≈n。

2.2 实现局部索引的关键步骤

局部索引架构对用户检索的处理过程相比全局索引架构而言,在求交集等关键步骤上实现了并行化,其具体的处理过程如下。

⑴ 用户提交检索条件,中间节点将检索条件发到每一个索引节点上;

⑵ 局部索引架构索引节点所执行的操作与全局索引架构整个系统所执行的操作相同,包括检索条件的分析、检索关键字查询、检索结果求交集、根据相关性值(score)对交集排序等,只不过这些操作都是本地执行,最后索引节点将按相关性值排序后的检索结果返回给中间节点;

⑶ 中间节点接收各个索引节点的检索结果,这些检索结果都是以相关性值大小排序后的数据项集合,中间节点依据相关性值(score)的大小对这些数据项集合进行归并排序,同样,相关性值大的数据项对应的检索对象将优先返回给用户。

除使用2.1小节的假设条件外,这里再补充两个假设:

E.分布式信息检索系统中有N个索引节点;

F.每次返回给用户的结果集中数据项的个数为M。

这里需要说明的一点是,M的值并不是分页后一个页面所展示的检索对象的数量,一般而言M是一个页面所展示检索对象数量的倍数,比如10倍,用于应对用户可能的翻页,而且M小于R'。

局部索引架构索引节点所执行的操作与全局索引架构整个系统所执行的操作相同,参考2.1小节的分析,可以将局部索引架构索引节点的计算操作次数tli表示如下:

该表达式不一定准确,因为不可能每个索引节点在处理检索时的时间复杂度都是一样的,实际上由于局部索引架构中数据的划分是随机的,具有较好的负载均衡,虽然会有偏差,但是可以接受。

与全局索引架构一样,局部索引架构的索引节点也可以设置阈值,从而只需对桶里的R'个数据项进行排序,索引节点在给中间节点返回数据时,不必返回全部R'个数据项,只需返回前M个相关性值(score)较大的数据项即可。中间节点会收到N个数据项集合,每个集合M个元素,同样,中间节点也只需归并求出前M个相关性值(score)较大的数据项即可。

中间节点使用二路归并算法对N个数据项集合进行归并排序,因为多线程并行处理时二路归并是最优的。局部索引架构中间节点的计算操作次数tlm1可以表示如下:

tlm1的计算表达式是在线程并发度足够大的情况下取得的,实际的线程并发度是由中间节点CPU总的核心线程数目决定的,假设:

G.中间节点核心线程数目为L。

中间节点共需要运行N-1个线程,则更为精确计算操作次数tlm2可以表示如下:

在实际计算中,计算处理程序独占整个CPU是最优的情况,这种情况很难达到,所以tlm2的表达式中增加了一个系数eL和一个常数因子bL,并且有eL?1成立。具体eL和bL的值可以通过实验数据计算得到。

由于系统吞吐率、数据到达中间节点有先后等因素,可以考虑在中间节点上不使用多线程并行,而只是简单的串行执行即可,这样得到的中间节点计算操作次数tlm3可以表示如下:

tlm3=M*(N-1)

由于索引节点对检索的处理都是并行的,因此只需考虑单个索引节点即可,结合中间节点上计算操作的执行次数,则局部索引架构下整个计算过程的计算操作次数tltx可表示如下:

tltx=eltxtli+tlmx+bltx(x=1,2,3)

当tli=tlmx时,即中间节点与索引节点的计算操作次数相同时,但是由于二者计算过程的具体实现不同导致实际测得的计算时间是不同的,因此引入上述表达式中的平衡因子elt以及常数blt。平衡因子elt及常数blt可以结合实际的测量数据,利用线性回归模型求出来,在2.3小节有更为详细的分析。

分析比较全局索引架构与局部索引架构的计算操作,可以发现在海量数据背景条件下,局部索引架构明显优于全局索引架构。同时也应该看到,针对同一个检索,局部索引架构使用的索引节点更多,一般情况下局部索引架构相比全局索引架构在处理一个检索时的开销更大。

2.3 分析局部索引的簇的大小

将局部索引架构的计算操作次数tlt看成N的函数,即:

以执行时间复杂度最小值为目标,对于给定的n值(数据规模),可以求出最优的N值(机群规模),该结论对于在具体应用当中确定分布式机群的规模有参考价值。

对于平衡因子eltx(x=1,2,3)需要结合试验数据利用线性回归模型求解,这里先给出具体的回归模型。实验时取tlmx=tli(x=1,2,3),即局部索引架构索引节点与中间节点的计算操作次数相同,分别将二者的实际执行时间记为tlmx(x=1,2,3)和Tli,elmx是Tlmx与tlmx的相关系数(x=1,2,3),eli是Tli与tli的相关系数,bli和blmx(x=1,2,3)都是常数因子,则回归模型可表示如下(x=1,2,3):

根据条件tlmx=tli(x=1,2,3),由上面的数学模型可得:

计算机的实际计算时间和算法时间复杂度的关系是线性的,所以文章中使用的是线性回归模型。

2.4 数据扩展和索引架构的选择

仅就计算的执行时间分析,可以看出在海量数据背景下(即n的值较大时),局部索引架构在计算执行时间上相对于全局索引架构有明显的优势;但当数据量较小时(即n的值较小时),这个优势并不明显;可以预见当n变小到一定程度时,全局索引架构与局部索引架构的执行时间数据就会相同,这时n的值对于根据数据规模的大小决定采用哪一种索引架构具有一定的参考价值;当n的值再变小时,局部索引架构的表现可能会比较差。

以上分析看似合情合理,但从另一个角度来考虑的话,就会发现问题并非如此。我们把局部索引架构索引节点的个数N考虑进来,那么关于执行时间Y的方程就有两个自变量(n与N)。由于局部索引架构索引节点的计算操作与全局索引架构中间节点的计算操作相同,取N为最优值,那么当数据规模变小(n的值变小)到一定的曾度时,N一定会变为1,那么此时因为只有一个索引节点,全局索引架构与局部索引架构就完全的相同了,因此计算的执行时间也必然相同。

通过上面的分析可以发现,在N取最优值的情况下,当全局索引架构与局部索引架构的执行时间相同时,局部索引架构就会退化为全局索引架构。

实际应用之中的情况可能会不同,计算执行时间的最优值并不是用户最为重要的目标,由于全局索引架构相对比较节省资源,所以在满足应用需求的情况下用户可能更愿意使用全局索引架构。

3 结束语

本文以海量数据为背景条件,研究了信息检索系统中分布式索引组织架构问题。通过分析说明了面对海量数据时分布式局部索引架构是信息检索系统的必然选择,分布式全局索引架构由于不可接受的时间延迟问题而被排除。本文对海量数据背景下分布式索引架构问题的研究成果不仅仅适用于一般信息检索系统,对于数据库的多条件联合查询、相似性搜索中的度量空间索引等也有一定的参考意义,虽然应用环境与具体的问题都不相同,但索引的分布式架构组织问题是相同的。未来的工作我们希望可以在完善的实验环境下将分布式索引架构的其他关键因素纳入考虑范围,例如磁盘读取、网络传输等。由于全局索引架构在检索成本上占有优势,我们下一步的工作还包括优化全局索引架构的处理模式,目标是通过优化满足用户的需求。本文所有的讨论与实验都是基于现有的软、硬件环境,相信在未来,随着计算机软、硬件技术的发展,我们解决这些问题将会更加的便利。

参考文献:

[1] RIBEIRO-NETO, B. AND BARBOSA, R. Query performance for tightly coupled distributed digital libraries.In Proceedings of the ACM Digital Libraries, Pittsburgh, PA, I. Witten, R. Akscyn, and F. M. S. III, Eds. 1998. ACM Press,182-190

[2] A. MacFarlane, J. McCann, and S. Robertson. Parallel search using partitioned inverted files. In Proceedings of the 7th International Symposium on String Processing and Information Retrieval, pages 209-220, La Coruna, Spain, September 2000. IEEE Computer Society.

[3] Zhang J, Suel T. Optimized inverted list assignment in distributed search engine architectures[C]. Parallel and Distributed Processing Symposium, 2007. IPDPS 2007. IEEE International. IEEE,2007:1-10

[4] Moffat A, Webber W, Zobel J, et al. A pipelined architecture for distributed text query evaluation[J]. Information Retrieval,2007.10(3):205-231

[5] Badue C, Baeza-Yates R, Ribeiro-Neto B, et al. Distributed query processing using partitioned inverted files[C]. Proc. SPIRE,2001:10-20

[6] Kayaaslan E, Aykanat C. Efficient query processing on term-based-partitioned inverted indexes[R]. Technical Report BU-CE-1102, Bilkent University, Computer Engineering Department, 2011. Also available at: http:// cs. bilkent. edu. tr/tech-reports,2011.

[7] Xi W, Sornil O, Luo M, et al. Hybrid partition inverted files:Experimental validation[M]. Research and Advanced Technology for Digital Libraries. Springer Berlin Heidelberg,2002:422-431