基于Caching重用的复杂数据立方体聚集方法

来源：意榕旅游网

维普资讯 http://www.cqvip.com

０期　第３４卷　第ｌＶｏＬ３４　・计算机工程　２００８年５月　Ｍａｙ　２００８　Ｎｏ．１０　Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ　软件技术与数据库・　文章编号：１０ｏ０－＿＿３４２８（２００８）１０＿＿＿ｏ０６７—０３　文献标识码：Ａ　中图分类号：ＴＰ３９１　基于Ｃａｃｈｉｎｇ重用的复杂数据立方体聚集方法　唐培和，王日凤，刘浩　（广西工学院计算机工程系，柳州５４５００６）　摘要：基于数字立方体的复杂查询是立方体技术的发展方向。该文针对复杂立方体查询中可能存在的３种聚集依赖，分别给出３种基于　Ｃａｃｈｉｎｇ重用技术的解决方法。在模拟数据集和真实数据集上的实验结果验证了该方法的有效性和正确性。　关健诃：立方体查询；复杂查询；粒度计算　Ａｇｇｒｅｇａｔｉｏｎ　Ａｐｐｒｏａｃｈｅｓ　ｆｏｒ　Ｃｏｍｐｌｅｘ　Ｄａｔａ　Ｃｕｂｅ　Ｂａｓｅｄ　ｏｎ　Ｃａｃｈｉｎｇ　Ｒｅｕｓｉｎｇ　ＴＡＮＧＰｅｉ－ｈｅ，ＷＡＮＧＲｉ－ｆｅｎｇ，ＬＩＵＨａｏ　（Ｄｅｐｔ．ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ，Ｇｕａｎｇｘｉ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｔｅｃｈｎｏｌｏｇｙ，Ｌｉｕｚｈｏｕ　５４５００６）　［Ａｂｓｔｒａｃｔ】Ｃｏｍｐｌｅｘ　ｑｕｅｒｙ　ｂａｓｅｄ　ｏｎ　ｄａｔａ　ｃｕｂｅ　ｉｓ　ｔｈｅ　ｄｅｖｅｌｏｐｍｅｎｔ　ｄｉｒｅｃｔｉｏｎ　ｏｆ　ｃｕｂｅ　ｔｅｃｈｎｉｑｕｅ．Ｔｈｉｓ　ｐａｐｅｒ　ｄｅｔｅｃｔｓ　ｔｈｒｅｅ　ｔｙｐｅｓ　ｏｆ　ｔｈｅ　ｄｅｐｅｎｄｅｎｔ—ｒｅｌａｔｉｏｎｓｈｉｐｓ　ｉｎ　ｃｏｍｐｌｅｘ　ｄａｔａ　ｃｕｂｅ　ｑｕｅｒｙ，ａｎｄ　ｐｒｏｐｏｓｅｓ　ｔｈｒｅｅ　ｍｅｔｈｏｄｓ　ｂａｓｅｄ　ｏｎ　ｃａｃｈｅ　ｒｅｕｓｉｎｇ　ａｃｃｏｒｄｉｎｇｌｙ．Ｔｈｅ　ｅｘｐｅｒｉｍｅｎｔｓ　ｏｎ　ｓｙｎｔｈｅｔｉｃａｌ　ａｎｄ　ｒｅａｌ　ｄａｔａｓｅｔｓ　ｉｌｌｕｓｔｒａｔｅ　ｔｈｅ　ａｐｐｒｏａｃｈｅｓ　ｐｒｏｐｏｓｅｄ　ａｒｅ　ｅｆｉｃｉｆｅｎｔ　ａｎｄ　ｐｒｏｍｉｓｉｎｇ　［Ｋｅｙ　ｗｏｒｄｓ］ｄａｔａ　ｃｕｂｅ　ｑｕｅｒｙ；ｃｏｍｐｌｅｘ　ｑｕｅｒｙ；ｇｒａｎｕｌｒ　ｃｏｍｐｕｔｉａｎｇ　数据立方体是空间数据的一个有效模型。用立方体　征立方体方，简称多特征方。　复杂立方体查询除了具有立方体查询的典型特征，即多　个粒度聚集计算外，还有一个独有的主要特征，即聚集依赖。　这种聚集依赖特征和复杂立方体查询的提出有关，本文研究　表示数据直观且有利于计算聚集值。随着信息处理技术　的发展，从简单立方体查询的实现（含１个子查询）到复杂立　方体查询的快速响应是决策支持系统的必然趋势和发展目　标。基于数字立方体的复杂查询是立方体技术的发展方向，　聚集依赖性是复杂立方体查询的主要特性　ｊ。基于立方体的　查询是ＯＬＡＰ（Ｏｎ—Ｌｉｎｅ　Ａｎａｌｙｓｉｓ　Ｐｒｏｃｅｓｓｉｎｇ）技术的核心功　能　。本文研究了复杂立方体查询的３种聚集依赖关系（完全　依赖，部分依赖和互斥依赖）并给出相应算法（完全Ｃａｃｈｉｎｇ　重用、部分Ｃａｃｈｉｎｇ重用和反Ｃａｃｈｉｎｇ重用机制）。　的复杂查询是由用户连续提出的、在时间上具有同时性或连　续性、其中含多个子任务且它们之间具有一定内在逻辑性的　查询。这与不同用户间断提出的查询流不同，后者只是一种　按时问顺序排列的查询序列，内容上可以毫不相关，可以不　存在内在逻辑性特征，因此，能随意交换。而立方体查询的　多个子查询任务的执行顺序一般不能任意交换。　由上述分析可知，复杂立方体查询中的聚集依赖性是指　构成查询的多个子任务问的逻辑依赖关系，例如后一子查询　的聚集依赖于前一子查询的聚集结果。　ｌ相关工作　立方体查询技术始于ｌ９９６年，由于立方体中数据聚　集计算复杂且难度较大，因此多数研究集中于简单立方体查　询。复杂立方体查询研究目前处于起步阶段，相关文献较少。　ｌ９９８年文献【２】首次提出复杂立方体查询，并用扩展的ＳＱＬ　语言对其进行描述；文献【ｌ】将复杂立方体查询分为分布型、　代数型和整体型３类，并提出了分布型和代数型复杂立方体　查询的计算方法；文献【３】针对计算难度较大的整体型复杂立　方体查询提出解决方法，利用部分分布聚集特性优化计算整　体型复杂查询；文献【４】在文献【３】的基础上增加了冰山查询重　用技术，提高了整体型复杂立方体查询的效率；文献【５】根据　整体型复杂立方体查询的特点，提出基于Ｃａｃｈｅ重用的方法，　初步分析了复杂立方体查询中可能存在的３种聚集依赖关　２．２复杂查询中的聚集依赣　设数据库为销售数据库Ｓｅｌｌｉｎｇ，取其４个维ｆｔｉｍｅ，　ｃｕｓｔｏｍｅｒ，ｐｒｉｃｅ，ｓａｌｅ｝。设Ｒ　，Ｒ自分别表示在同一粒度层的不同　子查询的查询数据集／结果集，则３种子查询问的聚集依赖关　系分别如下：　（１）完全重叠　若Ｒ　ｃ　，则聚集结果为完全重叠依赖。完全重叠可分　为２种情况：１）前一个子查询的数据集／结果集包含后一个子　查询的数据集／结果集；２）后一个子查询的数据集／结果集包含　前一个子查询的数据集／结果集。例如：　查询Ｑ１：按ｆｍｏｎｔｈ，ｃｕｓｔｏｍｅｒ，ｉｔｅｍ｝的所有分组，求出２００６年　系，但没有给出具体解决方法或相应算法。　２复杂立方体查询及其聚集依赖　２．１复杂立方体查询及其特征　简单立方体查询是在多个粒度上计算且仅含一个子查询　的查询；复杂立方体查询是在多个粒度上计算且含有２个或　２个以上子查询的查询。计算复杂查询的立方体也称为多特　的最低价格，并求出各分组中最低价格商品的总销售量。　基金项目：广西自然科学基金资助项目（０４８１０１６）　作者筒介：唐培和（１９６４－－），男，副教授，主研方向：软件工程，人　工智能；王日凤，博士研究生；刘浩，讲师、硕士　收稿日期：２００８—０２—２７　Ｅ—ｍａｉｌ：ｔａｎｇｐｅｉｈｅ＠１６３．ｃｏｍ　维普资讯 http://www.cqvip.com 查询０２：按｛ｍｏｎｔｈ，ｃｕｓｔｏｍｅｒ，ｉｔｅｍ）的所有分组，求出２００６年　所有分组的最低价格，并求出各分组中商品价格在最低价格的１２５％　１５０％，１７５％以内的商品的总销售量。　Ｑ１和Ｑ２属于完全重叠情形。在查询Ｑ１中，第１个子　查询先求出２００６年的最小价格，第２个子查询在第１个子查　询的结果集（即价格为最低价格的元组）中求出总销售量。查　询Ｑ２的第２～第４个子查询，都存在后一个子查询的数据和　结果包含了前一个子查询的数据和结果的情况。　（２）部分重叠　若尺　＝尺　ｎ　且　≠　，Ｒ　≠Ｒ　，Ｒ　≠Ｒ自，则聚集结果为　部分重叠依赖，即前后结果中有部分结果相同，而其余的不　相同。例如：　查询０３：按｛ｍｏｎｔｈ，ｃｕｓｔｏｍｅｒ，ｉｔｅｍ）的所有分组，求出第１个月～　第２个月所有商品的销售变化量及第２个月～第３个月所有商品的　销售变化量。　Ｑ３的第１个子查询需要查找第１个月～第２个月的商品　销售变化量，第２个子查询需要查找第２个月～第３个月的　销售商品变化量，因此，２个子查询中均要用到第２个月的　销售数据。　（３）互斥重叠　若尺　ｎＲ自＝　，则聚集结果为互斥重叠依赖。这种情况表　明一个子查询的数据集／结果集不包含另一个子查询的数据　集／结果集，并且一个子查询的数据集／结果集需要在剔除另一　个子查询的数据集／结果集基础上进行。例如：　查询０４：按｛ｍｏｎｔｈ，ｃｕｓｔｏｍｅｒ，ｉｔｅｍ）的所有分组，求出２００４年　的总销售量，并求出各分组中占总销售量第１个１０％的最高销售量　商品和占第２个１Ｏ％的次高销售量商品。　Ｑ４的第２个子查询查找占销售量１０％的最高销售量商　品，而第３个子查询则查找占销售量第２个１０％的次高销售　量商品。具体做法是将商品按销售量排序后，先选取最高的　占总销售量１０％的商品，然后再在余下商品中找满足第２个　子查询的商品。　３种查询任务间的聚集依赖关系如图１所示。　（ｃ）Ａｎｔｉ—ｏｖｅｒｌａｐ　图１　３类聚集依犊　３基于ＣＡＣＨＥ重用的聚集技术　针对上述３种立方体聚集依赖关系，本文提出基于Ｃａｃｈｅ　重用的聚集技术。　３．１　Ｃａｃｈｅ重用技术　Ｃａｃｈｅ本义是高速缓冲存储器，是解决ＣＰＵ计算速度与　外存读取速度不匹配而使用的一种特殊存储器子系统。Ｃａｃｈｅ　重用技术指存储当前ｄａｔａ以供后续计算重复使用，从而节约　重新处理和载入的时间，提高效率。Ｃａｃｈｅ重用技术广泛用　于查询处理，包括查询流和传统的数据库查询。　３．２　３种基于Ｃａｃｈｅ重用的依赖聚集技术　复杂立方体查询中可能存在的３种依赖聚集有一个共同　特点，即存在于前后子查询任务的聚集结果集中。因此，本　文提出了基于Ｃａｃｈｅ重用的依赖聚集方法。　（１）使用完全Ｃａｃｈｅ重用机制解决完全重叠依赖。对于复　杂立方体查询中的完全重叠，由于前后子查询的结果集是完　全包含的关系，因此在计算前一子查询任务后，不清除当前　Ｃａｃｈｅ中的ｄａｔａ，为后续子查询完全重用。　例如，在查询　中，实现了子查询任务】后，已经保　存了所有粒度所有分组的最小值（可能达几万个甚至更多），　因此，在实现子查询任务２时，可以直接使用这部分聚集结　果，无须重新计算，对查询Ｑ２可做相同处理。图２描述了　此实现过程：将子查询任务１的聚集结果Ｒｅｓｕｌｔｌ及子方ｃｌ　都完全重用到子查询任务２中去，后续做相同处理。　图２完全重叠型Ｃａｃｈｉｎｇ重用示意图　（２）使用部分Ｃａｃｈｅ重用机制解决部分重叠依赖。因为子　查询结果集是部分重叠，所以只须部分重用结果集。而且，　由于已经聚集的子查询任务的结果可以被后续子查询任务重　用，因此不必重新使用已经计算过的方体数据，只须对其余　数据继续后面的聚集过程。称这样的部分结果和方体重用为　部分方体和结果集Ｃａｃｈｅ重用。例如，在查询Ｑ３中，实现　了查询任务１，输出聚集结果后，只须保留第２个月各个分　组的Ｓｕｍ（Ｓａｌｅｓ），用于子查询３的聚集过程。　（３）使用反Ｃａｃｈｅ重用机制来解决互斥重叠依赖。在互斥　依赖中，由于不同子查询中的结果集之间是不重叠的，且后　续子查询需要在剔除前一个子查询任务的聚集结果集的基础　上进行，因此在实现了当前子查询任务后，必须清除这部分　结果和数据，以便后续子查询任务能顺利实现。这种清除机　制相应地称为反Ｃａｃｈｅ重用。例如，查询Ｑ４，在实现了子查　询１和子查询２后，必须把子查询２中满足第１个　１０％Ｓｕｍ（Ｓａｌｅｓ）的商品从当前Ｃａｃｈｅ中剔除，这样子查询３的　第２组商品才能被顺利找出。　４实验和分析　为验证方法的可行性及执行效率，本文在模拟数据和　Ｗｅａｔｈｅｒ真实数据集上进行了效率对比实验。对于基本算法，　分布型和代数型复杂立方体查询采用来源于计算分布型和代　数型简单立方体查询的ＢＵＣ算法的Ｐａｒｔｉｔｉｏｎｅｄ—Ｃｕｂｅ实现　；　整体型复杂立方体查询采用以Ｐａｒｔｉｔｉｏｎｅｄ—Ｃｕｂｅ为基础的算　法”　。对于改进的比较算法，前２类采用在Ｐａｒｔｉｔｉｏｎ—Ｃｕｂｅ基　础上增加Ｃａｃｈｉｎｇ技术的改进算法；而整体型则采用在ＰＤＩＣ　算法　基础上修改的算法。为提高效率，本文同时对３种类　型的复杂立方体查询均采用了冰山查询技术（ｉｃｅｂｅｒｇ　ｑｕｅｒｙ）　。ｌ，该技术的目的是解决大数据集的选择物化问题，　采用一定的冰山条件，只物化部分立方体。基本数据集是冰　山，筛选出的数据集为冰山顶。由于是有条件的选择数据，　维普资讯 http://www.cqvip.com 因此能将搜索的范围尽可能缩小到用户感兴趣的部分，从而　提高查询效率。　均高于基本算法，且真实数据集中效率的提高程度低于模拟　数据集，原因是模拟数据集的数据量远大于真实数据集，数　据量越大，Ｃａｃｈｉｎｇ重用技术的优势越明显。　４．１数据集　为验证本文方法的有效性，笔者在模拟数据集和真实数　据集上进行了试验。模拟数据采用数据生成器产生，数据量　为５ｘ　１０。条记录，分稠密型和稀疏型２类；真实数据集采用　Ｗｅａｔｈｅｒ数据集，数据量为０．９８Ｘ　１０　条记录，如表１所示。　表１真实的ｗｅａｔｈｅｒ数据及晨性选取　通过对分布型和代数型复杂立方体查询的实验比较发　现，其效率提高程度明显低于整体型复杂立方体查询，原因　是整体型复杂立方体查询除了采用Ｃａｃｈｉｎｇ重用技术外，还　采用了部分分布聚集性质及冰山查询技术。　匝ｏ　Ｂ—ａｓｉｃＡｌｇ￣—一ｌｍｐｒｏｖｅＡｌｇ］３００　—ｏ　ＢａｓｉｃＡｌｇ￣—ｌｍｐｒｏｖｅＡｌｇ［　壶　主２００　ｅ　１００　Ｑｌ　Ｑ２　Ｑ３　Ｑ４　Ｑ１　Ｑ２　Ｑ３　Ｑ４　测试属性　ｈａｎｇｅＣ。ｄ。　Ｃｌ。ｎ２ｌＩｕｄｅｌ０　（ａ）稠密数据集　（ｂＪ稀疏数据集　【０，３６　０００　４．２基本算法　对于分布型和代数型复杂立方体查询，采用Ｐａｒｔｉｔｉｏｎｅｄ—　Ｃｕｂｅ算法实现。Ｐａｒｔｉｔｉｏｎｅｄ—ｃｕｂｅ算法思想主要有以下２点：　（１）将大的基本数据集分化为多个适合内存大小的子方　（Ｐａｒｔｉｔｉｏｎｅｄ—Ｃｕｂｅ到Ｍｅｍｏｒｙ—ｃｕｂｅ）；　Ｕ１　Ｑ２　３‘　（ｃ）真实数据集　（２）在每个子方上执行各个复杂操作（ｉｎｄｅｐｅｎｄｅｎｔ　ｏｐｅｒａｔｉｏｎ）。　图３实验结果　４．３复杂立方体查诲优化算法　优化算法也相应分２类：（１）分布型和代数型优化算法；　（２）整体型优化算法。第（１）类优化算法是在Ｐａｒｔｉｔｉｏｎｅｄ—Ｃｕｂｅ　算法基础上增加Ｃａｃｈｉｎｇ重用技术，即在计算粒度的聚集函　数时，增加如下判断：　ｉｆ　ＴｙｐｅＡｇｇｒｅＱｕｅｒｙ（ｑｉ，ｑＪ）＝Ｅｎｔｉｒｅ—Ｃａｃｈｉｎｇ　ｔｈｅｎ　ｃａｌｌ　ＡｇｇｒｅＱｕｅｒｙ（ｑｉ，ｑＪ．ｏ）：　ｅｌｓｅ　ｉｆ　ＴｙｐｅＡｇｇｒｅＱｕｅｒｙ（ｑｉ，ｑＰ＝Ｐａｒｔ—Ｃａｃｈｉｎｇ　ｔｈｅｎ　ｃａｌｌ　ＡｇｇｒｅＱｕｅｒｙ（ｑｉ，ｑＪ　１）；　ｅｌｓｅ　ｉｆ　ＴｙｐｅＡｇｇｒｅＱｕｅｒｙ（ｑｉ，ｑＪ）＝Ａｎｔｉ—Ｃａｃｈｉｎｇ　ｔｈｅｎ　ｃａｌｌ　ＡｇｇｒｅＱｕｅｒｙ（ｑｉ，ｑＪ、２）；　５结束语　本文分析了复杂立方体查询不同于简单立方体查询的多　个优势，并针对已有研究的不足，对复杂立方体查询进行了　深入研究，提出基于Ｃａｃｈｅ重用的聚类依赖解决方法。　参考文献　［１］Ｒｏｓｓ　Ｋ　Ａ，Ｓｒｉｖａｓｔａｖａ　Ｄ，Ｃｈａｔｚｉａｎｔｏｎｉｏｕ　Ｄ．Ｃｏｍｐｌｅｘ　Ａｇｇｒｅｇａｔｉｏｎ　ａｔ　Ｍｕｌｔｉｐｌｅ　Ｇｒａｎｕｌａｒｉｔｉｅｓ［Ｃ］／／Ｐｒｏｃｅｓｓｉｎｇｓ　ｏｆ　ｔｈｅ　６ｔｈ　Ｉｎｔ’ｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｅｘｔｅｎｄｉｎｇ　Ｄａｔａｂａｓｅ　Ｔｅｃｈｎｏｌｏｇｙ．Ｖａｌｅｎｃｉａ，Ｓｐａｉｎ：Ｓｐｒｉｎｇｅｒ　Ｖｅｒｌａｇ，１　９９８：２６３—２７７．　【２］Ｃｈａｔｚｉａｎｔｏｎｉｏｕ　Ｄ，Ｒｏｓｓ　Ｋ　Ａ．Ｑｕｅｒｙｉｎｇ　Ｍｕｌｔｉｐｌｅ　Ｆｅａｔｕｒｅｓ　ｏｆ　Ｇｒｏｕｐｓ　ｉｎ　Ｒｅｌａｔｉｏｎａｌ　Ｄａｔａｂａｓｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２２ｎｄ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｖｅｒｙ　Ｌａｒｇｅ　Ｄａｔａ　Ｂａｓｅｓ．ＩＳ．１．］：Ｍｏｒｇａｎ　Ｋａｕｆｍａｎｎ　Ｐｕｂｌｉｓｈｅｒｓ　Ｉｎｃ．，１９９６．　其中，ＡｇｇｒｅＱｕｅｒｙ（ｓｕｂ—ｑｕｅｒｙｌ，Ｓｕｂ—ｑｕｅｒｙ２，Ｃａｃｈｉｎｇ—ｔｙｐｅ）中　的０，ｌ，２分别代表Ｅｎｔｉｒｅ—Ｃａｃｈｉｎｇ，Ｐａｒｔ—Ｃａｃｈｉｎｇ，Ａｎｔｉ—　Ｃａｃｈｉｎｇ。第（２）类优化算法可以通过将文献［７ＩＰＤＩＣ算法中的　相应语句用该ｉｆ语句替换来实现。　【３］曾德胜，覃【４】覃泽，王日凤．一种基于立方体的复杂查询的高效算　法［Ｊ】＿计算机应用研究，２００７，２４（３）：３０—３３．　泽，王日凤，张师超，等．多特征方查询优化策略［Ｊ１．计算　机应用，２００６，２６（７）：ｌ６５５—１６５８．　［５１　Ｚｈａｎｇ　Ｓｈｉｃｈａｏ，Ｗａｎｇ　Ｒｉｆｅｎｇ，Ｇｕｏ　Ｙａｎｐｉｎｇ．Ｅｆｆｉｃｉｅｎｔ　Ｃｏｍｐｕｔａｔｉｏｎ　ｏｆ　Ｍｕｌｔｉ—ｆｅａｔｕｒｅ　Ｄａｔａ　Ｃｕｂｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　ｌ　ｓｔ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｋｎｏｗｌｅｄｇｅ　Ｓｃｉｅｎｃｅ，Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ｍａｎｇｅｍｅｎｔ．　４．４实验结果　实验ＩＩ的主要是测试采用了Ｃａｃｈｉｎｇ技术后算法的效率　情况。在稀疏、稠密和真实数据集下的实验结果如图３所示　（共５　Ｘ　１０。条记录）。在实验结果图中，ＢａｓｉｃＡｌｇ代表基本算　法；ＩｍｐｒｏＡｌｇ代表改进算法。　由实验结果可以看出，在３种数据集下改进算法的效率　Ｇｕｉｌｉｎ，Ｃｈｉｎａ：Ｉｓ　ｎ．］，２００６．　（上接第６６页）　参考文献　【１］ＭｃＧｒｅｇｏｒ　Ｃ，Ｓｃｈｉｅｆｅｒ　Ｊ．Ａ　Ｗｅｂ　Ｓｅｒｖｉｃｅ　Ｂａｓｅｄ　Ｆｒａｍｅｗｏｒｋ　ｆｏｒ　Ａｎａｌｙｚｉｎｇ　ａｎｄ　Ｍｅａｓｕｒｉｎｇ　Ｂｕｓｉｎｅｓｓ　Ｐｅｒｆｏｒｍａｎｃｅ［Ｊ］．Ｉｎｆｏｒｍａｔｉｏｎ　Ｓｙｓｔｅｍｓ　ａｎｄ　Ｅ—ｂｕｓｉｎｅｓｓ　Ｍａｎａｇｅｍｅｎｔ，２００４，２（１）：８９一Ｉ　１０．　［２］Ｆｕ　Ｓ，Ｃｈｉｅｕ　Ｌ　Ｙｉｈ　Ｊ，ｅｔ　ａ１．Ａｎ　Ｉｎｔｅｌｌｉｇｅｎｔ　Ｅｖｅｎｔ　Ａｄａｐｔａｔｉｏｎ　Ｍｅｃｈａｎｉｓｍ　ｆｏｒ　Ｂｕｓｉｎｅｓｓ　Ｐｅｒｆｏｒｍａｎｃｅ　Ｍｏｎｉｔｏｒｉｎｇ［Ｃ］／／Ｐｒｏｃ．ｏｆ　【３］Ｆｅｌｂｅｒ　Ｃｈａｎ　Ｃ，Ｇａｒｏｆａｌａｋｉｓ　Ｍ，ｅｔ　ａ１．Ｓｃａｌａｂｌｅ　Ｆｉｌｔｅｒｉｎｇ　ｏｆ　ＸＭＬ　ＤａｔａｆｏｒＷｅｂ　Ｓｅｒｖｉｃｅｓ［Ｊ］．ＩｎｔｅｒｎｅｔＣｏｍｐｕｔｉｎｇ，２００３，７（１）：４９—５７．　【４］Ｂｅｂａｗｙ　Ｒ，Ｓａｂｒｙ　Ｈ，Ｋａｓｓａｓ　Ｓ，ｅｔ　ａ１．Ｎｅｄｇｔｙ：Ｗｅｂ　Ｓｅｒｖｉｃｅｓ　Ｆｉｒｅｗａｌｌ［Ｃ］／／Ｐｒｏｃ．ｏｆ　ＩＣＷＳ’０５．Ｏｒｌａｎｄｏ，Ｆｌｏｒｉｄａ，ＵＳＡ：【ｓ．ｎ．］，　２ｏ０５．　［５］Ｄｉａｏ　Ｙａｎｌｅｉ，Ｆｉｓｃｈｅｒ只Ｆｒａｎｋｌｉｎ　Ｍ，ｅｔ　ａ１．ＹＦｉｌｔｅｒ：Ｅｆｉｃｉｆｅｎｔ　ａｎｄ　Ｓｃａｌａｂｌｅ　Ｆｉｌｔｅｒｉｎｇ　ｏｆ　ＸＭＬ　Ｄｏｃｕｍｅｎｔｓ［Ｃ］／／Ｐｒｏｃ．ｏｆ　ＩＣＤＥ’０２．Ｓａｎ　Ｊｏｓｅ，ＣＡ，ＵＳＡ：【ｓ．ｎ．］，２００２．　ＩＣＥＢＥ’０５．Ｂｅｒｉｎｇ，Ｃｈｉｎａ：【ｓ．ｎ．］，２００５．　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文