首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

关于大区间过滤优化内存储器设计

2012-11-23 
关于大区间过滤优化内存设计??整个内存使用率取决于该值的重复率,重复越多则内存越节省,从我们接入绝大多

关于大区间过滤优化内存设计

?


?整个内存使用率取决于该值的重复率,重复越多则内存越节省,从我们接入绝大多数业务的类型需要进行大区间过滤的使用场景看都是最近几年的时间类型,类似于20101202,所以这样的数据重复率还是很高的。


?这样做的好处是将原来如果域为Long型的数组转变成了Int数组,节省了一倍的内存开销。

?


?每次查询例如 l_t:[ 20101202 TO 20111202],查询这个区间内的DocId分布在那几个数组内,然后将DocId减去归属第N个数组的起始偏移量做为数组下标,域值的遍历Postion做为值填充数组。


?将获取到的pn 跟之前的minPostion和maxPostion比较,发现只有p2<p3<p5, 那么满足条件的doc 有doc3,doc4,doc5,doc7,doc8 doc9,其他的将其过滤。

?

?

热点排行