首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

java Bit地图 数据结构

2012-12-24 
java Bitmap数据结构Bitmap算法,问题:对40亿个数据进行排序,数据类型为 int,无相同数据。思考:关于40亿个数

java Bitmap 数据结构

Bitmap算法,
问题:对40亿个数据进行排序,数据类型为 int,无相同数据。

思考:关于40亿个数据的排序,首先想如何存储呢?一个int 4个字节,也就是160亿个字节,也就是大概有16GB的数据,现在所有的计算机估计

没有这么大的内存吧,所以我们就可以文件归并排序,也可以分段读入数据在进行Qsort,但是都需要不停地读入文件,可以想象不停地读取文件硬件操作会有多么浪费时间。

?

我们这样都是用4个字节来存储了一个数据,在计算机里都是用二进制进行表示,

例如 5 :0000 0000 0000 0000 0000 0000 0000 0101

现在引入Bitmap,所谓Bitmap就是用一个bit来表示一个数据。平时32位存储一个数据,我们可以换一种想法,用一个字节32位来存储0-31这32个数据,例如我们对2,1,5,12这四个数据进行由小到大的排序,首先把32位初始化为0,我们可以把这4个数据存储为0000 0000 0000 0000 0001 0000 0010 0110

?

我们就把32位中的分别把 2? 1? 5? 12位置为1,然后从第0位开始遍历,看相应位是否为1,为1就进行输出,就完成了数据从小到大的排序。

?

再返回原题应用Bitmap就可以把16GB的存储空间缩小为16GB/32 = 512M,就可以大大减少读取文件的工作。直接读一次文件存入内存,然后遍历输出就完成了排序。

?

优点:既大量节省了空间,又把时间复杂度降低到O(n)。

不足:如果数据过于稀疏就会有大量无用遍历,浪费时间。

?


java Bit地图  数据结构
?

?

对于几亿int数据如要查找出相等的数据,利用Bitmap算法,只是使byte达到了极限,也是一种解决问题的一种方法。下一篇描述讲一下源代码的

描写。


14 楼 MyEyeOfJava 2012-08-01   nagat1111 写道16G内存到处都是。。。
最看不起你这种的。。。 15 楼 luozhong915127 2012-08-02   MyEyeOfJava 写道nagat1111 写道16G内存到处都是。。。
最看不起你这种的。。。
每个人都是从看不起,到看得起的。你认为本来或者一直被别人看得起的人。 16 楼 paladin1988 2012-08-14   首先把32位初始化为0,
我们可以把这4个数据存储为0000 0000 0000 0000 0001 0000 0010 0110

这个是怎么存储出来的,没看明白。。 17 楼 逸情公子 2012-08-14   引用首先把32位初始化为0,
我们可以把这4个数据存储为0000 0000 0000 0000 0001 0000 0010 0110

这个是怎么存储出来的,没看明白。。
位运算 18 楼 luozhong915127 2012-09-15   逸情公子 写道引用首先把32位初始化为0,
我们可以把这4个数据存储为0000 0000 0000 0000 0001 0000 0010 0110

这个是怎么存储出来的,没看明白。。
位运算


首先,明白存储是按字节存储的。接着就明白,一个整数要四个字节,而现在用Bitmap一个整数就对应一个整数。例如,这么一串数据byte[a[i]]={0,0,0,0,1,0,1,0}  就代表在整数为:1,3 ;因为a[1]=1,a[3]=1;就这样存储的。

热点排行