大量数据去重哈希函数算法,求帮助需求是 在内存中有上亿条数据 里面很多重复的数据 现在决定用bloom filter 映射到哈希表里,但是用什么哈希算法 不知道 求解答这个数据是一个通过md5 16位加密后的串 然后又拼接了一个字符串,字符串长度在30左右,[解决办法]什么哈希算法?你不是说了用MD5了吗,这个是java写的MD5例子http://www.bitscn.com/plus/view.php?aid=21188