千万数据比较请帮忙支招
? ? ? 大家好!我现在有个需求,是读取excel中的记录,大概会有一百个excel文件,将其中感兴趣的列解析取出,一共拼接起来会有500W行记录或者更多,数据库中也有这样的记录。我需要将excel中读取的和数据库中的比较id和number俩列是否一样,不一样的则认为错误。现在数据库已经很慢了,我的做法是将excel读取的组成一个文件,然后将id和number放到map中,数据库的查询后也将id和number放到文件中装入map,比较俩个map,不一致的记录下来。但是现在问题是文件太大的话jvm肯定受不了,大家有没有好的办法比较?thanks
1 楼 beifengbei08 2011-07-12 放到俩个map中千万条数据比较加载到内存能吃消吗? 2 楼 jychenok 2011-07-12 布隆过滤器 3 楼 hzw2312 2011-07-13 用多线程分批处理、不过这样时间比较久、! 4 楼 zxl19831220 2011-07-13 将EXCEL数据导入到数据库中新建得表中