首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

java抓取网页下的时间可能出现的状况

2012-12-18 
java抓取网页上的时间可能出现的状况在获得天涯论坛页面的时间时可能会出现类似于2009-12-1612:20:00以及2

java抓取网页上的时间可能出现的状况
在获得天涯论坛页面的时间时可能会出现类似于   2009-12-1612:20:00以及2009-12-1 6 12:20:00的现象
其中1 6中间的出现的只是表现为空格的字符,它的char值目前看到的有  32、12288这两种
在天涯这一块得到时间后应该把时间变为yyyy-MM-ddhh:mm:ss模式,不包括出现char值为32、12288的这种现象
改变时间格式的方案为:
if(reply_date.length()>19){
if(reply_date.indexOf((char)32)!=-1){
reply_date = reply_date.replace((char) 32, ' ');
}
reply_date = reply_date.replace(" ", "");
}

针对多出字符的解决方案为:
if((reply_date.indexOf((char)32)!=-1)||(reply_date.indexOf((char)12288)!=-1)){
reply_date = reply_date.replace((char) 32, ' ');
reply_date = reply_date.replace((char)12288, ' ');
reply_date = reply_date.replace(" ", "");
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,10);
test2 = reply_date.substring(10);
reply_date = test1+" "+test2;
}

时间没有空格的解决方案为:
if(!reply_date.substring(9,10).equals(" ")){
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,9);
test2 = reply_date.substring(9);
reply_date = test1+" "+test2;
}

热点排行