首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > J2EE开发 >

将抓取后的网页转码解决方案

2012-12-17 
将抓取后的网页转码用spider抓取网页后,存入数据库,但抓取的网页是乱码,怎么解决????[最优解释]得到的数据

将抓取后的网页转码
用spider抓取网页后,存入数据库,但抓取的网页是乱码,怎么解决????


[最优解释]
得到的数据用
URLEncoder.encode(str,"UTF-8") 试试呗
[其他解释]
试一下在存入数据库前转码
[其他解释]

引用:
得到的数据用
URLEncoder.encode(str,"UTF-8") 试试呗



你说的方法都试过,乱码是没了,但是整个页面都变成下面这样了。

%3C%21DOCTYPE+html+PUBLIC+%22-%2F%2FW3C%2F%2FDTD+XHTML+1.0+Transitional%2F%2FEN%22+%22http%3A%2F%2Fwww.w3.org%2FTR%2Fxhtml1%2FDTD%2Fxhtml1-transitional.dtd%22%3E%0A%3C%21--%5B704%2C2%2C184889%5D+published+at+2012-10-19+11%3A29%3A43+from+%23182+by+7118--%3E%0A%0A%3C%21--+LLTJ_MT%3Aname+%3D%22%3F%3F%3F%A7%DB%3F%3F%3F%3F%3F%3F%A6%B1%3F%22+--%3E%0D%0A%3C%21--+LLTJ_ZT%3Aurl%3D%22http%3A%2F%2Ftravel.sina.com.cn%2Fz%2FChinaNationalTravel%2Findex.shtml%22%3B+name%3D%22%3F%3F%3F%A7%DB%3F%3F%3F%3F%3F%3F%A6%B1%3F%2CChina+National+Travel%22%3Btype%3D%22ZW%22%3B+--%3E%0D%0A%0A%3Chtml+xmlns%3D%22http%3A%2F%2Fwww.w3.org%2F1999%2Fxhtml%22%3E%0D%0A%3Chead%3E%0D%0A%3Cmeta+http-equ.........


[其他解释]
引用:
引用:得到的数据用
URLEncoder.encode(str,"UTF-8") 试试呗


你说的方法都试过,乱码是没了,但是整个页面都变成下面这样了。
Java code?12%3C%21DOCTYPE+html+PUBLIC+%22-%2F%2FW3C%2F%2FDTD+XHTML+1.0+Transitional%2F%……


括号之类的都没转换过来。。
[其他解释]
....转成GBK呢?  然后看看数据库的编码
[其他解释]
引用:
....转成GBK呢?  然后看看数据库的编码


都试过,数据库存的是2进制编码,初步怀疑是因为接口调用的时候编码不是utf-8所导致的。

热点排行