首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > Java Web开发 >

远程抓取的页面内容为乱码,该如何处理

2012-02-08 
远程抓取的页面内容为乱码我在jsp页面中通过远程抓取页面内容,如果源文件没有乱码,抓取的内容也不会出现乱

远程抓取的页面内容为乱码
我在jsp页面中通过远程抓取页面内容,如果源文件没有乱码,抓取的内容也不会出现乱码.如果那个页面的源文件就有乱码的话,我用什么方法能把它转换过来呢.在线等,解决了马上给各位加分...........

[解决办法]
你问的问题太专业了, 只能顶你一下好了
[解决办法]
有个开源的东西你可以试试.httpParser.这个东西就是专门解析html页面的

[解决办法]
你可以换你抽取的页面内容转换成xml格式!其实用nekohtml就可以抽网页并转成xml格式的!
然后你可以用jdom进行解析你所想要的了!

热点排行