Android 解析RSS时遇到中文无法解析的问题
当Android在解析XML时遇到GBK或者gb2312编码时会无法解析或者出现乱码,故需要在解析时判断一下RSS的编码方式,
并使用InputStreamReader(rssUrl.openStream(),encodingName)指明编码方式,就可以解析了。
?
//防止遇到某些编码(如GBK)时出现错误//得到探测器代理对象 CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance(); //向代理对象添加探测器 detector.add(JChardetFacade.getInstance()); //得到编码字符集对象 Charset charset = detector.detectCodepage(rssUrl); //得到编码名称 String encodingName = charset.name(); Log.e("RssReader_Encoding", encodingName);//指定编码生成字符流if(encodingName.equals("GBK") || encodingName.equals("gb2312")){is = new InputSource(new InputStreamReader(rssUrl.openStream(),encodingName)); }else{ is = new InputSource(rssUrl.openStream()); }xmlreader.parse(is);?采用一个现成的开源项目:cpdetector可以判断编码方式,它所在的网址是:http://cpdetector.sourceforge.net/。它的类库很小(见附件),只有500K左右。具体方法可参照下方链接。
链接:判定文件编码或文本流编码的方法