首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

组合Nokogiri 来对网页转码

2012-09-10 
结合Nokogiri 来对网页转码要把一些网页的内容存到数据库里面数据库的编码格式是UTF8,而很多页面都是什么g

结合Nokogiri 来对网页转码
要把一些网页的内容存到数据库里面
数据库的编码格式是UTF8,而很多页面都是什么gb2312,如是读入必定会出现乱码的情况

Nokogiri可以直接取到页面的编码格式
假设response是获取的网页内容

charset = Nokogiri::HTML(response).meta_encoding


转码的方法可以如下

Nokogiri来转码(他会转成当前代码的编码格式,这个有待于确定)
Nokogiri::HTML(response,nil,charset)


Ruby自带的方法来转码转成utf8
Iconv.iconv(charset.upcase,"UTF-8",response)

热点排行