急~~!!C++怎么判断文档的编码格式
本人新手,刚学习网络编程。
最近晕倒很烦心的事,就是用C读取网页源代码的时候,会碰到UTF8编码的,这样的话就出现了乱码,有些网页做的不是很标准,本身是utf-8编码的,但是他的header发送给客户端的是gb2312的,所以通过 html里面的 char-set的值来判断编码的话,不是完完全全正确。
所以现在想检测网页的真实编码,然后采取转码措施,现在就卡在怎么检测目标文档的编码了。
网上的很多相关的问题都是判断前3个字节,然后再返回编码,但是好像还是有点问题,UTF-8 DOM和UTF-8无DOM 格式好像没能检测出来,希望高手能给点提示,谢谢!
[解决办法]
http://www.cnblogs.com/powertoolsteam/archive/2010/09/20/1831638.html
http://topic.csdn.net/t/20061117/11/5165270.html
[解决办法]
不懂帮顶,接分了~~~散点分给我就行了~