求教如何检测网页编码?
碰到个疑难
例如这个网址http://www.cngrain.com/Publish/market/201205/522699.shtml
网页的meta显示的charset=gb2312,但实际上它用的是UTF-16(居然不是UTF-8),从http header 和代码中,都找不到 utf-16的信息。
求教,类似这样的网页,如何才能准确的检测出它的实际编码?
注:浏览器可以很准确的自动检测。
[解决办法]
var m: TMemoryStream;begin m := TMemoryStream.Create; IdHTTP1.Get('http://www.cngrain.com/Publish/market/201205/522699.shtml',m); m.SaveToFile('d:\test0.txt'); m.Free;end;
[解决办法]
这个只能从文件中提取样本出来分析了