巨难 的问题 ,关于 下载 指定网页 是不是最新的网页
有一个网页 Title 不变 但内容会不定期的变 。
想写一个程序 时不时地去判断一下。内容是不是和上一次的一样。
如果一样,就不下载,否则就下载。
有没有不用整个页面下载下来在去判断的其他做法?
How to do?
[解决办法]
BT
[解决办法]
DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
板凳学习~~~~~~~~~~~~~~~~~~~~~
[解决办法]
你说的跟搜索引擎技术类似,至少你也需要把页面中的文字内容存入数据库吧,下次再取时,跟数据库中的数据对比,如果不一样就替换。
[解决办法]
如果网页中只改了一个字符,不用整个页面下载下来在去判断,几乎是不可能的
但有一方法应该可以,就是判网页的修改时间,与上一次比较,如:
String x=IdHTTP1-> Get( "http://www.csdn.net ");
ShowMessage(IdHTTP1-> Response-> LastModified);
[解决办法]
把页面下载下来,然后和最后一次下载的比较一下MD5吧
[解决办法]
学习.
[解决办法]
用TNMHTTP的Head方法获取HTTP头标判断最后修改时间是不是最新的。
[解决办法]
获取HTTP头标判断最后修改时间是不是最新的
------------
这个可行,不过前提是 Web服务器必须提供此时间,要分情况:
对于静态文件(htm,html,图片等),服务器一般会返回LastModified,
此时间一般就是文件本身的LastModified,甚至会直接返回 HTTP/1.1 304 Not Modified
表示文件内容没有改变。
但是动态的 asp, jsp, php等页面,文件本身的LastModified一般不变,
但每次输出的内容可能会改变,所以服务器基本不会返回LastModified,这个没有别的办法,
只能老老实实的下下来。