首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 互联网 >

爬虫被封缘故

2012-08-27 
爬虫被封原因各大网站爬虫Googlebot, // Google 爬虫Baiduspider, // 百度爬虫Yahoo! Slurp, // 雅

爬虫被封原因
各大网站爬虫

'Googlebot', // Google 爬虫
'Baiduspider', // 百度爬虫
'Yahoo! Slurp', // 雅虎爬虫
'YodaoBot', // 有道爬虫
'msnbot' // Bing爬虫
// 更多爬虫关键字

有一些网站会判断你的user-agent如果是属于爬虫就会返回禁止爬虫这类的页面,或者直接屏蔽~


cookie问题,有一些网站只认某一个页面的cookie其他的都不可以

热点排行