MOSS爬网问题
我用2007,要爬网第三方web系统,比如公司的OA,没有form登录验证的可以爬到,但是OA和CRM都需要form认证,我在爬网规则里配了,但是仍旧不能爬到,还需要什么其他设置吗?
还有,用了一个叫GrabberX得东西,配好以后还是不行,form认证的系统不能爬到
另外一个问题,爬网有验证码登录的系统
这些大家有没有什么解决方案啊,先谢过了
[解决办法]
爬网
指定源
要求太多的不行,自己写爬网程序吧
[解决办法]
有验证码的肯定是没戏了
表单认证的在爬网规则设置完之后如果还爬不到的话,看一下爬网日志吧
btw,你居然还能找到GrabberX……是2007的搜索解决方案里的吧?
早期的版本是我写的……汗
这个当时就是为了解决2007爬表单认证网站用的,后来出了2007 sp1支持表单认证网站之后这个就没用了
当时我做的那个版本是把所有爬到的东西作为文本文件放到一个文件夹里,然后用SharePoint再去爬这个文件夹……不知道后来他们改成什么样子了
[解决办法]