首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > Java Web开发 >

怎么采集名索网数据

2011-12-26 
如何采集名索网数据http://www.mingsuo.com/MainPage/ListPage/SearchList_Company.aspx?keyword%u5929%u

如何采集名索网数据
http://www.mingsuo.com/MainPage/ListPage/SearchList_Company.aspx?keyword=%u5929%u6D25%u5E02%u84DF%u53BF%u9876%u91D1%u670D%u88C5%u5E97
这个查询结果是:
天津市蓟县顶金服装店
注册号: 120225600009964 
法定代表人: 赵秀珍 
企业类型: 个体 开业 
住址类型: 马伸桥镇大街 
经营范围: 服装、鞋;零售。 

我想采集这个网页中的“企业类型: 个体 开业”这个内容,请问如何采集下来?
难点:采集一般是根据网页的源代码,但查看这个页面的源代码,并未发现有“企业类型: 个体 开业”这几个字。

请高手帮忙,谢谢。

[解决办法]
应该是用AJAX取回数据来的

要分析是怎么用AJAX请求的
[解决办法]
自己写正则 爬去网页
还有httpClient 开源的 你可以研究下

热点排行