首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > .NET > C# >

网站数据抓取(C#),该如何解决

2013-07-11 
网站数据抓取(C#)http://ent.qq.com/star/shouye2012/gangtai.htm我只要要从这个网站上面获取这四块的所有

网站数据抓取(C#)
http://ent.qq.com/star/shouye2012/gangtai.htm
我只要要从这个网站上面获取这四块的所有内容,请大家帮忙正则表达式怎么写呀???我只要正则表达式,网站数据抓取(C#),该如何解决网站数据抓取(C#),该如何解决网站数据抓取(C#),该如何解决网站数据抓取(C#),该如何解决,求帮助呀,用正则表达式怎么写呀???
[解决办法]
更正一下

<div[^>]*>[\s\S]*?src="(?<pic>[^"]*)"\s*alt="网站数据抓取(C#),该如何解决"]*)">[\s\S]*?<span\s*class="date">(?<date>[^<]*)</span>[\s\S]*?<div[^>]*>(?<all>[^<]*)<


加个去贪婪,免得多匹配
[解决办法]

引用:
这是一个正则表达式吗?不是应该有四条正则表达式吗?我要分别筛选到这四条内容然后保存到数据库四个字段中


难道一次取4个不好吗
[解决办法]



            string tempStr="";//源文本
 
            string pattern = @"(?i)<div[^>]*>[\s\S]*?src="(?<pic>[^"]*)"\s*alt="网站数据抓取(C#),该如何解决"]*)">[\s\S]*?<span\s*class="date">(?<date>[^<]*)</span>[\s\S]*?<div[^>]*>(?<all>[^<]*)<";          
 
            Match m = Regex.Match(tempStr,pattern);
            string value1 = m.Groups["pic"].Value;
            string value2 = m.Groups["title"].Value;
            string value3 = m.Groups["date"].Value;


            string value4 = m.Groups["all"].Value;


[解决办法]
string pattern = @"(?i)<div[^>]*>[\s\S]*?src=""(?<pic>[^""]*)""\s*alt="网站数据抓取(C#),该如何解决"(?<title>[^""]*)"">[\s\S]*?<span\s*class=""date"">(?<date>[^<]*)</span>[\s\S]*?<div[^>]*>(?<all>[^<]*?)<";          

热点排行