首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > .NET > C# >

施用C#与正则表达式分析hao123.com的网址列表

2012-06-24 
使用C#与正则表达式分析hao123.com的网址列表最近需要一些对网址的分类,来检测本地用户上网的习惯,这样我

使用C#与正则表达式分析hao123.com的网址列表

最近需要一些对网址的分类,来检测本地用户上网的习惯,这样我们就需要一些域名的分类,首先我们就想到了www.hao123.com

通过这个分析,大家可以了解到C#获取网页源代码、调用正则表达式的一些简单方法

以及一些使用中的技巧。


1、获取网页源代码

为了方便,我们在这里直接写成函数的形式,如下:

最后网址的分类就保存在了c盘下的txt文件中。

这里要注意的是,因为我使用了追加的模式,所以在第二次运行程序的时候会继续向文件中添加,有兴趣的可以让程序自动删除原来的文件。


上个代码:http://download.csdn.net/detail/icyfox_bupt/4389810


做爬虫做的比较多了,发现其实爬东西会用方法是一回事,会一些技巧也很重要,比如有的时候在分析的时候添加一些预处理会在正则的时候方便很多,这就需要大家慢慢去摸索了。

热点排行