首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > C语言 >

用C和正则表达式来提取网页中的URL解决方案

2012-04-19 
用C和正则表达式来提取网页中的URL我已经把一个网页下载保存到了文件中,但是要从中提取所有的URL,听说可以

用C和正则表达式来提取网页中的URL
我已经把一个网页下载保存到了文件中,但是要从中提取所有的URL,听说可以用正则表达式来实现,

但是没有用过。求提示!!

PS:在linux下的C

[解决办法]
pcre正则。然后稍微了解下正则的简单使用。试试吧
[解决办法]
推荐使用regtest软件测试正则表达式
[解决办法]

探讨
上面是一个网上的例子,经过修改不行。。。。。。。。。。。

我的目的是,主要是从一个html文件中把所有存在的url读取出来

[解决办法]
感觉用不着正则 自己写捕捉函数 用链表存储也是很好的方法~
[解决办法]
探讨

引用:
上面是一个网上的例子,经过修改不行。。。。。。。。。。。

我的目的是,主要是从一个html文件中把所有存在的url读取出来

网址的形式乱七八糟,很难完全匹配完。
所以你得分析一下你那个html里面的url的规律,然后针对性的写正则去匹配读取。

热点排行