如何实现:提供一个网址(如5566.net),然后提取该网页下所有自己想要的URL.详情请进……
请问各位怎实现:点击按键启动新线程,再点击一下则关闭上一线程(即使任务还未完成),紧接着又一启动新线程
如何实现:提供一个网址(如5566.net),然后提取该网页下所有自己想要的URL.详情请进……
现在假设我个网址为
http://mp3.baidu.com/m?f=ms&rn=10&tn=baidump3lyric&ct=150994944&word= "hilary "&lm=-1
以下是这个网址对应的网页的源文件中的一个片段:
……
</div> <div class= "BlueBG "> <strong> 歌曲: </strong> <B> the getaway </B> </div>
<div style= "padding-top:10px;padding-left:15px ">
<strong> 歌手: </strong> <A href= "http://mp3.baidu.com/m?tn=baidump3&ct=134217728&lm=-1&word=hilary+duff "> <font style=color:#e10900> hilary </font> duff </a>
<strong> 专辑: </strong> <a href= "http://mp3.baidu.com/m?tn=baidump3&ct=134217728&lm=-1&word=hilary+duff "> <font style=color:#e10900> hilary </font> duff </a>
</div>
<br>
<div class= "unnamed3 " style= "float:right;width:240px;padding:5px;margin-right:10px;line-height:30px ">
<span style= "font-size:12px; "> <img src= "http://list.mp3.baidu.com/list/img/lrcdw.gif " style= "padding-right:10px " align= "absmiddle "> <a href= "http://220.181.38.82/tl?filename=/lrc/528/the getaway-hilary duff.lrc " > LRC歌词 </a> <sup> HOT </sup> </span> <br>
……
我想编写一个vb.net程序提取片段中http://220.181.38.82/tl?filename=/lrc/528/the getaway-hilary duff.lrc那一部分
在我想要的这个程序中仅有
一个文本框,一个按钮,一个列表框
动作:文本框中输入网址,然后点击按钮,列表框中将会列出在那个网页下找到的含“.lrc "后缀的URL
请问各位高人如何实现(希望能够理解我的意思)
谢谢!
[解决办法]
自己去看看蜘蛛程序.
正则表达式也要熟悉
[解决办法]
正则
[解决办法]
Dim m As Match
m = Regex.Match(RichTextBox2.Text, "[\s\S]*(? <= <span\s+style= " "font-size:12px; " "> " & _
" <img\s+src= " "http://list.mp3.baidu.com/list/img/lrcdw.gif " "\s+style= " "padding-right:10px " "\s+ " & _
"align= " "absmiddle " "> <a\s+href= " ")(? <url> [^ " "]*) ", RegexOptions.IgnoreCase)
If m.Success Then
MessageBox.Show(m.Groups( "url ").Value)
End If
[解决办法]
'命名空间
Imports System.Text.RegularExpressions
[解决办法]
你必须先得到网页的源码,再用正则取里面的地址!