vb如何截取网页的html代码
我用vb下载一个一个页面,如何获取我需要的内容啊,就是需要截取功能,提完内容后,如何自动跳转到下一页啊,请教高手,我用webbrowser控件,
[解决办法]
你的问题有点大,获取HTML就直接在DOCUMENTCOMPLETE事件中写webbrowser1.document.body.outhtml
这就是所有的HTML代码,然后你想要什么就自己分析吧。可以通过分析字符串的方式截取你要的内容
也可以根据HTML代码具有的属性来获得你要的内容。
自动跳转就更容易了,你获取完你要的代码,再次webbrowser1.navigate url 就行了。
[解决办法]
'提取各文本分区标签(div)中的源代码
Private Sub Form_Load()WebBrowser1.Navigate "http://www.hao123.com/"End SubPrivate Sub WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant)j = WebBrowser1.Document.getElementsByTagName("div").Length - 1Dim aa As ObjectFor i = 0 To jSet aa = WebBrowser1.Document.getElementsByTagName("div")(i)s = s & aa.innerHTML & vbCrLf & "---------------------------第" & i & "个div中的源代码--------------------------------" & vbCrLfNextStatic k As Integerk = k + 1If s <> "" Thens1 = App.Path & "\" & k & ".txt"Open s1 For Output As #1Print #1, sClose #1Shell "notepad.exe " & s1, vbNormalFocusEnd IfEnd Sub