不用WEBBROWSER,如何只获取网页内容?
我要的内容是跟webbrowser.document.documentelement.outerText一样的内容,不包含代码,但因为webbrowser不用控制,而且比较慢,我想用其他方式获取,可以吗?请给代码,谢谢!
[最优解释]
Dim strHtml As String = Inet1.OpenURL("http://www.baidu.com", 0)
引用 Micosoft Internet Transfer Control
'去除html
'--------------------------------------------------------------
Public Function NoHtml(ByVal Str As String) As String
Dim Reg As RegExp
Set Reg = New RegExp
Reg.IgnoreCase = True
Reg.Global = True
Reg.Pattern = "(\<.[^\<]*\>)"
Str = Reg.Replace(Str, " ")
Reg.Pattern = "(\<\/[^\<]*\>)"
Str = Reg.Replace(Str, " ")
NoHtml = Str
Set Reg = Nothing
End Function
[其他解释]
用winsock获取,自己过滤<>.
[其他解释]
可以说很难啊 winsock什么的只是静态的 inet、xmlhttp之流的都只是静态的
[其他解释]
Sub main()
Dim xmlHttp As Object
Set xmlHttp = CreateObject("MSXML2.XMLHTTP")
xmlHttp.open "GET", "http://www.baidu.com", False
xmlHttp.send
If xmlHttp.readyState = 4 And xmlHttp.Status = 200 Then
Debug.Print xmlHttp.responseText
End If
End Sub