首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > .NET > C# >

求读取多个嵌套标签的网页html正则表达式,该如何解决

2012-03-13 
求读取多个嵌套标签的网页html正则表达式html如下:tablewidth100%border0cellspacing0cellpadding0st

求读取多个嵌套标签的网页html正则表达式
html如下:

<table   width=100%   border=0   cellspacing=0   cellpadding=0   style= "line-height:15pt; "> <tr> <td> <span   style=font-size:12px;> [求助]新名称!!谢谢!拜托了 <br>
编辑 <br>
名称! <br>
拜托各位了! <br>
<img   src= "../images/UBBicon/em03.GIF "   width=20   height=20   align=absmiddle   border=0> <img   src= "../images/UBBicon/em03.GIF "   width=20   height=20   align=absmiddle   border=0> </span> </td> </tr> </table>


我想从中提取到:

[求助]新名称!!谢谢!拜托了 <br>
编辑 <br>
名称! <br>
拜托各位了! <br>
<img   src= "../images/UBBicon/em03.GIF "   width=20   height=20   align=absmiddle   border=0> <img   src= "../images/UBBicon/em03.GIF "   width=20   height=20   align=absmiddle   border=0>


请问正则表达式应该怎么写?

我是这样写的:Regex   reg   =   new   Regex(@ " <table[^> ]*?> <tr[^> ]*?> <td[^> ]*?> <span[^> ]*?> (? <desc> [^ <]*?) </span> </td> </tr> </table> ");

但不行!

[解决办法]
你到底想要什么样的结果,如果像你例子所说,我修改的那个就可以了,所以只是解释一下你的匹配不成功的原因

<table[^> ]*?> <tr[^> ]*?> <td[^> ]*?> <span[^> ]*?> (? <desc> [\s\S]*?) </span> </td> </tr> </table>

热点排行