如何使用正则表达式取出HTML标签里数据
源代码:
<table><thead><tr><th class="deal_time">处理时间</th><th class="deal_location">处理地点</th><th class="deal_state">邮件状态</th></tr></thead><tr><td align="right">2012-05-13 16:19:00</td><td class="middle_border">丽水市莲都区速递物流分公司莲都揽投部</td><td >收寄</td></tr><tr><td align="right" class="backcolor">2012-05-13 18:05:20</td><td class="backcolor middle_border" align="center">丽水市</td><td align="center" class="backcolor">离开处理中心,发往温州市</td></tr><tr><td align="right">2012-05-14 15:29:49</td><td class="middle_border">温州市</td><td >到达处理中心,来自丽水市</td></tr><tr><td align="right" class="backcolor">2012-05-14 18:15:35</td><td class="backcolor middle_border" align="center">温州市</td><td align="center" class="backcolor">离开处理中心,发往上海市</td></tr><tr><td align="right">2012-05-15 19:41:36</td><td class="middle_border">上海市</td><td >到达处理中心,来自温州市</td></tr><tr><td align="right" class="backcolor">2012-05-15 19:58:50</td><td class="backcolor middle_border" align="center">上海市</td><td align="center" class="backcolor">离开处理中心,发往布鲁塞尔</td></tr><tr><td align="right">2012-05-18 15:56:00</td><td class="middle_border">比利时 布鲁塞尔</td><td >到达处理中心,来自中国 上海</td></tr><tr><td align="right" class="backcolor">2012-05-18 15:56:00</td><td class="backcolor middle_border" align="center">比利时 布鲁塞尔</td><td align="center" class="backcolor">送交海关</td></tr><tr><td align="right">2012-05-21 11:20:00</td><td class="middle_border">比利时 布鲁塞尔</td><td >送交海关</td></tr></table>
取出标签<td>里包含的内容
谢谢
[解决办法]
(?i)(?<=<td[^>]*?>)[^<>]+?(?=</td>)
[解决办法]
System.IO.StreamReader reader = new System.IO.StreamReader("e:\\1.txt",System.Text.Encoding.Default); string str = reader.ReadToEnd(); Regex reg = new Regex(@"(?is)(?<=<td[^>]*?>).*?(?=</td>)"); MatchCollection mc = reg.Matches(str); foreach (Match m in mc) { MessageBox.Show(m.Value); }