首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > J2SE开发 >

!去除重复出现多次并内部内容长度变化的字符串的办法

2013-01-11 
求助!去除重复出现多次并内部内容长度变化的字符串的办法字符串:table!--abc--tabletrtd正文内

求助!去除重复出现多次并内部内容长度变化的字符串的办法
字符串:
<table>
<!--abc-->
<table>
   <tr>
     <td>正文内容</td>
   </tr>
</table>
<!--abcdef-->
<!--afgafah-->
<table>
   <tr>
     <td>正文内容</td>
   </tr>
   <tr>
     <td>正文内容</td>
   </tr>
   <tr>
     <td>正文内容</td>
   </tr>
</table>
<!--afheyjm-->
<table>
   <tr>
     <td>正文内容</td>
   </tr>
   <tr>
     <td>正文内容</td>
   </tr>
</table>
</table>

需去除的就是<!--长度变化的字符串-->
这是在httpclient和jsoup的使用过程中出现的问题。看看有没有高手能解决一下。类似注释一样的字符串很影响结果。
[解决办法]
如果你使用jsoup来处理信息的话,没道理注释会影响结果啊,你程序逻辑有问题吧?

不过非要处理可以试试看:
html = html.replaceAll("<!--(.*?)-->", "$1");
[解决办法]
$1表示正则捕获到的第一组这里的$1就是注释的内容。
例如<!--abcdef-->就会被替换为abcdef,<!--abc-->就会被替换为abc
楼主是要把整个注释的去掉的话。可以用空

热点排行