首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > J2SE开发 >

网页抓取如何除去注释

2013-12-10 
网页抓取怎么除去注释网站抓取来源比较多,有些网站会在部分页面不定期加上不同的注释,导致抓取结果里面包

网页抓取怎么除去注释
网站抓取来源比较多,有些网站会在部分页面不定期加上不同的注释,导致抓取结果里面包含了代码,如果统一将注释去掉?求解决方案 java
[解决办法]

str.replaceAll("<!--.*?-->", "");

[解决办法]
str.replaceAll("<!--.*?-->", "");
试试这个
[解决办法]
楼主想去掉"<!-- -->",可以用楼上两位的代码
[解决办法]
str.replaceAll("<!--.*?-->", "");

热点排行