网页抓取怎么除去注释网站抓取来源比较多,有些网站会在部分页面不定期加上不同的注释,导致抓取结果里面包含了代码,如果统一将注释去掉?求解决方案 java [解决办法]
str.replaceAll("<!--.*?-->", "");