首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > J2EE开发 >

java 如何用正则获取html中的值

2012-05-28 
java 怎么用正则获取html中的值String pageContent a href/Patent/01127847 target_blanka hr

java 怎么用正则获取html中的值
String pageContent = "<a href='/Patent/01127847' target='_blank'>
<a href='/Patent/01127821' target='_blank'>
<a href='/Patent/01127832' target='_blank'>";
 省略其他标签

Pattern pattern2 = Pattern.compile("(<a href='/Patent/([\\s\\S]*?)target='_blank'>)");
Matcher matcher = pattern2.matcher(pageContent);
while (matcher.find()) {
  strPage = matcher.group();
}

要怎么样拿到01127847,01127821,01127832



上面哪里出错了  


[解决办法]

Java code
  "<a\\s*href=\"/Patent/(\\d+)\"\\s*.+?>"
[解决办法]
给你参考一下
Java code
    public static void main(String[] args) {        String pageContent = "<a href='/Patent/01127847' target='_blank'><a href='/Patent/01127821' target='_blank'><a href='/Patent/01127832' target='_blank'>";        Pattern pattern2 = Pattern.compile("<a\\s+href=.+?>");        Matcher matcher = pattern2.matcher(pageContent);        while (matcher.find()) {            String strPage = matcher.group();            System.out.println(strPage.replaceAll("(<a.+/|'\\s+.+>)", ""));        }    }
[解决办法]
group(1)
[解决办法]
Pattern pattern2 = Pattern.compile("(?:<a href='/Patent/(.*?)'\\s+target='_blank'>)");

然后group(1)

热点排行