首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > Java Web开发 >

htmlParser中NotFilter方法到底如何用

2011-12-28 
htmlParser中NotFilter方法到底怎么用我想提取table里面的文本内容,但不想要table里面的a标签里面的文本内

htmlParser中NotFilter方法到底怎么用
我想提取table里面的文本内容,但不想要table里面的a标签里面的文本内容
AndFilter   it=new   AndFilter(new   TagNameFilter( "table "),
                    new   NotFilter   (new   HasChildFilter(new   TagNameFilter( "a "))));
NodeList   nL   =   parser.extractAllNodesThatMatch(it);
这样可以编译通过,不过还是有a标签的内容
OrFilter   it=new   OrFilter(new   TagNameFilter( "table "),
                    new   NotFilter   (new   HasChildFilter(new   TagNameFilter( "a "))));
NodeList   nL   =   parser.extractAllNodesThatMatch(it);
这样编译都不能通过
请各位指点一下该怎么提取

[解决办法]
a 的连接结点对应的类好你是 LinkXX 的,具体我忘了,它可以直接取到文字而丢掉 <a ...> 里面的东东
[解决办法]
HTTPParser 解析HTML中的Table的行列 手工设定需要解析的table
http://blog.csdn.net/eqxu/archive/2007/06/06/1640699.aspx
用html parser 来获取HTML网页中Form的各个属性名 值组
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx

热点排行