htmlParser中NotFilter方法到底如何用

2011-12-28

htmlParser中NotFilter方法到底怎么用我想提取table里面的文本内容，但不想要table里面的a标签里面的文本内

htmlParser中NotFilter方法到底怎么用
我想提取table里面的文本内容，但不想要table里面的a标签里面的文本内容
AndFilter it=new AndFilter(new TagNameFilter( "table "),
new NotFilter (new HasChildFilter(new TagNameFilter( "a "))));
NodeList nL = parser.extractAllNodesThatMatch(it);
这样可以编译通过，不过还是有a标签的内容
OrFilter it=new OrFilter(new TagNameFilter( "table "),
new NotFilter (new HasChildFilter(new TagNameFilter( "a "))));
NodeList nL = parser.extractAllNodesThatMatch(it);
这样编译都不能通过
请各位指点一下该怎么提取

[解决办法]
a 的连接结点对应的类好你是 LinkXX 的，具体我忘了，它可以直接取到文字而丢掉 <a ...> 里面的东东
[解决办法]
HTTPParser 解析HTML中的Table的行列手工设定需要解析的table
http://blog.csdn.net/eqxu/archive/2007/06/06/1640699.aspx
用html parser 来获取HTML网页中Form的各个属性名值组
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx