首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > ASP >

怎么过滤掉采集到源文件中的非文字标签

2012-02-21 
如何过滤掉采集到源文件中的非文字标签?在一个表单中输入一个网址,得到了该网址的源文件,我只过滤掉了其中

如何过滤掉采集到源文件中的非文字标签?
在一个表单中输入一个网址,得到了该网址的源文件,我只过滤掉了其中的HTML标记,但里面的样式表(eg:body{margin:4px   0   4px   0;}img{border:0}td,p{font-size:12px}   等不知如何过滤掉)请各位大侠指点.

[解决办法]
你可以先把采集来的页面里想要得到的东西先取出来也就是先,先把BODY之间的东西取出来,这样就不会把样式的取到了,然后再慢慢过滤

热点排行