请问如何提取html源码的内容?
在论坛的html源码里,那些作者,时间,发文内容,是怎么样标识的?也就是说我读去html源码分析时怎么知道他是作者名?怎么提取这些内容呢?
thx!!!
[解决办法]
如何提取html源码的内容
解析文件 ~
[解决办法]
html 页面中,
如何把一个 数据,比如字符串 解析成 名字(或者其他),
那么,
在程序中解析的时候,
也使用类似的逻辑即可 ~~
比如判断 tr / td
根据 td 标签,
第几列是 名字, 第几列是 ID 等等 ~~
[解决办法]
晕,漏打一个关键的 "正 "字,应该是正则表达式
网上有很多正则表达式的资料google一下
当然,如果你用vc或bcb,有现成的控件可用