数据挖掘
想判断一篇文档是否跟给定的主题相关,
能不能帮忙想想,给个简单的思路?? 数据挖掘
[解决办法]
检查关键字。。
[解决办法]
关建这的定义正则表达式,
[解决办法]
比较简单的方法:首先,你要知道这个这个主题的关键词,然后对目标文档进行分词处理,找到这片文档的关键词(一般的,可以找出现次数最多的相似词),计算关键词语与文档关键词的相似度。关于关键词的距离可以参考此文档。