大家谁知道怎么去除停用词
大家谁知道怎么去除停用词,这方面的知识在网上比较少,大部分都是英文网页,找起来比较费劲,如果谁有相关代码请发上来共享一下..
先谢谢大家了 ....
[解决办法]
停用词???没听过,帮顶
[解决办法]
记得好像c++ primer里就有例子的
把要过滤的stopwords保存在set里,处理完文档后把每个word与set里的元素比较,匹配的就过滤掉啊
[解决办法]
字符匹配解决 最好先把这几个字符存入一个数组中 然后去匹配
[解决办法]
下个停用词表,然后匹配表中的词,除去 http://download.csdn.net/source/270815